Data in kaart brengen en ontsluiten
De voorbereiding begint bij alignment met de business. Wat is het uiteindelijke doel? Welke data(bronnen) hebben we daarvoor nodig? En hoe gaan we deze data collecteren? Zijn alle relevante bronnen in kaart gebracht? Dan wordt de data ontsloten. In de praktijk betekent dit meestal dat data uit alle bronnen wordt samengebracht. En vervolgens toegankelijk gemaakt voor analisten en/of ontwikkelaars. Denk aan batch processen die op gezette tijden databases uitvragen maar ook real-time koppelingen (streaming data).
Transformeren van brondata
In veel gevallen voldoet de brondata niet aan het toepassingsmodel. In dat geval transformeren we deze naar gedefinieerde standaarden. Afhankelijk van de omvang, kwaliteit en diversiteit kan dit een zeer intensief en complex proces opleveren. De data die resulteert uit deze stap kan vervolgens gebruikt worden voor diepgaande analyse (data mining).