Data preparen en organiseren

Een waardevolle analyse vraagt een intensieve datavoorbereiding

virtual-sciences-conclusion-data-prepareren-en-organisatie

Alles begint met een goede voorbereiding. Daarna kunnen er pas analyses en algoritmes los worden gelaten op de gestructureerde en ongestructureerde data. Deze voorbereiding bestaat uit het collecteren, transformeren en opslaan van data. Een zeer intensief proces. 

Data in kaart brengen en ontsluiten

De voorbereiding begint bij alignment met de business. Wat is het uiteindelijke doel? Welke data(bronnen) hebben we daarvoor nodig? En hoe gaan we deze data collecteren? Zijn alle relevante bronnen in kaart gebracht? Dan wordt de data ontsloten. In de praktijk betekent dit meestal dat data uit alle bronnen wordt samengebracht. En vervolgens toegankelijk gemaakt voor analisten en/of ontwikkelaars. Denk aan batch processen die op gezette tijden databases uitvragen maar ook real-time koppelingen (streaming data).

Transformeren van brondata

In veel gevallen voldoet de brondata niet aan het toepassingsmodel. In dat geval transformeren we deze naar gedefinieerde standaarden. Afhankelijk van de omvang, kwaliteit en diversiteit kan dit een zeer intensief en complex proces opleveren. De data die resulteert uit deze stap kan vervolgens gebruikt worden voor diepgaande analyse (data mining).

Onze thema's

API ManagementEvent Streaming Hybrid Integration Platform as a ServiceMicroservices en agile integratie Containerisatie & Orkestratie Continuous Integration & Continuous Development Integratie ontwikkeling MonitoringData ScienceMachine Learning/AI