Waarde halen uit data? Omzeil deze valkuilen

Door: Robbrecht van Amerongen, Head of Strategy bij AMIS Conclusion 

Beslissingen nemen op basis van feiten in plaats van onderbuikgevoelens. Dat is waar veel organisaties naar streven. Onderzoek van BI-Survey geeft aan dat meer dan 60% van de beslissers nog steeds het merendeel hun beslissingen nemen op basis van onderbuikgevoel. Terwijl ook blijkt dat bedrijven die hun beslissingen nemen op basis van data veel beter presteren. De reden voor het onderpresteren van die eerste categorie bedrijven: niet tijdig over de juiste informatie beschikken; de informatie wel hebben, maar niet kunnen vinden; discussie over de interpretatie; en gebrek aan kennis.  

Succes loopt vaak vast in het onvermogen om de juiste, bruikbare en tijdige informatie beschikbaar te maken. Kleinere en minder data-intensieve organisaties komen daarmee weg, maar, maar grote organisaties die vaak complexe beslissingen moeten nemen, lopen vast.  

16 oktober 2024   |   Blog   |   Door: Robbrecht van Amerongen, Head of Strategy bij AMIS Conclusion

Deel

Ontsluiten van bronnen

Het betrouwbaar en langdurig integreren en ontsluiten van bronnen is voor veel organisaties een uitdaging. In veel organisaties gaat het over tientallen interne systemen en externe bronnen die allemaal een ander niveau van kwaliteit en actualiteit hebben. Natuurlijk wordt een kwalitatief oordeel geveld over de te integreren bronsystemen, maar je moet ook continu monitoren de bron nog steeds de juiste gegevens ophoest. Bij veel organisaties kan je er de donder op zeggen dat er iedere week wel wat verandert in dit landschap. Dus continue aandacht voor integratie en monitoring is essentieel voor succes.  

Datakwaliteit heeft veel gezichten

Als je meerdere bronnen integreert, is de eerst stap het vastleggen welke term welke betekenis heeft (master data management). Want het komt heel vaak voor dat een bepaalde term in het ene systeem een andere betekenis heeft dan in het andere. Is bijvoorbeeld prijs in- of exclusief BTW? Wordt een klant gezien als persoon in het CRM-systeem, iemand die een bestelling heeft geplaatst of iemand die heeft betaald?  

De volgende vraag is: welk systeem en welke record bevat de juiste informatie? Want hoe vaak komt het niet voor dat een klant drie keer in het CRM-systeem staat, met drie verschillende records. En dan blijkt ook nog eens dat het record in het ERP-systeem een ander adres bevat, want factuuradres en afleveradres komen niet overeen. Ook kan het voorkomen dat bronnen opeens een ander soort data opleveren. Denk bijvoorbeeld aan een systeem dat de omzet teruggeeft en opeens dat in de lokale valuta doet.  

Interpretatie van data

Als het je al lukt om centraal de juiste data, van de juiste kwaliteit en met de juiste tijdigheid te ontsluiten, dan is de volgende stap om waarde te halen uit die data. Een veelgemaakte fout daarbij is dat data scientists enthousiast aan de slag gaan met het ontwikkelen van modellen, maar dat ze de domeinexpertise missen om de data goed te interpreteren. Er worden bijvoorbeeld regelmatig fouten gemaakt met oorzaak en gevolg. Een algoritme is namelijk heel goed in het vinden van verbanden, maar niet in het aanwijzen van de root cause. Voor je het weet trek je de conclusie: het wordt mooi weer, want we verkopen meer ijs.  

Ook sluipt er maar al te gemakkelijk bias in de modellen (onbewuste vooringenomenheid). Het toeslagenschandaal is misschien wel het bekendste voorbeeld. In datzelfde licht kun je ook de waarschuwing onlangs van Aleid Wolfsen zien, de voorzitter van de Autoriteit Persoonsgegevens (AP). De AP trof bij een onderzoek bij verschillende overheidsorganisaties vele discriminerende algoritmes aan. Vaak komt dit door een onevenwichtige dataset, een niet neutrale wijze van trainen of door onbewuste vooroordelen bij het ontwikkelen van de logica.  

Inrichting governance

Tevens onderschatten bedrijven vaak wat er komt kijken bij de inrichting van de governance. Je zult immers de performance van je modellen continu moeten monitoren, want de omstandigheden veranderen en dus zullen de modellen mee moeten veranderen. Gelukkig blijkt uit onderzoek van Conclusion dat steeds meer organisaties het data-eigenaarschap goed hebben belegd. Maar dat alleen is niet voldoende om ervoor te zorgen dat de datakwaliteit en de kwaliteit van de modellen op het gewenste niveau blijven.  

Inrichting van goed beheer en 24/7 support

Tot slot zul je, wanneer je gebruik gaat maken van geautomatiseerde besluitvorming, ervoor moeten zorgen dat je 24x7 support organiseert op de systemen. Toen datagedreven werken nog iets was voor mensen die op kantoor werkten en rapportages maakten, was het niet erg dat een systeem er in het weekend even een paar uur uit lag vanwege een update. Maar als je bij de acceptatie van online af te sluiten verzekeringen op een geautomatiseerde manier de fraudetoets uitvoert, kun je natuurlijk niet in het weekend klanten met een veel te hoog risico accepteren. Denk voorafgaand aan je dataproject al na over hoe je beheer en support van het dataplatform gaat organiseren.  

In deze blog hebben we de meest gemaakte fouten beschreven die organisaties maken als ze datagedreven gaan werken. Wil je weten hoe je het wél aanpakt? Lees dan de whitepaper ‘In negen stappen naar data-integratie en een datagedreven organisatie’. 

In 9 stappen naar data-integratie en een datagedreven organisatie

Zo haal je met goede integratie waarde uit data.