Data Scientist is niet alleen de Hero. Deze 3 rollen vormen het Analytics Dreamteam
Steeds meer organisaties starten de zoektocht om hun ‘hooiberg’ aan data te transformeren naar waardevolle inzichten. Inzichten waarmee zij het verschil kunnen maken richting hun klanten. In menig vacature prijkt de functietitel van ‘Data Scientist’ die de data eenvoudig weet om te toveren naar euro’s.
Maar is deze Data Scientist wel de ‘Hero’ in je Analytics project of ligt dit wat genuanceerder? In mijn ogen bestaat je Analytics Dreamteam niet uit slechts de Data Scientist, maar is het een framework van drie rollen die elkaar naadloos aanvullen.
Data Scientist, de alleskunner?
De enorme opmars van het aantal vacatures voor een Data Scientist gaan hand-in-hand met de media die schrijven over ‘de baan van de toekomst’. Vacatures beschrijven de Data Scientist als een schaap met vijf poten, een echte alleskunner. Hij of zij moet van alle markten thuis zijn: virtuoos in het verzamelen en verrijken van data, raketgeleerde in het maken van slimme voorspelmodellen en kunstenaar om de resultaten te visualiseren in betoverende Visuals.
Als we de vacatureteksten moeten geloven, zou de Data scientist de Hero zijn in elk Analytics project. Maar helaas is deze rol nog niet zo volwassen en ligt het succes in Analytics-projecten in de praktijk een stuk genuanceerder.
Dreamteam voor Analytics
Het vergroten van je kansen op succes en rendement in Analytics zit hem in het samenbrengen van meerdere vaardigheden. Een dreamteam voor Analytics bestaat uit het samenbrengen van drie rollen, ieder met zijn eigen vaardigheden en kracht.
De eerste rol is de Data Scientist. Dit is iemand met een sterke statistische achtergrond, die de juiste hypotheses kan stellen en diverse technieken van voorspelmodellen beheerst. Denk hierbij aan het selecteren, trainen en toepassen van het juiste voorspelmodel. De uitkomsten van deze voorspelmodellen moeten wel worden vertaald naar de business en bovenal waarde gaan opleveren voor de klant en daarmee ook voor de organisatie.
Hier komt de tweede rol om de hoek kijken, namelijk de Business Analist. Hij snapt als geen ander wat belangrijk is voor de organisatie en haar klanten. Het werken in Analytics-trajecten zonder businesscontext is een kansloze wedstrijd. Juist de samenwerking tussen de Data Scientist en de Business Analist zorgt voor toetsing van de juiste hypotheses en het verzilveren van de uitkomsten in de organisatie.
Praktische case: De uitkomst van een Churn model voor een Data Scientist betreft een lijst met gescoorde klanten (bijvoorbeeld, de uitkomst van klant X is 0.85). Voor de gemiddelde sales medewerker of marketeer is zo’n lijst meer ‘abracadabra’ dan een levend cijfer met betekenis. Daarom willen de collega’s aan de front-end graag op een presenteerblaadje inzichtelijk zien welke acties ze morgen moeten uitvoeren om bepaalde resultaten te bereiken.
Dit kan bijvoorbeeld pragmatisch worden weergegeven in een visualisatie, waarbij alleen de meest waardevolle of loyale klanten in een stoplicht zijn opgenomen. Rood voor waardevolle klanten die binnen twee maanden je organisatie dreigen te verlaten en waarbij dus gelijk actie nodig is, bij oranje zitten klanten in de gevarenzone en bij groen licht is er geen directe actie nodig.
Data engineer, de echte Hero?
De laatste en derde rol in het Analytics Dreamteam is de Data Engineer. Dit zijn de slimme techneuten die vele technieken beheersen zoals Hadoop, Azure, R en SQL, om API’s te programmeren voor het ontsluiten van data uit systemen en dit slim te organiseren in een data platform.
In de praktijk zien we dat het verzamelen, verrijken en prepareren van data in Analytics-trajecten momenteel minimaal 70% van het werk in beslag neemt. Elke organisatie heeft heel veel data, maar de crux zit hem in hoeveel en vooral welke data echt bruikbaar is voor welke use case.
Er gaat veel tijd zitten in het correct prepareren van de benodigde data, zodat de Data Scientist een bruikbare set heeft waarop hij een voorspelmodel kan loslaten. Het werk voor het trainen en toepassen van het voorspelmodel, wat de Data Scientist doet, is ‘beperkt’ ten opzichte van het data-preparatie werk. Dit klinkt een stuk minder sexy dan menig Data Scientist-vacature doet geloven, maar deze verdeling is wel de realiteit.
Alles valt of staat met het goed op orde krijgen van je data, wat binnen veel organisaties nog een enorme uitdaging is. Vanuit deze context is de Data Engineer wellicht wel de echte Hero. Maar niet getreurd ‘Beste Data Scientists’, elke Batman heeft een Robin nodig die hem aanvult. Het Analytics Dreamteam is tenslotte een samenwerking van het totaal: de Data Scientist, Data Engineer en Business Analist.
Heb jij je Analytics Dreamteam al op orde met deze rollen of heb je het anders ingericht? Ik ben benieuwd naar je mening!
Meer weten? Neem vrijblijvend contact op met
Meer over dit onderwerp
Copilot voor Power BI. Je persoonlijke assistent voor rapportages?
Is Copilot voor Power BI een volwassen tool en hoe bruikbaar is het?Copilot voor Microsoft Fabric is sinds juni 2024 algemeen beschikbaar in Power BI. Tijdens introductie waren er hoge verwachtingen! In verschillende artikelen, guides en tutorials werden de...
Altijd keurige code met SQLFluff in DBT. Zo werkt deze handige linter
SQL-code reviews kunnen behoorlijk tijdrovend zijn. Zeker als al je collega’s code op een andere manier schrijven. Bijvoorbeeld omdat je er geen afspraken over hebt gemaakt of niet iedereen zich aan de afspraken houdt. Met SQLFluff in dbt voorkom je dat. Data engineer...
Is Microsoft Fabric de moeite waard? Dit zijn onze bevindingen
Microsoft Fabric biedt op het eerste oog ongekende mogelijkheden, maar maakt het de verwachtingen waar? Data engineer Koen Kurver zocht het uit.