Drie tips voor een betere data omgeving

Veel organisaties bepalen op dit moment of de huidige data omgeving nog wel voldoet om de toevloed van data op te vangen. De wens om snel over deze data te beschikken voor rapportage en analyse doeleinden is mede een sterk bepalende factor in de wens om tot een adequate data omgeving te komen.

Het oude is niet goed genoeg meer, het nieuwe wel. Dus weg met het oude en kom maar op met die nieuwe oplossing! Hoewel we allemaal weten dat de wereld niet zo simpel is, schiet bovenstaande gedachte ons wel eens door het hoofd. Zo ook in de wereld van data. Weg met het oude datawarehouse, leve het nieuwe data lake!

In  gesprekken over het thema big data gaat het hier vaak over. De drijfveer voor de discussie is meestal dat er steeds meer data beschikbaar komt die ook nog eens snel beschikbaar moet zijn voor rapportage en analyse. Laatst hoorde ik zelfs iemand roepen: het gaat niet om big data maar om fast data! Een extra katalysator in de discussie is de toegenomen wens om met advanced analytics aan de slag te gaan. Kortom: het moet sneller en slimmer.

De vraag is of de bestaande data omgeving hier al antwoord op kan geven

Wellicht heeft deze omgeving een aantal tekortkomingen, maar is dat dan direct een belemmering? Ik moet hierbij denken aan het volgende verhaal:

Een oude man loopt elke dag met twee waterkruiken naar een bron. Aan zijn ene schouder hangt een nieuwe mooie kan, aan de andere schouder een ouder exemplaar. De oude kan lekt wat en lijkt daardoor niet meer geschikt voor zijn functie. Als zijn zoon hem vraagt waarom hij de oude kan niet weggooit, antwoordt de man: “hij lekt wel wat, maar elke keer voedt het gelekte water de bloemen langs het pad dat ik loop, wat mijn werk aangenaam maakt”.

Ik vond het wel een mooi verhaal om duidelijk te maken dat het loont om op een andere manier naar de bestaande hulpmiddelen te kijken.

Met dat verhaal in het achterhoofd heb ik drie tips

  1. Kijk nog eens goed naar je bestaande Datawarehouse en BI omgeving. Wees bewust van de data die er al is. Wordt die wel voldoende benut? Zou daarop al geen eerste advanced analytics  kunnen worden toegepast? Kortom: koester de bestaande omgeving en kijk welke ruimte er is om deze omgeving te optimaliseren.
  2. Doe een geïsoleerde proef met nieuwe (big) data omgevingen. Vind iets dat de moeite waard is om te proberen. Een echte “case for change”. Doe ervaring op. Maak fouten en leer!
  3. Start met het bedenken van een architectuur om de oude en de nieuwe data wereld bij elkaar te brengen. Hanteer daarbij het uitgangspunt: we kiezen voor het beste van de twee werelden.

Ik krijg nog vaak te horen dat er  ideeën leven om een data lake aan te leggen. Als ik dan vraag naar het waarom wordt het vaak stil. Echt, vergeet deze belangrijke vraag toch niet  te stellen! Ik schreef  hierover al eerder in mijn blog “Een data lake omdat het kan”. Stel jezelf gerust nog eens die waaromvraag en neem dan mijn drie tips ter harte. Misschien vind je de tips te simpel. Dan ben je net als de oude man met de twee waterkruiken waarschijnlijk al tot belangrijke inzichten gekomen.

Robert Mansour

Geschreven door

Riviq

info@riviq.nl
+31 (0)70 40 60 966

meer over dit onderwerp

Send this to a friend