Data Management met Microsoft Purview – Wat kun je er écht mee?

Tijdens een recente competentiesessie bij Riviq namen Rick en Tim Microsoft Purview grondig onder de loep.

Wat is het precies, hoe werkt het in de praktijk en wanneer is het de juiste keuze voor jouw organisatie?
In dit blog delen we de belangrijkste inzichten.

Wat is Microsoft Purview?

Microsoft Purview is een alles-in-één platform voor data governance, compliance en beveiliging. Het helpt organisaties hun datalandschap in kaart te brengen en te beheren — ongeacht waar die data zich bevindt: in de cloud, on-premise of ergens daartussenin.

Purview is nog een relatief nieuwe speler op de markt. Tools als Informatica en Collibra zijn al langer gevestigd en functioneel volwassener. Collibra geldt momenteel als marktleider; Informatica is minder modern maar functioneel solide.

Purview is in vergelijking jonger en nog volop in ontwikkeling — maar Microsoft investeert fors in de doorontwikkeling. De verwachting is dat het platform de komende jaren snel volwassener wordt, zowel qua functionaliteit als marktpositie.

Your content goes here. Edit or remove this text inline or in the module Content settings. You can also style every aspect of this content in the module Design settings and even apply custom CSS to this text in the module Advanced settings.

Hoe ziet de module inrichting binnen Purview er uit?

Purview bestaat uit verschillende modules (Solutions), zoals Data Map, Unified Catalog, Data Quality en Workflow.

Elke module heeft eigen settings en functionaliteiten:

  • Data Map is gericht op het technisch koppelen van data bronnen, domeinen en collecties
  • Unified Catalog is bedoeld voor business waarde, domeinen, data producten, eigenaarschap en metadata management
  • Data Quality Rules biedt het aanmaken, uitvoeren en monitoren van data kwaliteitsregels, inclusief error records en rapportages
  • Workflow module ondersteunt het automatiseren van processen, zoals goedkeuringen en data governance workflows, maar is nog niet volledig gestandaardiseerd
  • Elke module heeft aparte instellingen; niet alles is centraal te beheren, wat soms zoeken vereist bij configuratie.
Wat is Purview

Meer van dit in je mailbox?

We sturen je circa 6x per jaar een email met handpicked cases, blogs en tips.

Hoe werkt Purview in de praktijk?

We zoomen voor dit artikel in op het ‘Data Quality’ proces binnen Purview. Dit werkt als volgt:

DQ Proces binnen Purview

Data Map: jouw datalandschap in kaart

Het startpunt van Purview is de data map. Hierin koppel je databronnen aan het platform, waarna een scan wordt uitgevoerd om assets beschikbaar te maken. Die assets structureer je vervolgens in collecties en domeinen. Het resultaat: een helder overzicht van de databronnen binnen je organisatie, waarbij je met de juiste rollen bepaalt wie toegang heeft tot welke informatie in Microsoft Purview.

Metadata verrijken

Zodra databronnen zijn gescand, kun je de metadata verrijken met definities, labels en classificaties. Een deel van dit proces verloopt automatisch, maar handmatige verrijking is in de meeste gevallen onvermijdelijk om volledigheid te garanderen.

Data producten en kwaliteitsregels

Assets kunnen worden gekoppeld aan data producten — en één asset kan aan meerdere producten hangen. Binnen die producten stel je data kwaliteitsregels op, plan je scans en monitor je de resultaten. Purview biedt standaard kwaliteitsregels die snel zijn in te richten, én ondersteuning voor custom regels bij complexere validaties. Je kunt drempelwaarden per regel instellen en incrementele scans uitvoeren.
Een waardevolle toevoeging is de mogelijkheid om error records weg te schrijven naar een storage account of direct naar Fabric. Zo kun je incidenten direct opvolgen en actiegericht werken aan datakwaliteit.

Rapportage: mogelijkheden én beperkingen

Purview bevat standaardrapportages voor datakwaliteit, maar deze zijn beperkter dan wat tools als Collibra bieden. Voor uitgebreidere analyses kun je data exporteren naar Power BI. Dat biedt flexibiliteit, maar vraagt wel een extra stap in je werkproces.

Een aandachtspunt bij schaling: hoe overzichtelijk en beheersbaar blijft Purview wanneer het aantal kwaliteitsregels groeit naar honderden of zelfs duizenden? Dat is nog een open vraag — iets waar we zelf verder onderzoek naar doen.

Implementatie en beheer: wat vraagt het van jouw organisatie?

Een basisimplementatie met data producten en kwaliteitsregels is verrassend snel opgezet — soms binnen enkele uren — mits de juiste connecties en rechten aanwezig zijn. Complexere inrichtingen vragen uiteraard meer tijd en afstemming.

Het actief beheren van Purview is minstens zo belangrijk als de technische implementatie. Denk aan:

  • Eigenaarschap expliciet vastleggen bij data producten en metadata
  • Duidelijke processen voor het opvoeren en goedkeuren van termen, om wildgroei te voorkomen
  • Lifecycle management — de functionaliteit is aanwezig, maar vraagt nog nadere verkenning

Eerlijk gezegd ontbreekt er nog een duidelijke “best practice” of voorbeeldorganisatie als referentie. En een gescheiden test- en productieomgeving is momenteel nog niet standaard beschikbaar. Dat zijn reële beperkingen om rekening mee te houden.

Kosten: een sterk argument voor Microsoft-organisaties

Voor de meeste functionaliteiten van de data map en catalog kan volstaan met een pay as you go licentie. Dat maakt Purview financieel aantrekkelijk, zeker voor organisaties die al werken met Azure en het Microsoft-ecosysteem. Voor sommige specifieke onderdelen geldt een aanvullend licentiemodel.

Wanneer kies je voor Purview — en wanneer niet?

Purview is bij uitstek geschikt voor organisaties die:

  • net beginnen met data governance of datakwaliteit
  • al werken met Azure en het Microsoft-ecosysteem
  • op zoek zijn naar een kostenefficiënte instap in data catalogisering

Voor grote organisaties met een volwassen datakwaliteitsproces en hoge eisen aan functionaliteit en schaalbaarheid, raden we vooralsnog Informatica of Collibra aan. Die platforms zijn verder doorontwikkeld voor enterprise-gebruik op grote schaal.

Wat staat er op de roadmap?

Microsoft werkt actief aan de verdere ontwikkeling van Purview. Belangrijke verbeteringen op de roadmap zijn:

  • Betere zoekfunctionaliteit — zodat tabellen, kolomdefinities en andere assets makkelijker vindbaar worden
  • Meer connectoren — waaronder voor SAP, Databricks en on-premise databronnen
  • Verdere uitbouw van workflow functionaliteit — voor procesautomatisering binnen het platform

Onze conclusie

Microsoft Purview is een veelbelovend platform dat de komende jaren sterk zal groeien. Voor organisaties die starten met data governance en al inzetten op Microsoft en Azure, is het nu al een serieuze optie.

Voor complexere, grootschalige implementaties is het verstandig de verdere ontwikkeling van het platform in de gaten te houden — of een alternatief te overwegen.

Bij Riviq volgen we de ontwikkelingen op de voet. We onderzoeken onder meer hoe lineage en connectoren functioneren voor verschillende bronnen, hoe de workflow functionaliteit zich verder ontwikkelt en hoe Purview presteert bij grote datasets.

Benieuwd wat Microsoft Purview voor jouw organisatie kan betekenen?

Neem contact op met onze specialisten. We denken graag met je mee.

Tim Beijer

Geschreven door

Tim Beijer

Data engineer

Op de hoogte blijven van de laatste ontwikkelingen en webinars?

Schrijf je dan in voor de nieuwsbrief en ontvang circa 6x per jaar een selectie van blogs, cases, webinars en nieuws in je mailbox.

*Na inschrijving ga je akkoord met onze privacy policy

Meer over dit onderwerp