Breng machine learning modellen vlot, veilig en gecontroleerder naar productie met MLOps

Machine learning modellen op een gecontroleerde manier naar productie brengen, is nog vaak een lastige opgave. Vooral wanneer je dat proces bij iedere nieuwe versie van een model wil herhalen. Wie voor hulp het internet raadpleegt, vindt vooral blogs over de valkuilen tijdens het uitrollen naar productie. Maar is er ook een oplossing? Jazeker, en die heet MLOps.

Data engineer Philip van Kuiken van Riviq legt uit hoe MLOps jouw deployment proces iedere keer succesvol maakt.

Veel bedrijven zetten tegenwoordig machine learning in. Voor het voorspellen van benodigde winkelvoorraden tot het presenteren van een persoonlijke top vijf aanbevolen vluchten op de website van een luchtvaartmaatschappij. Data scientists van die bedrijven merken al gauw dat het naar productie brengen van een goed werkend machine learning model veel meer behelst dan een simpele druk op de knop.

Er dienen zich namelijk al snel allerlei vragen aan. Hoe weet je bijvoorbeeld zeker dat dit model beter werkt dan de voorgaande versie? Wat doe je als dat niet het geval is? Of wat moet je doen als je fouten in je model ontdekt als deze al in productie staat? En om het extra complex te maken: een machine learning model kan op meerdere manieren gebruikt worden, met ieder een andere wijze van naar productie brengen. Welke wijze is het meest geschikt voor het model dat je hebt gebouwd?

Wat is MLOps?

Wat een (verbeterd) machine learning model uitrollen naar productie zo uitdagend maakt, is het ontbreken van een gestroomlijnd proces. Vaak hebben bedrijven zo’n proces nog niet, omdat de meeste bedrijven machine learning pas kort actief toepassen.

Gelukkig is er nu MLOps, een samentrekking van ‘Machine Learning’ en ‘DevOps’. DevOps is een methode die ontwikkeling (Dev) en operations (Ops) combineert om nieuwe software te ontwikkelen in een iteratief proces. Daarmee creëer je continu waarde voor de business.

MLOps doet vrijwel precies hetzelfde, alleen dan voor machine learning modellen. Met MLOps zorg je daarnaast voor grip en controle in elke stap van het ontwikkelen en naar productie brengen van de modellen.

Sneller, automatisch en verzekerd

Met MLOps zet je een pipeline framework op. Die pipeline bestaat uit een aantal heldere stappen – van bouwen of verbeteren naar testen tot deployen. Het opzetten en inrichten van zo’n pipeline doe je eenmalig, waarna je nieuwe machine learning modellen keer op keer gecontroleerd uitrolt. Die structuur versnelt je deployment proces aanzienlijk, waardoor bijvoorbeeld IT-teams waarmee je samenwerkt niet meer op jou hoeven te wachten. Zo’n framework heeft nog een aantal andere cruciale voordelen:

Automatisch uitrollen

Daardoor houd je als data scientist meer tijd over om te doen waar je goed in bent, namelijk het ontwikkelen en verbeteren van machine learning modellen.

Kwaliteit garanderen

In een MLOps pipeline framework zitten verschillende testmomenten verwerkt. Voordat je jouw model uitrolt, wordt het model getest op technisch vlak. Oftewel, is je code in orde? Daarmee garandeer je dat je nieuwe model voldoet aan de technische standaarden.

Met zekerheid waarde leveren

Functionele tests in het framework toetsen jouw verbeterde model op misschien wel de belangrijkste vraag: is deze versie van het model daadwerkelijk beter dan de vorige?

Meer van dit in je mailbox?

We sturen je circa 6x per jaar een email met handpicked cases, blogs en tips.

Zo werkt een MLOps pipeline framework

Met een MLOps pipeline framework verbeter je jouw deployment proces, maar hoe ziet die pipeline er precies uit? De CI/CD-methode (Continuous Integration/Continuous Delivery) vormt de basis. Grofweg doorloop je de volgende stappen:

CI-CD-MLOps-framework

CI-fase

  • In de CI-fase test je eerst de kwaliteit van de code. Is je code volledig in orde? Pas dan kun je naar stap 2.
  • Je traint je model met data om voorspellingen te doen.
  • Je test de performance van het model. Hoe goed zijn de voorspellingen? En voorspelt dit model beter dan het vorige? Is dat niet het geval, dan stopt de pipeline hier. De data scientist verbetert eerst het model en begint dan weer bij stap 1. Dat is een continu proces totdat blijkt dat het model beter presteert dan de vorige versie.
  • Het resultaat van de CI-fase is een artifact, een pakketje dat alle informatie bevat om je data te processen en een voorspelling te genereren.

CD-fase

  • In de CD-fase deploy je het artifact naar een testomgeving om de werking van het model te testen. Daarna wordt het model naar een pre-productieomgeving gebracht. Dat is nodig voor Quality Assurance (QA), ook kun je hier bijvoorbeeld A/B-tests uitvoeren. Is alles positief? Dan volgt de laatste stap: het model naar productie brengen.

Omarm MLOps voor echte businesswaarde

Het werken met machine learning modellen zet dankzij MLOps een welkome stap naar meer professionaliteit. Stop daarom met het eindeloos omzeilen van valkuilen in een handmatig en foutgevoelig deployment proces. Omarm MLOps als dé manier om telkens weer op gecontroleerde wijze machine learning modellen te ontwikkelen en naar productie te brengen, zodat je altijd zeker weet dat jouw modellen de business verder helpen.

Philip-van-kuiken

Geschreven door

Philip van Kuiken

Data scientist

Op de hoogte blijven van de laatste ontwikkelingen en webinars?

Schrijf je dan in voor de nieuwsbrief en ontvang circa 6x per jaar een selectie van blogs, cases, webinars en nieuws in je mailbox.

Meer over dit onderwerp