De kracht van text mining. Zo haal je waardevolle inzichten uit enquêtes
Enquêtes leveren vaak waardevolle feedback op, maar veel organisaties benutten de informatie uit open antwoorden nog onvoldoende. Wat als je deze verborgen informatie kunt omzetten in bruikbare inzichten voor jouw organisatie?
In dit artikel laat Data Scientist Beaudine den Dunnen zien hoe je met text mining het maximale uit survey data kunt halen.
Enquêtes (surveys) helpen je organisatie om inzicht te krijgen in klanttevredenheid, medewerkerstevredenheid en andere belangrijke thema’s. Veel van deze enquêtes bevatten open vragen, die waardevolle informatie kunnen bieden.
Toch wordt er in veel organisaties weinig gedaan met open antwoorden. Door de complexe structuur van tekstdata ontbreekt het vaak aan de juiste tools en expertise om deze data om te zetten naar bruikbare inzichten.
Vaak wordt gekeken naar handmatige oplossingen, maar doordat dit tijdrovend en foutgevoelig is, wordt deze optie al snel aan de kant geschoven.
Open antwoorden samenvatten
De laatste tijd zie ik echter dat organisaties steeds vaker kijken naar tools zoals ChatGPT om open antwoorden uit enquêtes samen te vatten en daar de belangrijkste conclusies uit te halen.
Ten eerste wil ik zeggen: goed bezig! Je zet als organisatie de stap om meer waarde uit je enquêtes te halen. Toch is dit niet altijd de meest geschikte manier om meer inzichten te halen uit je enquêtes. Waarom?
Dat leg ik je uit.
ChatGPT is een vorm van generatieve AI, een deelgebied binnen text mining. Daarmee creëer je volledige blogs, webteksten en andere zaken op basis van Natural Language Processing (NLP).
Het is echter bij het samenvatten van surveys meestal een overkill als optie. Bovendien blijft ChatGPT voor veel organisaties een vraagteken vanwege de kosten, privacyrisico’s en het gebrek aan transparantie.
Omdat het een ‘black box’ model is, is niet altijd duidelijk hoe de resultaten tot stand komen. Dit kan een uitdaging zijn wanneer nauwkeurigheid en controle essentieel zijn.
De juiste techniek voor ieder vraagstuk
NLP is een goed ontwikkeld vakgebied. Daarom is voor bijna ieder vraagstuk wel een passende oplossing te vinden. Zo zijn er naast de generatieve AI veel non-generatieve technieken beschikbaar die wel voldoen aan de vraag naar transparantie en nauwkeurigheid.
Ook hoeft een oplossing niet duur te zijn; binnen het NLP-vakgebied geldt: met weinig effort kan je al veel bereiken!
Extractieve samenvattingen als alternatief voor GenAI
Dat er meer mogelijk is dan generatieve AI, zie je vooral bij het samenvatten van tekst. In eerste instantie lijkt het alsof alleen GenAI hier van toepassing kan zijn. Je schrijft namelijk een samenvatting. Er bestaat echter een veelgebruikt alternatief: extractief samenvatten.
Met extractief samenvatten worden alleen de zinnen met waardevolle informatie uit de tekst gehaald.
Simpel gezegd is het alsof je met een markeerstift door de tekst gaat en alleen de belangrijke zinnen markeert. Zet je deze onder elkaar, dan heb je een samenvatting zonder nieuwe tekst te schrijven.
Dit is precies wat je met een machine learning of deep learning model kunt doen. Het is een snelle, effectieve methode om grote hoeveelheden tekst samen te vatten.
Meer van dit in je mailbox?
We sturen je circa 6x per jaar een email met handpicked cases, blogs en tips.
Analyseren op basis van tekst
Behalve het samenvatten van tekst, is het ook mogelijk om de tekst statistisch te analyseren. Wil je bijvoorbeeld weten welke woorden en onderwerpen het meest worden genoemd in enquêtes? Of ben je geïnteresseerd in een specifiek onderwerp zoals de reactietijd van je customer service afdeling?
Dit kun je uit teksten halen met statistische methodes. Daarnaast kun je tekst visualiseren door bijvoorbeeld wordclouds in jouw rapportage toe te voegen. Zo zie je in één oogopslag welke onderwerpen naar voren komen.
Naast het statistisch samenvatten van de tekst, is het ook mogelijk om zaken zoals synoniemen, spelfouten en semantische betekenis mee te nemen in de analyse.
Je hebt er namelijk niets aan als je vijf keer hetzelfde woord in jouw rapportage tegenkomt, waarbij het woord iedere keer net iets anders is gespeld.
Of wat dacht je van de antwoorden op jouw vragenlijst over de reactiesnelheid van jouw customer service afdeling, waar de woorden ‘snel’, ‘rap’ en ‘spoedig’ allemaal aangeven dat er vlot wordt gereageerd op de klant? Een persoon ziet direct dat deze woorden op hetzelfde doelen, maar ziet een computer dat ook?
Het antwoord is hier het gebruik van een deep learning model, dat de betekenis van teksten kan begrijpen, net zoals een persoon dat doet.
Het model haalt de meest voorkomende woorden uit een tekst en groepeert woorden die hetzelfde betekenen, zelfs woorden die hetzelfde zijn geschreven maar in context een andere betekenis hebben (denk aan ‘bank’ als meubelstuk en ‘bank’ als financiële instelling).
Wil je uit langere teksten de algemene onderwerpen halen? Dan kun je ook topic modeling gebruiken. Dit is een deep learning techniek die algemene onderwerpen uit de tekst haalt, zonder dat de gebruiker daar input voor hoeft aan te leveren.
Naast het analyseren van de meest voorkomende woorden of zinnen, zijn er nog veel meer mogelijkheden voor het analyseren van tekst.
Een voorbeeld is een sentiment analyse; hiermee classificeer je of een tekst of zin positief of negatief is. Dit is een handige methode voor onder andere het samenvatten van reviews.
Bijvoorbeeld om te weten te komen of iemand tevreden of ontevreden is over de kwaliteit van je product.
Binnen een paar weken gebruik je text mining
Text mining biedt diverse toegankelijke technieken om praktische inzichten te halen uit je enquêtes. Door deze technieken te gebruiken, krijg je meer inzicht in wat je klanten en medewerkers echt beweegt.
Ik heb in de praktijk gezien hoe dit kan leiden tot betere besluitvorming of een scherpere klantstrategie.
Bij Riviq hebben we de expertise om jou hierbij te ondersteunen.
Het mooie is dat we dit met relatief weinig middelen al realiseren: als data scientist kan ik binnen een paar weken een werkend Proof of Concept voor je ontwikkelen dat waardevolle inzichten biedt.
Wil je meer weten hoe we je bij Riviq kunnen helpen om waardevolle inzichten te halen uit jouw survey data? Neem dan gerust contact met ons op!
Geschreven door
Beaudine den Dunnen
Data scientist
Op de hoogte blijven van de laatste ontwikkelingen en webinars?
Schrijf je dan in voor de nieuwsbrief en ontvang circa 6x per jaar een selectie van blogs, cases, webinars en nieuws in je mailbox.
Meer over dit onderwerp
Copilot voor Power BI. Je persoonlijke assistent voor rapportages?
Is Copilot voor Power BI een volwassen tool en hoe bruikbaar is het?Copilot voor Microsoft Fabric is sinds juni 2024 algemeen beschikbaar in Power BI. Tijdens introductie waren er hoge verwachtingen! In verschillende artikelen, guides en tutorials werden de...
Altijd keurige code met SQLFluff in DBT. Zo werkt deze handige linter
SQL-code reviews kunnen behoorlijk tijdrovend zijn. Zeker als al je collega’s code op een andere manier schrijven. Bijvoorbeeld omdat je er geen afspraken over hebt gemaakt of niet iedereen zich aan de afspraken houdt. Met SQLFluff in dbt voorkom je dat. Data engineer...
Is Microsoft Fabric de moeite waard? Dit zijn onze bevindingen
Microsoft Fabric biedt op het eerste oog ongekende mogelijkheden, maar maakt het de verwachtingen waar? Data engineer Koen Kurver zocht het uit.