Clustering Analytics voor Marketing

Werkt jouw organisatie ook nog steeds met segmentatie gebaseerd op geslacht en leeftijd en denk je dat dat niet (meer) volstaat? Dan wordt het tijd om eens met clustering analytics aan de slag te gaan. Clustering op basis van klantgedrag kan tot nieuwe klantindelingen komen die veel verder gaan dan “vrouw 25-36 jaar”. Dit leidt tot verrassend nieuwe inzichten en bovendien tot effectievere marketing.

Vrouwen 25-36 en andere segmentaties

Veel klantsegmentaties beginnen (en sommigen zelfs, helaas, eindigen) met geslacht en leeftijdsklassen. Heel raar is dat niet: Mannen komen nog best vaak van Mars en vrouwen van Venus, jonge mensen hebben niet vaak een rollator en bejaarden met een snapchat account zijn schaars. Een segmentatie op deze twee eigenschappen levert een overzichtelijk aantal groepen op en kan heel nuttig zijn om te gebruiken in bijvoorbeeld direct marketing. Bovendien kunnen deze segmenten al leuke inzichten opleveren.

De wereld van segmenteren houdt hiermee echter niet op: van klanten weten we vaak nog veel meer criteria waarop selecties kunnen worden gemaakt: hoe lang zijn de klanten al klant? Wat is de mate van verstedelijking van de klant? Ontvangt hij de nieuwsbrief? En wat te denken van geregistreerde aankopen? Wanneer was de laatste aankoop? Hoe frequent koopt de klant? En wat is de gemiddelde verkoopwaarde? (Een oplettende lezer herkent hierin het RFM model.) Allemaal kenmerken die gebruikt kunnen worden voor het verbeteren van de communicatie met die klant en het voor het verkrijgen van klantinzichten.

Met de beschikbaarheid van zoveel kenmerken ontstaat wel een duivels dilemma: Een segmentatie op twee à drie kenmerken levert wellicht wel een behapbaar aantal segmenten op, maar is wellicht toch nog te eenzijdig om echte inzichten op te leveren. Maar als je segmenten definieert op basis van heel veel kenmerken ontstaan er ook heel veel en hele kleine segmentjes. De waarde van opgedane inzichten wordt daarmee discutabel. Hoe interessant is het om te weten dat vrouwen van 40 tot 50 jaar, die al twee jaar klant zijn, de email nieuwsbrief minimaal 3 keer hebben geopend, die bovendien zeer recent een aankoop hebben gedaan en in een matig verstedelijkt gebied worden, nou die dus, en dat die heel goed hebben gereageerd op de laatste campagne? Als dat uiteindelijk 0,1% van je klantenbestand is, zou ik zeggen: lekker boeien.

Clustering analytics

Een antwoord op dit dilemma is clustering analytics. Dit is een vorm van data science (maar termen als advanced analytics, big data analytics, data mining, machine learning en data analytics reken ik ook goed) waarbij klanten worden gegroepeerd op basis van meerdere kenmerken, maar waarbij het resultaat toch een beperkte set groepen oplevert. Wauw! Dat wil je, toch?

In de wereld van data science voor marketing komt clustering verrassend genoeg nog niet zo vaak voor. Veel vaker lees je over toepassingen waarbij klantgedrag wordt voorspeld, zoals cross sell, churn en natuurlijk de zogeheten recommendation modellen: Netflix, Spofity, Zalando en Google die op basis van slimme algoritmen precies die items hebben geselecteerd die jou zullen aanspreken. Google maar even op die termen en de blogs en video’s vliegen je om de oren. Maar als je Googlet op “clustering analytics”? Dan is de oogst een stuk kleiner.

Een praktisch voorbeeld

Stel je bent een bedrijf, je hebt al die klantkenmerken en je wilt je klanten in een beperkt aantal klantgroepen definiëren omdat jij en je collega’s enerzijds beter willen snappen wat voor soort klanttypen er binnen het klantenbestand zijn en jullie anderzijds de marketingbudgetten beter willen inzetten: het creëren van de juiste content, het gerichter inkopen van media en het optimaliseren van de content in direct marketing.

Bedenk vooraf wat globaal de aard van je clusters moet zijn. Natuurlijk zouden clusters op basis van affiniteit het mooist zijn, maar je kunt ook kijken naar clusters die iets zeggen over het (aankoop) gedrag. Het feit dat iemand producten uit een bepaalde categorie koopt, kan een indicatie zijn van een bepaalde affiniteit maar het moment van aankopen, het prijsniveau, het merk zegt veel meer over het type koper. Dit is zeker geen exacte wetenschap maar geeft wel richting in de zoektocht naar de juiste data.

Het is goed om dan eens kritisch te kijken naar de data kenmerken die je wel of niet hebt van je klanten: begrijp ik goed wat elk kenmerk voorstelt, is de kwaliteit van de data goed en welke kenmerken zijn relevant voor de clusters die ik in gedachten heb? Of moet ik speciaal hiervoor nieuwe kenmerken aanmaken? Of moet ik data gaan combineren met bijvoorbeeld externe databronnen?

Met een goed zicht op het doel van de clustering en een goed begrip van de data kan het echte clustering analytics beginnen: een mooi iteratief proces van data selectie, data preparatie, afwegen en kiezen van clusteralgoritmen en het visualiseren van de uitkomst.

Project geslaagd?

Oké, maar hoeveel iteraties moet je dan doen? Wanneer is het goed? Dat is een goede vraag! In tegenstelling tot een voorspelmodel (zoals churn) waarvan je de performance kunt meten, kent clustering niet echt een “nu-is-het-goed” score. Maar als de clusters een nieuwe invalshoek geven op je klanten en mensen in de organisatie daardoor nieuwe inzichten oplevert waarmee ze marketing processen efficiënter kunnen maken of strategische beslissingen kunnen nemen, dan zou ik zeggen: project geslaagd!

Robert Mansour

Meer weten? Neem vrijblijvend contact op met

Pim Wennekes

Manager Data science

pim.wennekes@riviq.nl
+31 621 964 963
linkedin.com/in/pimwennekes

bladeren door artikelen

meer over dit onderwerp

Send this to a friend