Gebruik Data Science om je bedrag per kassabezoek te verbeteren

Gebruik Data Science om je bedrag per kassabezoek te verbeteren We hebben nu wel van Data Science gehoord, tools gezien en vlammende betogen gehoord waar gezegd wordt dat je nu moet instappen. Waar wat is het nou eigenlijk. Wat doet het, en hoe pak je dat nou aan? In een eenvoudig voorbeeld ga ik laten zien hoe je met een paar stappen een goede start kan maken met analyse en scherper inzicht kan verkrijgen om je Kassaverkopen te doen verhogen. Een groothandel in Bouwmaterialen wil het bedrag per klantbezoek verhogen. ZZP ers kopen hier hun spullen in om de klussen bij hun klanten te kunnen uitvoeren. Als eerste gaan we kijken Hoe de kassaverkopen verdeeld zijn. Een gemiddeld zegt eigenlijk weinig. Dus daarom gaan we grafisch kijken naar de kassaverkopen. Wat je hier ziet dat er een soort dubbele kop in de verdeling zit. Rechts zie je een vrij normale verdeling Maar er is kennelijk ook een groep van lage kassa-aanslagen. Als ons doel is om de kassa aanslagen te verhogen dan is dit interessante informatie. Kennelijk worden er verschillende soorten inkopen gedaan. We kijken ook naar de hoeveelheid regels op de kassabon. Hier blijkt ook een hele verdeling te zijn met een piek op 1 of 2 items

Ten slotte kijken we naar de gemiddelde prijs van items die gekocht zijn De meesten hebben een lage prijs, maar je ziet tussen 200 en 400 een aantal kleine balken en tussen de 700 en 1000.

Omdat we in het bedrag duidelijk twee groepen zien is het interessant om daar verder in te kijken. Als we het bedrag tegen de hoeveelheid afzetten krijgen we een wolkdiagram. Daar zien we ineens duidelijk 3 groepen ontstaan. We kunnen Kmeans clustering gebruiken om deze te groeperen. Visueel is het duidelijk welke groepen dat moeten zijn maar de eerste run levert toch iets anders op

De reden is omdat het bedrag 20-30 zo groot is als number of items. K means wordt berekend door te kijken naar de afstand van een punt tot het centrum van een cluster. Dit wordt uitgedrukt in de waarde van de variabele. Omdat bedrag groter is weegt deze zwaarder dan items. We willen dit niet en zetten alles op schaal (hoogste waarde is 100, rest is relatief tot die waarde) Nu gaan we met dit resultaat terug naar specialisten. In dit geval mensen in de winkels. Deze geven aan dat Groep 1 (rood) is gereedschap aankoop Groep 2 (groen) zijn aankopen van onderdelen die men vergeten is Groep 3 (blauw) grootaankopen om een klus te kunnen uitvoeren

We gebruiken deze groepen om de kassaverkopen nog een keer te plotten, maar nu per groep We zien nu hoe de groepen verdeeld zijn. Hoe kunnen we deze informatie nu gebruiken? Als eerste is interessant dat er kennelijk veel inkopen zijn waarbij de klanten onderdelen vergeten zijn. Als we gaan kijken welke items op de kassabon staan kunnen we deze anders in de winkel leggen zodat ze bij klussen minder makkelijk vergeten worden. Dit verhoogt het bedrag op de kassabon, het verlaagt wel het aantal klantbezoeken. Het voordeel is dat we ook verhinderen dat onze klanten bij concurrentie de restspullen inkopen. Ten tweede kunnen we kijken per klant wat voor aankopen ze bij ons doen. Alleen vergeten dingen maar de rest niet? Dan is dit een kans om een klant die regelmatig bij ons binnen komt te benaderen om te kijken of we deze klant verder kunnen binden Verder kan je ook kijken of klanten ook gereedschap kopen. Als blijkt dat ze daarvoor niet bij ons zijn kun je daar aanbiedingen op aanscherpen. Deze conclusies is het resultaat van exploratie analyse. Door op deze manier naar de data te kijken kun je al waardevolle conclusies doen en commercieel scherper reageren op hoe de klanten handelen. Voor meer informatie kunt u contact opnemen met jeroen.van.der.a@interdobs.nl