Data science in
de fysieke Retail.

Het is geen nieuws dat de fysieke retail onder druk staat. Consumenten stappen in hoog tempo over van offline naar online winkels, waardoor fysieke winkels moeten concurreren met online ondernemingen die in staat zijn producten op elke moment op iedere plek tegen lage marges aan te bieden. De fysieke retail is genoodzaakt processen te optimaliseren en klanten een aantrekkelijkere ervaring te bieden dan in de online wereld. Bij Data Science Lab geloven wij erin dat de inzet van data een grote rol kan spelen bij het succes van ondernemingen in de fysieke retail. In dit artikel bespreken we op welke manieren, binnen fysieke winkels Big Data verzameld kan worden en presenteren we een aantal data science use-cases waarin met deze data meerwaarde gecreëerd wordt binnen verschillende afdelingen van de onderneming.

Klantendata

Het klinkt onlogisch. In een offline winkel komen dagelijks honderden klanten fysiek over de vloer; het winkelpersoneel ziet wie er in de winkel rondloopt, hoort wie er in wat geïnteresseerd is en heeft direct contact wanneer een klant een aankoop doet.

Bij een webwinkel komt het personeel zelden in directe aanraking met de klant. Toch is het voor een online winkel een stuk eenvoudiger data over hun klanten te verzamelen. Klanten binnen een online omgeving kunnen vanaf het moment dat ze op een advertentie klikken tot nadat ze de webshop verlaten worden gevolgd. Elke klik naar bijvoorbeeld een product, categoriepagina of het winkelmandje kan worden geregistreerd. Hierdoor zijn er in de online omgeving talloze data science toepassingen om een gedetailleerd klantbeeld te vormen en daarmee klanten gericht te benaderen om een gepersonaliseerde ervaring te bieden.

De uitdaging in de fysieke retail is dat personeel vaak een goed beeld van het cliënteel in hun filiaal heeft, maar dat deze kennis kwalitatief is en niet in bruikbare data omgezet kan worden. Kennis kan hierdoor niet structureel uitgewisseld worden met andere filialen, terwijl promotie-, assortiment- en operatiebeslissingen wel organisatiebreed worden genomen. Daarnaast wordt door kassasystemen veel transactionele data verzameld, maar zijn de data science mogelijkheden hiervoor beperkt omdat aankopen niet aan een persoon gelinkt kunnen worden. Gelukkig zijn er echter ook in de fysieke winkel manieren om op grote schaal kwantitatieve data over klanten te verzamelen en aankopen te koppelen.

De meeste retail ondernemingen zijn er al mee begonnen: het loyaliteitsprogramma. Door klanten te stimuleren hun klantenkaart of app te laten scannen bij een aankoop, wordt een identiteit aan een aankoop gekoppeld. Daardoor wordt inzichtelijk hoe vaak klanten terugkeren en wat voor soort producten door dezelfde persoon gekocht worden. Hiermee zijn data science toepassingen als een recommender system en churn prediction al mogelijk. Stimuleer je de klant om nog een aantal demografisch gegevens over zichzelf prijs te geven, dan kun je het gedrag van een klant koppelen aan zijn of haar kenmerken. Hierdoor wordt het mogelijk klanten te segmenteren, en gericht en persoonlijk te benaderen. Koppel je daarbij nog een app aan het loyaliteitsprogramma, dan kun  elke interactie van een klant met die app volgen.

Voor het verzamelen van data van klanten die geen aankoop doen zijn er ook een aantal mogelijkheden. Deze variëren van eenvoudige poortjes die binnenkomende klanten tellen, tot meer geavanceerde methodes als camera’s die looproutes registreren of de leeftijd en geslacht van een klant kunnen herkennen.

Hoewel we in dit artikel fysieke retail van online retail scheiden, heeft het merendeel van de fysieke retail ondernemingen ook een webshop. De data die wordt verzameld in de online winkel kan worden ingezet voor het optimaliseren van de fysieke winkel.

Ook in de fysieke retail is er dus de mogelijkheid om grote hoeveelheden data te verzamelen. In de rest van dit artikel bespreken we een aantal voorbeelden van hoe we deze data in zouden zetten.

Productaanbevelingen

Om omzet te maximaliseren, is het in de retail gebruikelijk om door middel van cross-selling meer te verkopen aan klanten. Ook is het voor de klantervaring beter wanneer producten die vaak samen worden gekocht niet te ver uit elkaar liggen. Met data science technieken kun je inzicht krijgen in producten die vaak samen worden gekocht (koppelverkoop) en in welke producten klanten aanvullend geïnteresseerd zijn, gegeven dat zij een bepaald product hebben gekocht.

Wanneer het koppelen van verschillende aankopen van een klant geen optie is, kunnen er alsnog waardevolle inzichten uit verkoopdata worden gehaald. Met een Market Basket Analyse kunnen relaties tussen verschillen producten worden vastgesteld in een grote hoeveelheid transacties uit het verleden. Met behulp van statistische modellen wordt ontdekt welke producten vaak samen worden gekocht en berekent het model wat de kans is dat een product samen met een ander artikel wordt aangeschaft.

Gebaseerd op deze inzichten kan worden bepaald welke producten bij elkaar geplaatst zouden moeten worden om cross-selling te bevorderen. Ook kan er in kassasystemen worden ingebouwd dat wanneer een klant slechts één product van een vaak voorkomende combinatie koopt, de kassamedewerker te zien krijgt welk product ook interessant voor deze klant zou zijn. Hierdoor kan tijdens de verkoop nog een gerichte aanbeveling gedaan worden. Daarnaast kunnen dergelijke modellen worden gebruikt om te bepalen welke producten in de aanbieding zouden kunnen worden gedaan: het promoten van de juiste producten kan dan een boost geven aan de verkoop van daaraan volgens het market basket model gekoppelde producten.

Met een loyaliteitsprogramma worden verschillende aankopen van een klant gekoppeld. Hieraan kan eventueel een klantprofiel gelinkt worden Met een recommender system is het mogelijk betereproductaanbevelingen te doen. Waar een Market Basket Analyse alleen kijkt naar welke producten binnen één transactie worden gekocht, kijkt een recommender system naar de producten die een klant in het verleden gekocht heeft of die soortgelijke klanten hebben gekocht.

Er zijn twee categorieën aanbevelingssystemen: collaborative filtering & content based. Bij collaborative filtering worden, gebaseerd op de aankopen van een klant, soortgelijke klanten gevonden. Wanneer de klant een product dat deze soortgelijke klanten kochten nog niet heeft gekocht, wordt dat product aanbevolen. Bij deze methode is dus niet van belang dat er een klantprofiel gekoppeld is.

Bij content based methodes wordt er gebruik gemaakt van extra informatie over de klant (bijvoorbeeld leeftijd en geslacht) of het product (bv. prijs en categorie). Hierop gebaseerd wordt een model gebouwd dat relaties tussen klanten en producten probeert te verklaren  (bijvoorbeeld: vrouwen tussen de 25 en 45 kopen vaak artikelen van een hoge prijsklasse uit de wooncategorie.) Vervolgens kan een persoon met bepaalde kenmerken een bepaald product aanbevolen krijgen. Voor deze methode is het nodig dat een klant extra informatie over zichzelf geeft. Het voordeel tegenover collaborative filtering is echter dat een klant ook zonder eerder aankopen een relevante productaanbeveling kan krijgen.

Een productaanbeveling kan bij de kassa worden gedaan wanneer de loyaliteitskaart van een klant gescand wordt. Als er een e-mailadres bekend is kunnen klanten ook bereikt worden wanneer zij niet in de winkel zijn en kan een juiste productaanbeveling een klant stimuleren de winkel te bezoeken.

Analyse met computervisie

Zoals voorheen beschreven is het een uitdaging om data over winkelbezoekers te verzamelen. Een doelgroep wordt vaak organisatiebreed en op ‘onderbuikgevoel’ of met inefficiënte methodes (zoals enquêtes) gevormd. Looproutes en gedrag van klanten zijn globaal bekend bij personeel, maar worden niet structureel gemeten. We gaven al prijs dat deze data verzameld kan worden met camera’s. Met behulp van computervisie kunnen camerabeelden omgezet worden in kwantitatieve data.

Camera’s met gezichtsherkenning maken het mogelijk om voor elke winkelbezoeker geslacht en leeftijd te schatten. Ook kan er worden geregistreerd of een bezoeker alleen of met meerdere personen binnenkomt. Zo kan er per filiaal een duidelijke doelgroep gevormd worden. Daarnaast kan voor verschillende klantsegmenten gemeten worden hoe laat en hoelang zij winkelen. Trekt een filiaal in een dorpse omgeving in de ochtend een ander soort publiek dan een filiaal in de stad? Komen er tijdens de lunch vooral bezoekers van tussen de 25 en 45 jaar, die kort blijven en weinig kopen? Komen er vooral gezinnen op de zaterdag? Met inzicht in de bezoekers per filiaal per tijdstip, kunnen promoties op filiaal- en klantsegment worden ontworpen.

Naast het inschatten van leeftijd en geslacht, kunnen camera’s ook looproutes van winkelbezoekers registreren. Welke route legt een klant af om bij het product te komen dat hij of zij gaat kopen? Hoe bewegen winkelbezoekers die uiteindelijk niks kopen zich door de winkel? Wordt de hele winkel benut of komen bezoekers zelden voorbij de eerste gangpaden? Met inzicht in looproutes kunnen winkelindelingen geoptimaliseerd worden. Doordat de data continue binnenkomt, kan het effect van een aanpassing direct gemeten worden. Daarnaast kan er middels A/B-testen, waarbij bijvoorbeeld winkel A een nieuwe indeling krijgt en winkel B onveranderd blijft, geëxperimenteerd worden met nieuwe winkeldesigns.

Met computervisie kunnen ook handelingen van winkelbezoekers geregistreerd worden. Wat doen klanten met de producten in de winkel? Hoe vaak wordt een product opgepakt en teruggelegd en hoe staat dit in verhouding tot de verkoop van het product? Worden producten op een bepaalde hoogte in het schap vaker bekeken en opgepakt? Met deze informatie kunnen beslissingen over het plaatsen van producten in productschappen data-gedreven gemaakt worden. Ook hierbij kan er geëxperimenteerd worden met verschillende schapindelingen om een gefundeerde beslissing te maken.

Uiteraard moet bij het gebruik van computervisie in camera’s de privacywetgeving in acht genomen worden. Persoonlijke informatie mag niet zonder toestemming worden opgeslagen en het laatste dat je als winkelier wil, is winkelbezoek dat uitblijft uit privacyoverwegingen. Door alleen de vastgestelde leeftijds- en geslachtsdata op te slaan, en niet het geregistreerde gezicht, voorkom je dat data te herleiden is naar een persoon en is er geen sprake van privacygevoelige data.

Vraagvoorspelling met machine learning

Accurate vraagvoorspelling is belangrijk voor elke retail onderneming. Een te hoge voorspelling leidt tot meer kapitaal in voorraden en hogere opslagkosten dan nodig. Een te lage voorspelling leidt tot nee-verkoop aan klanten. Daarnaast geeft een goede vraagvoorspelling de mogelijkheid om een goede budgettering te maken. Het maken van een goede voorspelling is echter niet makkelijk. Veel variërende factoren, van weerschommelingen, concurrentie, beschikbaarheid (online/offline), type winkel tot nieuwe productreviews, hebben invloed op of klanten wel of niet naar je winkel komen en een aankoop doen.

Het voorspellen van vraag wordt al tijden gedaan met traditionele statistische methodes, zoals bijvoorbeeld time series analysis. Vaak zijn deze methodes geschikt voor bedrijven die opereren in een stabiele markt en producten verkopen met een lange levenscyclus. Een nadeel van deze methodes is dat ze uitsluitend gebaseerd zijn op historisch verkoopdata en ervan uitgaan dat iets wat in het eerste jaar gebeurd is, zich zal herhalen in jaar twee. Ze zijn minder geschikt voor een dynamische markt en niet geschikt voor het voorspellen van vraag naar nog niet eerder verkochte producten.

Voorspelmodellen met machine learning zijn gebaseerd op statistisch modellen, maar kunnen gebruik maken van aanvullende interne en externe databronnen (bijvoorbeeld weerdata, economische indicatoren, social media reviews etc.). Ze passen complexe algoritmes toe die meer dan alleen lineaire verbanden kunnen ontdekken. In plaats van een eenmalige voorspelling aan het begin van het jaar, kunnen machine learning modellen automatisch opnieuw getraind worden en zich aanpassen bij veranderende omstandigheden.

Conclusie

Ook in de fysiek retail is het dus mogelijk om grote hoeveelheden klantendata te verzamelen. In dit artikel hebben we slechts een deel van de data science mogelijkheden met deze data gepresenteerd. We zijn ervan overtuigd dat het toepassen van data science ook in de fysieke retail een enorme meerwaarde kan creëren! Neem contact met ons op over de mogelijkheden voor jouw organisatie!

Geschreven door

Download de
voorbeeld case.

    *