Recommender
systems.

Waarom zijn recommender systemen één van dé succesverhalen op het gebied van AI en machine learning? Deze systemen bieden voor zowel de organisatie als de klant toegevoegde waarde. Als organisatie krijg je informatie over de voorkeuren en het gedrag van je klanten, tevens zal de klanttevredenheid stijgen bij een goed werkend recommender systeem. Voor de klant is het fijn dat de juiste content of producten worden aangeboden die naadloos aansluiten op de behoeftes. Kortom, een goed recommender systeem is een win-win voor de aanbieder en de gebruiker.

Tijdens onze TechDay werkten wij aan een recommender systeem dat aan de hand van metadata en user reviews, aanbevelingen genereerde voor boeken gericht op zowel bekende als nieuwe gebruikers. De opdracht was om vooral de creativiteit te laten gaan en gebruik te maken van verschillende technieken. Denk hierbij aan ‘content-based filtering’ met behulp van de metadata of het gebruik van ‘collaborative filteringen’ op de boekwaarderingen. Voor content-based filtering worden bijvoorbeeld diverse eigenschappen met elkaar vergeleken via de stappen; datapreparatie op titels van boeken door middel van TF-IDF; het berekenen van de gelijkheid tussen verschillende boeken met behulp van ‘cosine simularity’ of ‘euclidian distance’; het sorteren op deze gelijkheden. Vervolgens kan voor elk boek een X aantal soortgelijke boeken gevonden worden gebaseerd op deze gelijkheden.

Om uiteindelijk tot aanbevelingen te komen aan de hand van de boekwaarderingen kan collaborative filtering worden gebruikt in de vorm van ‘matrix factorisatie’. Het doel van matrix factorisatie is om waarderingen te voorspellen van content dat nog niet aan de gebruiker is vertoond. Hiervoor heb je de zogenaamde ‘user-item matrix’ nodig. Deze kan vervolgens aan de hand van verschillende algoritmen, bijvoorbeeld de ‘singular value decomposition’ of ‘stochastic gradient descent’, uitgesplitst worden in twee of drie kleinere matrixen. Door deze kleinere matrixen met elkaar te vermenigvuldigen krijg je voor de missende waardes een voorspelde waardering. Deze waarderingen kunnen vervolgens gesorteerd worden en de items met de hoogst voorspelde waardering worden vervolgens aanbevolen aan de gebruiker.

Uiteindelijk hebben onze collega’s variërende en interessante systemen ontworpen die in de TechDay van september naar productie zullen worden gebracht. Op deze manier blijft het niet alleen bij concept maar doorlopen wij de volledige cyclus van recommender systems.

Geschreven door

Mark Vermeer

Data scientist
mark.vermeer@datasciencelab.nl

Vragen over onze techday?

    *