Olympia automatisch matchen van kandidaten?

Olympia is een grote speler binnen de uitzendbranche. Dagelijks koppelen zij ruim 15.000 mensen aan passend werk van betekenis.

Doel

Olympia is druk bezig om een deel van het matching proces te automatiseren door middel van een tool.  Deze tool is basaal en er vindt maar zelden automatische “matching” plaats.

De tool berekent per vacature-kandidaat combinatie een score. Alleen combinaties met de hoogste scores worden aan een kandidaat weergegeven. De scores zijn opgebouwd uit een som van overeenkomende kenmerken tussen vacature en kandidaat, vermenigvuldigd met een bijbehorend gewicht en zien er ongeveer als volgt uit >

Ranking_Score = a * Matchend_opleiding + b * Matchend_Rijbewijs + c * Matchend_Interesse + ….

De gewichten (“a”, “b”, “c”, etc.) worden hierbij handmatig ingevoerd.

Om zowel kandidaten beter en sneller van dienst te kunnen zijn als om intercedenten zeeën van tijd te besparen kwam de vraag naar voren: is voor deze matching geen data-gedreven oplossing mogelijk?

Aanpak

Allereerst zijn er functies geschreven om alle mogelijke variabelen (overeenkomsten tussen kandidaat en vacature) van de tool te kunnen bepalen, waarna de waardes hiervan zijn opgeslagen in een aparte database tabel. Vervolgens zijn historische kandidaat-vacature matches gelabeld met waarde “1” en afwijzingen met waarde “0”.

Om de kans op plaatsing te modelleren is op deze data een logistic regression model getraind. Na training zijn de gewichten bij de matching criteria overgenomen en ingevuld in de tool.

Deze nieuwe oplossing is tijdelijk online gezet en geëvalueerd op basis van het aantal plaatsingen dat hieruit naar voren kwam en de sollicitatie-plaatsing conversie.

Resultaat

Na het online zetten van de nieuwe oplossing bleek er weinig verschil in prestatie te zitten tussen de eerdere aanpak en de data-driven oplossing. Na verder onderzoek, met als doel om hiervoor een verklaring te vinden, is aangetoond dat een aantal processen waaruit de data is gehaald niet helemaal correct gevolgd werden. Voordat verder gegaan kan worden met een data-gedreven oplossing is daarom geadviseerd om deze processen eerst intern te verbeteren. Vanuit daar kunnen we vervolg stappen zetten.