Hoi, ik ben Sidney, 24 jaar en data scientist bij Data Science Lab. Mijn huidige project is bij Fokker Services, een restant van het voormalige Fokker Aircraft, waar ik nu meer dan een jaar aan diverse projecten heb mogen werken. Fokker onderhoudt, modificeert en repareert vliegtuigtoestellen en gevechtsvliegtuigen van diverse luchtmachten. Naast Fokker werk ik op de Lab-dagen aan diverse interne projecten, die naast de ontwikkeling van onze organisatie, ook erg leerzaam zijn. Naast mijn werk programmeer ik graag aan persoonlijke hobbyprojectjes. Ook sta ik graag in de keuken om te experimenteren met nieuwe recepten.

Waar heb je gewerkt voordat je bij Data Science Lab begon? 

Ik heb de Master Data Science en Bachelor Informatiekunde aan de UvA afgerond. Tijdens de Master heb ik mijn afstudeeropdracht gedaan bij de startup Grasple. Zij beheren een online platform waarop studenten wiskunde en statistiek leren door middel van opdrachten. Mijn project bestond uit de ontwikkeling van een model dat antwoorden op open vragen goed of fout keurden. Na deze Master heb ik daar ook nog een half jaar als data scientist gewerkt, voordat ik bij Data Science Lab terecht kwam.

Wat zijn de werkzaamheden als ‘Data Scientist’ bij Data Science Lab en wat vind jij persoonlijk het meest interessant hiervan? 

Mijn werkzaamheden als data scientist zijn erg divers: naast het ontwikkelen van modellen werk ik aan analyses en visualisaties, interactieve dashboards, API’s, maar ook de data engineering. Zelf vind ik het ontwikkelen van modellen de meest interessante uitdaging, omdat dit één grote puzzel is van data en parameters. Om uiteindelijk zo’n puzzel op te kunnen lossen en daarmee een bijdrage te leveren aan een organisatie geeft mij veel voldoening. Naast al deze ‘technische’ skills zijn ook de sociale aspecten en business consultancy voor mij erg belangrijk. Je bent meer dan alleen een code-monkey, je moet ook goed kunnen communiceren met de eindgebruikers en de behoefte, wensen en doelen omzetten in een werkende oplossing.

Wat is binnen jouw huidige project de grootste technische uitdaging? 

In mijn huidige projecten is de grootste uitdaging de beschikbaarheid en kwaliteit van de data. De originele datastructuur was niet ingericht op het idee van een data science afdeling als gebruiker. Gelukkig zijn wij stapsgewijs bezig om middels realistische kleine een eigen omgeving te realiseren waar wij zelf van alles kunnen toevoegen en weghalen. Ondanks deze stappen zijn er nog steeds hoeveelheden aan belangrijke data nog niet gecentraliseerd, omdat deze bijvoorbeeld staan in PDF-, Excel-, of acces bestanden. Hier zijn gelukkig mooie advanced analytics technieken voor om deze data om te zetten naar bruikbare kwalitatieve data. Hier gaan wij de komende tijd mee aan de slag.

Wat is volgens jou de grootste misvatting van data science? 

Een grote misvatting is dat veel mensen data science zien als een magische ‘black box’ die elk probleem foutloos kan oplossen. Vaak wordt er niet nagedacht over de benodigde data, en wordt een model niet vertrouwd als het niet 100% correcte voorspellingen maakt. Dit terwijl de mensen die eerst de voorspellingen deden natuurlijk ook fouten maakten en het model het uiteindelijk wel beter doet. Het is dan ook een belangrijke taak om alle twijfels, vragen en de mystiek van het model weg te nemen, omdat je uiteindelijk wel het vertrouwen van je gebruikers nodig hebt.

Hoe zie jij data science over 10 jaar? 

Ik denk dat een data scientist over 10 jaar bijna geen data processing meer hoeft te doen en waarschijnlijk ook niet meer zelf aan modellen hoeft te sleutelen. AutoML platformen zullen dit werk automatisch doen. Hierdoor zal het werk van een data scientist steeds meer mens-gedreven worden in de vorm van het definiëren van een probleem en de interpretatie van de output van het automatisch gegenereerde model. Hoewel je nu al de brug bent tussen het ‘magische’ model en de organisatie, zal deze rol alleen maar groter worden.

 

Welk probleem zou jij ooit nog willen oplossen middels data science? 

Het lijkt mij heel mooi om te werken aan een oplossing tegen voedselverspilling en dan vooral op supermarkt en productieniveau. Er belandt nog steeds veel eten in de container omdat er te veel wordt geproduceerd of ingekocht. Het zou gaaf zijn als een model de vraag naar producten zo kan voorspellen zodat er zo min mogelijk weggegooid hoeft te worden, maar natuurlijk ook zonder dat de schappen leeg raken. Ondanks dat dit een enorm lastige taak is lijkt met mij interessant om data science te gebruiken om maatschappelijke problemen op te lossen en de wereld een beetje beter te maken.

Meer collega's ontdekken