Ik ben Gijs, data engineer bij Data Science Lab en op dit moment werk ik samen met mijn collega Swetta aan een project voor ProRail. Mijn grootste hobby’s zijn dansen (dancehall) en koken (ik ben de zelfbekroonde keukenprins van de Lage Landen, @foodgissa) en verder ga ik graag naar festivals en de sportschool.

Waar heb je gewerkt (of studie) voordat je bij Data Science Lab. begon? 

Ik heb econometrie gestudeerd aan de UvA. Tijdens mijn studie heb ik stage gelopen bij Milliman Pensioenen en KPMG. Ook ben ik 1,5 jaar werkstudent geweest bij AIMMS, een bedrijf dat prescriptive analytics software maakt. Mijn afstudeerstage heb ik gedaan op de data science afdeling bij TNO. Tijdens het afstuderen werd ik benaderd door Data Science Lab en het voelde meteen als een goede match, dus ik heb nergens anders meer gesolliciteerd!

Wat zijn de werkzaamheden als ‘data engineer’ bij Data Science Lab en wat vind jij persoonlijk het meest interessant hiervan? 

Ik houd mij graag bezig met prepareren van data voor analyses en het in productie brengen van dataproducten in de cloud. Het meest interessant hieraan vind ik het aanbrengen van structuur in data en het ontdekken van alle automatiseringsmogelijkheden die de cloud brengt.

Hoe voer je de werkzaamheden in de huidige situatie uit? 

Het thuiswerken bevalt mij eigenlijk best goed! Ons werk voor de opdrachtgever wordt gelukkig weinig gehinderd door het thuiswerken. Daarnaast waardeer ik de vrijheid om je eigen dag in te delen en heb ik nog steeds genoeg sociaal contact gedurende de werkdag door de videogesprekken.

Wat is binnen jouw huidige project de grootste technische uitdaging? 

Het werken met megagrote datasets van treinmetingen! Hiervoor programmeren we in PySpark op het Databricks platform, wat minder vrijheid biedt dan programmeren in Python en regelmatig onduidelijke errors kan geven. Dit vergt een andere werkwijze, wat best even wennen is maar erg leerzaam!

Wat is volgens jou de grootste misvatting van data science? 

Dat machine learning modellen automatisch zichzelf verbeteren. Het is zeker mogelijk om dit te implementeren, maar het zit niet standaard “inbegrepen” in een model. Hiervoor moet er nog best wat extra werk worden verricht.

Hoe zie jij data science over 10 jaar? 

Ik denk dat data engineering een steeds groter gedeelte zal gaan vormen van het data science vak. Ik ben zelf ook begonnen als data scientist bij DSL. Tijdens mijn eerste maanden zag ik dat Google een ‘auto machine learning’ model had uitgebracht, een model dat de parameters van andere machine learning modellen kan optimaliseren. Toen dacht ik: “Wordt míjn vak nu ook al weggeautomatiseerd?!”, haha! Door dit soort ontwikkelingen verwacht ik dat het creëren van machine learning modellen steeds minder werk kost en dat de focus meer zal komen te liggen op de implementatie ervan.

Welk probleem zou jij ooit nog willen oplossen middels data science? 

Dat Spotify zodra het overgaat op automatisch gegenereerde afspeellijsten bij mij altijd nummers van Nina Nesbitt gaat afspelen. Haar muziek is niet mijn favoriet en zal het ook niet snel worden 😉.

Meer collega's ontdekken