Robert werkt als Lead Data Scientist bij Data Science Lab. Daarnaast houdt hij zich vooral bezig met zijn twee dochters (6 en 3) en dingen als Braziliaans jiujitsu, literatuur, filosofie, natuur, geschiedenis en klussen.

 

Waar heb je gewerkt voordat je bij Data Science Lab startte?

Lange tijd (10 jaar) bij ING: eerst als database marketing analist/consultant, later als data scientist. Daarvoor werkte ik nog in de BI, software development en E-learning (leerzaam avontuur met eigen onderneming). Ik heb als studie Kunstmatige Intelligentie gedaan, dus wel leuk dat ik daar, na vele jaren, toch nog in mijn werk bij terug ben gekomen. Dit heeft toch de diepgang en veelzijdigheid die ik bij andere banen wel miste.

 

Wat zijn de werkzaamheden als ‘Lead data scientist’ bij Data Science Lab en wat vind jij het meest interessant hiervan?

De meeste tijd besteed ik aan projecten voor de klant: grotendeels mijn vaste ‘eigen’ opdracht en daarnaast af en toe workshops, brainstorms, meedenken bij andere opdrachten. Daarnaast werk ik natuurlijk aan de doorontwikkeling van Data Science Lab en de collega’s. Als lead ben ik het ‘technisch geweten’ van DSL en verantwoordelijk voor de inhoudelijke werkwijze en ontwikkeling. Denk hierbij bijv. aan templates voor Python-projecten en cloud deployment, coaching, bloggen, code reviews, organiseren van tech days en collega’s lastigvallen met links naar interessante blogs. Oja: en heel veel sollicitatiegesprekken!

Het interessantst, maar ook meest uitdagende hieraan is de vraag hoe je een diverse groep jonge en soms eigenwijze mensen vooruit kunt helpen met je eigen kennis en ervaring, op een manier die aansluit bij hun eigen referentiekader en affiniteiten.

 

Hoe voer je de werkzaamheden in de huidige situatie uit?

Veel met Teams… In het begin veel benadrukken dat iedereen op mute moet wanneer ze niet aan het woord zijn en zelf oortjes in om echo’s te voorkomen. Screen sharing is ook handig. Het technische werk is verder prima op afstand te doen. Thuis is het soms wel een uitdaging om werk en kinderen te combineren, al loopt dat inmiddels soepeler dan de eerste week. Aan alles is wel een mouw te passen natuurlijk, maar op lange termijn is de fysieke isolatie niet echt houdbaar.

 

Wat is binnen jouw huidige project de grootste technische uitdaging?

Een model ontwikkelen dat een rioolwaterzuivering simuleert, o.b.v. deels ontbrekende en soms ernstig vervuilde data, en daar vervolgens een deep reinforcement learning agent op trainen om de besturing ervan te optimaliseren. Hierbij experimenteren we met state-of-the-art technieken. Dit is erg interessant, maar ook moeilijk om tot een werkend geheel te krijgen.

 

Wat is volgens jou de grootste misvatting van data science?

Zet wat data scientists in een hok zonder iets aan de organisatie en processen te veranderen en hoop vervolgens op wonderen. En ja, natuurlijk zijn er goede voorbeelden van stand-alone data science oplossingen die zonder enige disruptie succesvol ingezet zijn, maar in de regel zal een organisatie moeten ontwikkelen o.h.g.v. digitale processen en data-gedreven werken om van kelder-experiment tot structurele impact te komen. Oh, en de misvatting dat je advies zou moeten halen bij Gartner… Vroeger ook wel dingen gehoord als: “We moeten meer ongestructureerde data hebben want dan kunnen we big data doen”, of “We hebben een Hadoop cluster nodig zodat we neurale netwerken kunnen trainen

 

Hoe zie jij data science over 10 jaar?

Als ik de dystopische ontwikkelingen rond het gebruik van AI voor massa-monitoring en totalitaire controle door overheden en corporaties even buiten beschouwing laat, dan denk ik dat de data scientist unicorn zoals we die nu zien langzaam zal verdwijnen. Niet zozeer door slimme tools, maar doordat competenties op het gebied van machine learning, business consultancy, engineering etc. minder in een en dezelfde rol vervat zullen zitten. Een beetje meer specialisatie dus, maar ook meer menging van data science capaciteiten binnen een specifiek domein. Maar nog concreet:

  • de ‘pure’ data science zal iets meer commodity worden met out-of-the-box werkende oplossingen, terwijl engineering en consultancy belangrijker worden
  • de komende jaren zullen met name de manufacturing, utility & agriculture sectoren grote sprongen gaan maken

 

Welk probleem zou jij ooit nog willen oplossen middels data science?

Ik geloof niet zozeer in een AI-toepassing die de wereld gaat redden. De zorgwekkende schaalgrootte van AI-toepassingen van tech giants en overheden, en de machtscentralisatie die daaruit ontstaat, zijn wat mij betreft niet het goede voorbeeld. Uiteindelijk zie ik liever dat data science wordt gebruikt als hulpmiddel van de mens i.p.v. als vervanging van de mens. De menselijke maat moet terug. Dus ik help liever MKB, grootbedrijf en nutsbedrijven om gewone dingen beter te doen. Dat is een heilzamere weg dan met blind idealisme een monster van Frankenstein te creëren.

Maar wat me wel nog erg gaaf lijkt is om geschiedenis visueel te maken door informatie uit oude boeken en geschriften te halen en met beelden tot leven te wekken. Zoiets, of gewoon zorgen dat de treinen op tijd gaan rijden.

Meer collega's ontdekken