Mijn naam is Albert de Roos en ik ben al drie jaar werkzaam bij Data Science Lab. Ik ben mijn carrière begonnen in de wetenschap, daarna lang in de ICT gewerkt en heb veel met data en techniek gewerkt. Ik woon in Amsterdam, heb twee kinderen en ik houd er een redelijk druk sociaal leven op na.

Waar heb je gewerkt voordat je bij Data Science Lab begon? 

Ik ben begonnen als Java-programmeur maar ben al vrij snel via testwerkzaamheden bij de functionele kant van de ICT beland, met een nadruk op de gezondheidszorg. Vanuit de inhoudelijke kennis van de zorgsector ben ik samen met een businesspartner een eigen IT-bedrijf begonnen waar wij producten voor het berichtenverkeer in de zorg leverden. Bij CSC (het huidige DXC) ging het naast berichtenverkeer ook over het ‘elektronisch patiëntendossier’ en de integratie hiervan in de andere informatiesystemen. Bij Elsevier ben ik weer meer met data science in aanraking gekomen, voornamelijk tijdens het halen van geautomatiseerde informatie uit ongestructureerde data. Ik kreeg daar de mogelijkheid om ook de technische aspecten van data science te leren. Vervolgens heb ik de overstap gemaakt naar Data Science Lab om mij verder op data science te gaan richten.

Wat zijn de werkzaamheden als ‘Principal Consultant’ bij Data Science Lab en wat vind jij persoonlijk het meest interessant hiervan? 

Als Principal Consultant ben ik vooral verantwoordelijk voor de goede uitlijning van projecten op de vraagstelling bij klanten. De voornaamste vraag is; hoe gaan wij waarde voor opdrachtgevers creëren met behulp van data science? Aangezien data science als relatief nieuw vakgebied wordt gezien, merken wij ook dat ‘weten wat data science is’ en ‘het kunnen vertalen van business vraagstukken naar data science’ een belangrijk onderdeel is van de werkzaamheden. In dit kader geef ik ook inspiratiesessies en data science workshops voor onze opdrachtgevers. Hiernaast ben ik betrokken bij het maken van projectvoorstellen en het helpen vorm te geven van business cases.

Hoe voer je de werkzaamheden in de huidige situatie uit? 

Ik kan veel van mijn werkzaamheden vanuit huis doen in deze lastige tijd. Wel mis ik het spontane bakje koffie tussen de projectbesprekingen door, zonder daar eerst een vergadering voor in te hoeven plannen. Gelukkig weten steeds meer collega’s en partners de informelere communicatie, via chat of een ad hoc Teams-call, te vinden. Recentelijk zijn we ook weer begonnen met het geven van cursussen op kantoor, waar meestal ook een aantal collega’s een gedeelte van verzorgen. Het normale contact begint dus weer op gang te komen.

Wat is binnen jouw huidige project de grootste technische uitdaging? 

Ik zie als ‘grote technische uitdagingen’ vooral om goede voorspelmodellen te maken waar de business ook echt iets aan heeft. Dat begint natuurlijk met het definiëren wat ‘goed’ exact inhoudt. Ook met semi-geautomatiseerde systemen en uitgecodeerde beslisregels kunnen wij vaak al vrij goede voorspellende analyses doen. Met data science verwachten wij dat wij de kwaliteit hiervan kunnen verhogen. Afgezien hiervan zijn er ook technische problemen om de voorspelmodellen goed in productie te krijgen en te integreren in de operationele systemen van de klant.

Wat is volgens jou de grootste misvatting van data science? 

De grootste misvatting is dat data science slechts een techniek is die gemakkelijk valt te implementeren. Voor het goed kunnen begrijpen van zowel de vraagstelling als de resultaten is een goede domeinkennis nodig. Hiernaast vind ik dat het woord ‘science’ in data science niet onderschat moet worden. Hierin zijn vele fouten te maken en aannames dienen goed onderzocht te worden. Dat betekent dat je toch vaak onderzoekend bezig moet zijn met een wetenschappelijke insteek.

Hoe zie jij data science over 10 jaar? 

Data science zal zichzelf grotendeels automatiseren; je ziet nu al mogelijkheden dat je algoritmes eenvoudig kunt aanvinken wanneer je ze wilt toepassen op een dataset. De nadruk zal komen te liggen op het goed gebruiken van de dan aanwezige tools. Algoritmes voor bijvoorbeeld een chatbot hoeven niet meer specifiek ontwikkeld te worden, maar voornamelijk gevoed te worden met de juiste documenten en data. Voor de rest verwacht ik dat bedrijven zonder goede datastrategie achter zullen lopen op de concurrentie en zal de ‘Chief Data Officer’ verder in opkomst komen.

Welk probleem zou jij ooit nog willen oplossen middels data science? 

Graag zou ik een bijdrage leveren bij het opsporen en behandelen van kanker of andere ziekten. Data Science Lab voert al projecten uit binnen de medische wetenschap voor de verbetering van de gezondheidszorg. Het behalen van goede resultaten in dergelijke onderzoeken is natuurlijk de eindstreep.

Meer collega's ontdekken