Hé ik ben Kim! Een foodie die ook zelf graag kookt en bakt! De Aziatische keuken is mijn specialiteit en favoriet! Daarnaast vind ik het ik het leuk om feestjes te organiseren en zit daarom ook niet voor niets in de feestcommissie van Data Science Lab. 😉

Waar heb je gewerkt voordat je bij Data Science Lab begon? 

Ik heb Bio-informatica gestudeerd in Groningen. Deze studie heeft als basis data science elementen, maar dan gericht op het biomedisch gebied. Mijn afstudeerstage heb ik gedaan bij Agendia (spin-off van het Nederlands Kanker Instituut). Hier heb ik bijgedragen aan een classificatiemodel dat aan de hand van aanwezigheid van bepaalde genen kon voorspellen welke type therapie/medicijn het beste toegepast kan worden aan een specifiek groep darmkankerpatiënten. Na mijn afstuderen heb ik hier nog 1,5 jaar gewerkt aan een aantal darmkankeronderzoeksprojecten voordat ik bij Data Science Lab terecht kwam.

Wat zijn de werkzaamheden als ‘Data Scientist’ bij Data Science Lab en wat vind jij persoonlijk het meest interessant hiervan? 

Dit verschilt per opdrachtgever. Zo ben ik begonnen met het ontwikkelen van een datasysteem voor aantal arts-onderzoekers zodat er één centrale plek is om de data op te slaan. Voor een andere klant maak ik dashboards om bijvoorbeeld trends te volgen of ben ik bezig met de ontwikkeling van een voorspelmodel. Het leukste hieraan is natuurlijk dat je bij ieder project nieuwe technieken leert en minder bekende markten verkent. Daarnaast vind ik de interactie met de opdrachtgevers belangrijk om te achterhalen wat ze precies willen en welk doel ze willen bereiken.

Hoe voer je de werkzaamheden in de huidige situatie uit? 

Ik werk voornamelijk thuis en dat bevalt beter dan dat ik had verwacht. Ik heb een aparte ruimte in huis ingericht als werkplek. Zo nu en dan werk ik vanuit het kantoor van Data Science Lab of dat van de opdrachtgever. Voor de rest verloopt alle communicatie via Teams.

Wat is binnen jouw huidige project de grootste technische uitdaging? 

Ik ben dit op dit moment met mijn collega Job bezig om een model te ontwikkelen waarbij wij als input de reviews van patiënten over de apotheek gebruiken om het onderwerp van de review te voorspellen. Deze data is niet gelabeld waardoor het lastig is om er een specifiek onderwerp aan te hangen. Het optimaliseren van dit model kost veel tijd daarom zijn we aan het experimenteren met andere methodes om dit te verbeteren. Daarnaast ben ik ook bezig om een aantal Excel rapportages om te zetten naar Power-BI zodat er niet elke maand knip-en-plak werk verricht hoeft te worden. Dit is nog best lastig omdat de data een bepaald format moet hebben die niet overeenkomt met de originele bron.

Wat is volgens jou de grootste misvatting van data science? 

Dat sommige bedrijven vaak niet weten wat er met de term ‘Data Scientist’ bedoeld wordt. Ze zoeken vaak iemand die een combinatie is van data analist, data engineer, statistici, programmeur, iemand die goed is in story telling en ook in staat is om zijn/haar bevindingen goed te presenteren. Organisaties verwachten eigenlijk van één persoon dat ze een expert moeten zijn van het hele data domein. Terwijl dit eigenlijk aparte functies zijn.

Hoe zie jij data science over 10 jaar? 

Ik denk dat er over 10 jaar tools bestaan die sommige bedrijfsprocessen kunnen automatiseren. Taken zoals data preparatie, data transformaties en juiste algoritme selecteren kost vaak uitzoekwerk en daardoor tijd. Met de tools tegen die tijd kunnen ontwikkelde algoritmes automatisch worden toegepast. Ook denk ik dat zelfrijdende auto’s over 10 jaar al grote stappen hebben gemaakt. Bijvoorbeeld een verbetering in de sensorische input die door middel van machine learning-algoritmen zijn geïnstalleerd in de auto om op verschillende verkeerssituaties te kunnen reageren.

Welk probleem zou jij ooit nog willen oplossen middels data science? 

Ik zou het gaaf vinden als ik mee kan werken aan een simulatiemodel die bij een geneesmiddel kijkt naar hoe het zal gaan reageren in het lichaam en vervolgens de mate van succes daarvan voorspelt. De simulatie kan dan de werkzaamheid van het geneesmiddel testen. Dit kan bijdragen aan de kosten en tijd van medicijnontwikkeling en ook de mogelijke risico’s hiervan verminderd.

Meer collega's ontdekken