WAT DATA SCIENCE
VOORAL NIET IS.

Onze collega Albert de Roos gaf zijn visie op het artikel ‘Five Misconceptions about Data Science’. “Een leuk artikel over wat data science is, en wat het niet is”, aldus Albert. Hieronder beschrijft hij zijn belangrijkste vijf learnings uit het artikel.

  1. Data science wordt vaak verward met Big Data, maar je kunt ook zonder ‘Big’ data aan data science doen.
  2. Ondanks dat algoritmes kunnen leren, het blijven simpele rekentools zonder daadwerkelijke intelligentie, vaak is het meer een ‘brute force’ methode waar alle mogelijkheden worden doorgerekend.
  3. Niet in alle data zit waarde, patronen die er niet zijn, zijn er ook niet uit te halen en het blijft vaak een kansberekening.
  4. Het vak data science bestaat niet uit een enkele rol maar er bestaan vele smaken (net ‘een IT-er’ ook niet zoveel zegt) en omvat data science alle data-gerelateerde rollen van data strategist tot neurale netwerk-programmeurs en projectleiders.
  5.  De grens tussen wetenschap en kunst is vaak maar dun, en naast het vaak hypothese-gedreven analyseren van data is ook creativiteit en inventiviteit uitermate belangrijk in data science.

Om wat dieper op het laatste punt in te gaan, het halen van nieuwe inzichten uit data is niet gemakkelijk. Het ‘science’ gedeelte uit data science staat er niet voor niets. Het is niet alleen het halen van een patroon uit de data, maar ook het kijken of het klopt wat je ziet en of je het kan relateren aan je vraagstelling. Het voorspellen met een bepaalde zekerheid op basis van een aantal kenmerken of een patiënt een vroeg stadium van Parkinson heeft, is relatief simpel. Het afleiden van welke kenmerken de feitelijke oorzaken zijn van Parkinson is veel moeilijker en hypotheses hierbij moeten getest worden. Het analyseren van zaken als bias, afhankelijkheden tussen kenmerken, foutieve en onvolledige gegevens, patroonherkenning is lastig en vergt inzicht in het specifieke domein (bijvoorbeeld geneeskunde) en een degelijke wetenschappelijke instelling. In die zin, is het belangrijk om data science meer inzichtelijk te maken voor de functionele rollen binnen een bedrijf en een goede mix te hebben van expertises in data science projecten.

 Lees hier het artikel Five Misconceptions about Data Science