Biostatistiek versus machine learning: van traditionele predictiemodellen naar geautomatiseerde medische analyse

Maartje Valkema, Hester Lingsma, Philippe Lambin, J. Jan B. van Lanschot

Research output: Contribution to journalArticleAcademicpeer-review

6 Downloads (Pure)

Abstract

Machine learning wordt steeds meer toegepast op medische gegevens om klinische predictiemodellen te ontwikkelen. In dit artikel wordt de plaats van machine learning ten opzichte van de
meer traditionele biostatistische aanpakken besproken.
Biostatistiek is vooral bruikbaar bij gestructureerde databestanden. De selectie van variabelen
voor een biostatistisch predictiemodel berust primair op een kennisgedreven aanpak. Bij machine
learning is een vergelijkbare werkwijze mogelijk, maar machine learning biedt ook mogelijkheden
om ongestructureerde databestanden te analyseren, zoals van medische beeldvorming als van
teksten uit patiëntendossiers. Het selecteren van variabelen berust daarbij vooral op een datagedreven aanpak.

Complexe machine learning modellen maken het mogelijk om niet-lineaire verbanden en interacties
in de data te detecteren. Dit vereist echter grote databestanden om overfitting te voorkomen. Net
als in de biostatistiek is bij machine learning externe validatie belangrijk om de bruikbaarheid van
een ontwikkeld predictiemodel in een vergelijkbare setting te testen.
Machine learning modellen zijn lastig te implementeren in de klinische praktijk, omdat ze worden
beschouwd als black boxes (d.w.z. niet-intuïtieve modellen). Ter verbetering hiervan zijn onderzoeksinitiatieven gaande op het gebied van explainable artificial intelligence.
Tot slot wordt als voorbeeld de toepassing van machine learning besproken bij de geautomatiseerde
analyse van medische beeldvorming en de ontwikkeling van klinische beslishulpen.
Original languageDutch
Pages (from-to)558-568
Number of pages11
JournalTijdschrift voor geneeskunde en gezondheidszorg (TVGG)
Volume7
Publication statusPublished - 31 Mar 2021

Cite this