ยฉpixabay
Author profile picture

Eindhovense datawetenschappers zijn erin geslaagd om het te verwachten aantal nieuwe besmettingen en doden aan het coronavirus voor de nabije toekomst te voorspellen. Zij doen dit door populatiegroeimodellen los te laten op wereldwijde data over Covid-19.

Voor de vier landen met het hoogste aantal besmettingen โ€“ China, Zuid-Korea, Iran en Italiรซ โ€“ is een nauwkeurige voorspelling mogelijk van รฉรฉn tot drie dagen vooruit. Voor Zuid-Korea en Iran kunnen ze bovendien al het maximaal aantal infecties schatten. Op korte termijn wordt dit ook mogelijk voor landen als Nederland en de Verenigde Staten. Op de website van TU/e verschijnt de komende dagen telkens een update van de laatste voorspellingen.

Het aantal infecties en doden China blijft de komende dagen stabiel, volgens de onderzoekers. In Iran en Zuid-Korea begint de groei in aantal infecties de komende dagen af te vlakken. Het uiteindelijke maximum voor Zuid-Korea en Iran schatten de onderzoekers momenteel op respectievelijk ruim 8.800 en 10.000 besmettingen. In Italiรซ zet de forse stijging naar verwachting verder door, met een voorspeld totaal aan infecties na vandaag van bijna 12.000 (18% meer dan gisteren) en liefst 850 doden (34% toename sinds gisteren).

We zijn data scientists, hier moesten we iets mee

โ€œWereldwijd zijn onderzoekers bezig de groei van coronabesmettingen te analyseren, maar het daadwerkelijk doen van nauwkeurige voorspellingen is vrij lastigโ€, stelt Edwin van den Heuvel, hoogleraar statistiek aan de TU Eindhoven. Samen met twee collegaโ€™s laat hij zijn kennis van statistiek en groeicurves los op de coronadata om deze zeer gewilde berekeningen te maken. โ€œWe zijn data scientists, hier moesten we iets mee.โ€

Het lijkt misschien triviaal om de lijn van besmettingen door te trekken, maar volgens Van den Heuvel komt hier echt wel het nodige bij kijken. โ€œDe vraag is steeds wanneer de toename gaat afvlakken, waar zit het maximum?โ€

Ook voor Nederland

Voor China, Zuid-Korea en Iran zijn ze nu in staat een inschatting te maken voor het aantal nieuwe besmettingen door het virus voor de eerstvolgende drie dagen, met een nauwkeurigheid van ruim 81%. Voor Italiรซ lukt dit vooralsnog รฉรฉn dag vooruit, met meer data kan verder in de toekomst worden gekeken. Van den Heuvel verwacht dat hij binnen enkele dagen ook voor landen als Verenigde Staten en Nederland genoeg betrouwbare data heeft om dit te doen.

โ€œWe blijven ons model verbeteren, zodat we nog verder en nauwkeuriger vooruit kunnen voorspellenโ€, zegt van den Heuvel. Ook gaan ze kijken naar het effect van maatregelen en de opbouw van de bevolking in China. โ€œHiermee hopen we sneller te kunnen voorspellen waar het maximum zit, zodat we weten hoeveel mensen er in totaal besmet zullen raken of overlijden als gevolg van het virusโ€, aldus van den Heuvel. โ€œOok hopen we hiermee inzicht te krijgen welke factoren het aantal besmettingen en doden beinvloeden.โ€

Populatiemodellen Verhulst

Van den Heuvel baseerde zich op de beroemde logistische functie, ontwikkeld door de Belgische wiskundige Pierre Francois Verhulst rond 1845. Deze functie beschrijft hoe een populatie groeit door de tijd, en heeft een S-vorm: in het begin groeit de bevolking langzaam, gevolgd door een steeds sterker wordende stijging, die vervolgens afvlakt tot een maximum.

Dit populatiemodel pasten ze eerst toe op de data uit China. โ€œHet totaal aantal besmettingen voor iedere provincie in China bleek heel precies die logistische groei te volgenโ€, zegt van den Heuvel. Met de Chinese data konden ze zodoende hun voorspellingsmodel kalibreren, om vervolgens onderschattingen voor het maximaal aantal nieuwe besmettingen en doden in andere landen te corrigeren. โ€œDie voorspellingen bleken goed te kloppen voor Iran, Italiรซ en Zuid-Korea.โ€

Lees hier de verhalen uit ons dossier over innovatie rond het coronavirus.