©pixabay
Author profile picture

Eindhovense datawetenschappers zijn erin geslaagd om het te verwachten aantal nieuwe besmettingen en doden aan het coronavirus voor de nabije toekomst te voorspellen. Zij doen dit door populatiegroeimodellen los te laten op wereldwijde data over Covid-19.

Voor de vier landen met het hoogste aantal besmettingen – China, Zuid-Korea, Iran en Italië – is een nauwkeurige voorspelling mogelijk van één tot drie dagen vooruit. Voor Zuid-Korea en Iran kunnen ze bovendien al het maximaal aantal infecties schatten. Op korte termijn wordt dit ook mogelijk voor landen als Nederland en de Verenigde Staten. Op de website van TU/e verschijnt de komende dagen telkens een update van de laatste voorspellingen.

Het aantal infecties en doden China blijft de komende dagen stabiel, volgens de onderzoekers. In Iran en Zuid-Korea begint de groei in aantal infecties de komende dagen af te vlakken. Het uiteindelijke maximum voor Zuid-Korea en Iran schatten de onderzoekers momenteel op respectievelijk ruim 8.800 en 10.000 besmettingen. In Italië zet de forse stijging naar verwachting verder door, met een voorspeld totaal aan infecties na vandaag van bijna 12.000 (18% meer dan gisteren) en liefst 850 doden (34% toename sinds gisteren).

We zijn data scientists, hier moesten we iets mee

“Wereldwijd zijn onderzoekers bezig de groei van coronabesmettingen te analyseren, maar het daadwerkelijk doen van nauwkeurige voorspellingen is vrij lastig”, stelt Edwin van den Heuvel, hoogleraar statistiek aan de TU Eindhoven. Samen met twee collega’s laat hij zijn kennis van statistiek en groeicurves los op de coronadata om deze zeer gewilde berekeningen te maken. “We zijn data scientists, hier moesten we iets mee.”

Het lijkt misschien triviaal om de lijn van besmettingen door te trekken, maar volgens Van den Heuvel komt hier echt wel het nodige bij kijken. “De vraag is steeds wanneer de toename gaat afvlakken, waar zit het maximum?”

Ook voor Nederland

Voor China, Zuid-Korea en Iran zijn ze nu in staat een inschatting te maken voor het aantal nieuwe besmettingen door het virus voor de eerstvolgende drie dagen, met een nauwkeurigheid van ruim 81%. Voor Italië lukt dit vooralsnog één dag vooruit, met meer data kan verder in de toekomst worden gekeken. Van den Heuvel verwacht dat hij binnen enkele dagen ook voor landen als Verenigde Staten en Nederland genoeg betrouwbare data heeft om dit te doen.

“We blijven ons model verbeteren, zodat we nog verder en nauwkeuriger vooruit kunnen voorspellen”, zegt van den Heuvel. Ook gaan ze kijken naar het effect van maatregelen en de opbouw van de bevolking in China. “Hiermee hopen we sneller te kunnen voorspellen waar het maximum zit, zodat we weten hoeveel mensen er in totaal besmet zullen raken of overlijden als gevolg van het virus”, aldus van den Heuvel. “Ook hopen we hiermee inzicht te krijgen welke factoren het aantal besmettingen en doden beinvloeden.”

Populatiemodellen Verhulst

Van den Heuvel baseerde zich op de beroemde logistische functie, ontwikkeld door de Belgische wiskundige Pierre Francois Verhulst rond 1845. Deze functie beschrijft hoe een populatie groeit door de tijd, en heeft een S-vorm: in het begin groeit de bevolking langzaam, gevolgd door een steeds sterker wordende stijging, die vervolgens afvlakt tot een maximum.

Dit populatiemodel pasten ze eerst toe op de data uit China. “Het totaal aantal besmettingen voor iedere provincie in China bleek heel precies die logistische groei te volgen”, zegt van den Heuvel. Met de Chinese data konden ze zodoende hun voorspellingsmodel kalibreren, om vervolgens onderschattingen voor het maximaal aantal nieuwe besmettingen en doden in andere landen te corrigeren. “Die voorspellingen bleken goed te kloppen voor Iran, Italië en Zuid-Korea.”

Lees hier de verhalen uit ons dossier over innovatie rond het coronavirus.