(dit is een update van een artikel van vorige week)
In Italië en Iran stabiliseren de dagelijkse stijgingen van de verwachte Corona-infecties zich of groeien ze heel weinig, wat kan duiden op het begin van een afvlakking van de curve. Voor Spanje, dat na Italië het zwaarst getroffen land van Europa is, voorspellen onderzoekers een toename van 18 procent van de infecties, vergelijkbaar met wat ze zien in Frankrijk (+17 procent) en Nederland (+20 procent). De VS staat bovenaan de lijst: daar zal het aantal infecties naar verwachting met meer dan een kwart stijgen tot 5.849.
De voorspellingen komen voort uit een door Eindhovense datawetenschappers ontwikkeld model om het te verwachten aantal nieuwe besmettingen en doden aan het coronavirus voor de nabije toekomst te bepalen. Zij doen dit door in 1845 bedachte populatiegroeimodellen los te laten op wereldwijde data over Covid-19.
Voor de vier landen met het hoogste aantal besmettingen – China, Zuid-Korea, Iran en Italië – is inmiddels een nauwkeurige voorspelling mogelijk tot drie dagen vooruit. Bovendien is voor deze landen al het maximaal aantal infecties te schatten. Op korte termijn wordt dit ook mogelijk voor landen als Nederland, Spanje, Frankrijk en de Verenigde Staten. Voor Nederland wordt op dit moment telkens een dag vooruitgekeken. Op de website van TU/e verschijnt de komende dagen telkens een update van de laatste voorspellingen.
Het aantal infecties en doden China blijft de komende dagen stabiel, volgens de onderzoekers. In Iran en Zuid-Korea begint de groei in aantal infecties de komende dagen af te vlakken. Het uiteindelijke maximum voor Zuid-Korea en Iran schatten de onderzoekers momenteel op respectievelijk ruim 8.300 en 19.000 besmettingen. In Italië zet de forse stijging naar verwachting verder door, tot mogelijk 70.000 besmettingen. Dat is overigens minder dan een aantal dagen terug nog werd verwacht.
“We zijn data scientists, hier moesten we iets mee”
“Wereldwijd zijn onderzoekers bezig de groei van coronabesmettingen te analyseren, maar het daadwerkelijk doen van nauwkeurige voorspellingen is vrij lastig”, stelt Edwin van den Heuvel, hoogleraar statistiek aan de TU Eindhoven. Samen met twee collega’s laat hij zijn kennis van statistiek en groeicurves los op de coronadata om deze zeer gewilde berekeningen te maken. “We zijn data scientists, hier moesten we iets mee.”
Het lijkt misschien triviaal om de lijn van besmettingen door te trekken, maar volgens Van den Heuvel komt hier echt wel het nodige bij kijken. “De vraag is steeds wanneer de toename gaat afvlakken, waar zit het maximum?”
Voor China, Zuid-Korea, Iran, Italië en Spanje zijn ze nu in staat een inschatting te maken voor het aantal nieuwe besmettingen door het virus voor de eerstvolgende drie dagen, met een geclaimde nauwkeurigheid van ruim 81%. Voor Nederland, Frankrijk en de VS lukt dit vooralsnog één dag vooruit, met meer data kan verder in de toekomst worden gekeken, zo verwacht Van den Heuvel.
“We blijven ons model verbeteren, zodat we nog verder en nauwkeuriger vooruit kunnen voorspellen”, zegt van den Heuvel. Ook gaan ze kijken naar het effect van maatregelen en de opbouw van de bevolking in China. “Hiermee hopen we sneller te kunnen voorspellen waar het maximum zit, zodat we weten hoeveel mensen er in totaal besmet zullen raken of overlijden als gevolg van het virus”, aldus van den Heuvel. “Ook hopen we hiermee inzicht te krijgen welke factoren het aantal besmettingen en doden beïnvloeden.”
Populatiemodellen Verhulst
Van den Heuvel baseerde zich op de beroemde logistische functie, rond 1845 ontwikkeld door de Belgische wiskundige Pierre Francois Verhulst. Deze functie beschrijft hoe een populatie groeit door de tijd, en heeft een S-vorm: in het begin groeit de bevolking langzaam, gevolgd door een steeds sterker wordende stijging, die vervolgens afvlakt tot een maximum.
Dit populatiemodel pasten de Eindhovense datawetenschappers eerst toe op de data uit China. “Het totaal aantal besmettingen voor iedere provincie in China bleek heel precies die logistische groei te volgen”, zegt van den Heuvel. Met de Chinese data konden ze zodoende hun voorspellingsmodel kalibreren, om vervolgens onderschattingen voor het maximaal aantal nieuwe besmettingen en doden in andere landen te corrigeren. “Die voorspellingen bleken goed te kloppen voor Iran, Italië en Zuid-Korea.”