Het ziet er niet goed uit voor het Nederlands Elftal. Volgens statistische modellen, ontwikkeld door wetenschappers van verschillende Europese universiteiten, zullen Frank de Boer en zijn jongens waarschijnlijk met lege handen vertrekken op het Europees kampioenschap, dat vrijdag 11 juni begint, en kunnen ze hun koffers vroegtijdig pakken. Een internationaal team van gerenommeerde onderzoekers uit Duitsland, België en Noorwegen heeft met behulp van machine learning berekend dat Frankrijk na de wereldbeker van 2018 waarschijnlijk ook het Europees kampioenschap van 2021 zal winnen.
Met behulp van statistische modellen met informatie over de teamstructuur (b.v. marktwaarde, aantal Champions League-spelers, clubmatchprestaties van individuele spelers) en sociaal-economische factoren van het land van herkomst (bevolking en bruto binnenlands product), simuleerden zij het gehele Europees kampioenschap 100.000 keer wedstrijd per wedstrijd. Zij volgden de loting van het toernooi en alle UEFA-regels. Op basis van alle waarschijnlijkheden van alle teams die doorgaan naar de individuele toernooirondes, is Frankrijk uiteindelijk de belangrijkste kanshebber op de overwinning met een winstkans van 14,8 procent. Engeland volgde op de tweede en derde plaats met 13,5 procent en Spanje met 12,3 procent.
Voorspellingen kunnen ook verkeerd zijn
De onderzoekers moesten echter toegeven dat deze uitkomst van het toernooi allesbehalve zeker is. De marges aan de top zijn immers uiterst smal – en de kans om te winnen is met iets meer dan tien procent toch al vrij klein. “Het ligt in de aard van prognoses dat ze er ook naast kunnen zitten – anders zouden voetbaltoernooien ook heel saai zijn”, zegt onderzoeker Achim Zeileis van de universiteit van Innsbruck. “We leveren waarschijnlijkheden, geen zekerheden, en een 15 procent waarschijnlijkheid om te winnen betekent dat 85 procent van het team het toernooi niet kan winnen.”
Niettemin blijkt uit de resultaten dat de voorspellingen vrij accuraat waren. In 2008 tijdens de EURO-finale en in 2010 en 2012 tijdens het WK en het EK voorspelde het Innsbruck-model van Achim Zeileis, dat gebaseerd is op aangepaste kansen van wedaanbieders, Spanje als wereldkampioen en Europees kampioen. Voor het Europees kampioenschap van dit jaar gebruiken de onderzoekers het model als onderdeel van een breder gecombineerd model. Dit model werd ontwikkeld door de teams onder leiding van Andreas Groll (TU Dortmund), Gunther Schauberger (TU München) en Christophe Ley (Universiteit Gent) en bleek nauwkeuriger te zijn in zijn voorspellingen dan de aanbieders van weddenschappen op de wereldbeker van 2018.
En Duitsland?
Na de loting staat het Duitse nationale elftal rond aanvoerder Manuel Neuer al voor enkele uitdagingen in de groepswedstrijden. “Er zijn drie zeer sterke teams in Groep F, waaronder regerend wereldkampioen Frankrijk en Europees kampioen Portugal, die beide ook EURO 2016 finalisten waren, plus Duitsland”, legt Andreas Groll uit. “In deze groep is de kans om de laatste 16 te halen dus kleiner dan bij de favorieten in de andere groepen. Maar als je dat doet, heb je een goede kans om verder te komen.”
Volgens de prognoses hebben zowel Duitsland als Portugal een kans van 85,3 procent om ten minste de ronde van 16 te halen. Voor Frankrijk is de kans trouwens 89,7 procent volgens het model. En de kans dat Duitsland de titel wint? Een magere 10,1 procent. Op gelijke hoogte met Portugal.
Gemakkelijke loting voor Oostenrijk, maar…
De nationale ploeg van Oostenrijk zou de voorronde volgens de computers vrij goed moeten doorkomen in de groepswedstrijden tegen Nederland, Noord-Macedonië en Oekraïne. In tegenstelling tot 2008 en 2016. “Favorieten in de groep zijn duidelijk Nederland, zelfs volgens ons model, maar daarna volgt al Oostenrijk, dat de ronde van 16 bereikt met een waarschijnlijkheid van 80,9 procent,” legt Achim Zeileis uit. “Dat is veel waarschijnlijker dan voor Oekraïne en Noord-Macedonië.” Maar het team zal waarschijnlijk niet veel verder komen, volgens de voorspellingen. De kans dat de trofee naar Oostenrijk wordt gehaald is slechts 1,5 procent.
Machine learning
Het model is gebaseerd op vier informatiebronnen: Van de Universiteit Gent komt een statistisch model voor de speelsterkte van elk team, gebaseerd op alle internationale wedstrijden van de afgelopen acht jaar. De universiteit van Innsbruck heeft een statistisch model voor de speelsterkte van de ploegen opgesteld op basis van de weddenschappen van 19 internationale bookmakers. De TU Dortmund en de TU München leverden nadere gegevens over de teams, bijvoorbeeld hun marktwaarde, en hun landen van herkomst en bevolkingscijfers. Ten slotte werd informatie van de Hogeschool van Molde opgenomen, zoals gedetailleerde beoordelingen van de individuele spelers en hun individuele prestaties, zowel bij hun thuisclubs als bij hun nationale teams.
De vijfde bron of “partner” was een machine-learning-model dat de andere vier bronnen combineert en ze stap voor stap optimaliseert. Daartoe hebben de onderzoekers het model vooraf getraind met historische gegevens. “We hebben het model gevoed met de actuele gegevens van de afgelopen vier Europese kampioenschappen, d.w.z. tussen 2004 en 2016, en vergeleken met de werkelijke uitkomsten van alle wedstrijden in de respectieve toernooien – op deze manier zal de weging van de afzonderlijke informatiebronnen voor het huidige toernooi idealiter zeer nauwkeurig zijn”, legt Andreas Groll uit.
Het antwoord op de vraag hoe nauwkeurig de voorspellingen van het model zijn, op zijn laatst tijdens de finale op 11 juli worden onthuld.