De legendarische Braziliaanse speler Pele omschreef voetbal als “Het mooie Spel”. De dynamische spits was vloeiend, onvoorspelbaar en had geluk, net als het spel zelf. En hoewel geluk een belangrijke rol speelt in de uitkomst van een voetbalwedstrijd, is de actie op het veld zeker kwantificeerbaar. Dus kan serieus cijfermateriaal de kansen in iemands voordeel doen keren? Chipmachinemaker ASML en voetbalclub PSV bundelden hun krachten buiten het veld om de prestaties op het veld te verbeteren – puur geluk buiten beschouwing gelaten, wel te verstaan.
De meeste professionele sportteams gebruiken een groot aantal statistieken om hun wedstrijden en spelers te evalueren. Vooral sinds de publicatie van Michael Lewis’ boek (en later film) Moneyball uit 2003, is de rol van gegevens in de sport van doorslaggevend belang voor de aspiraties van een team. Maar Moneyball gaat over honkbal, een spel van discrete gebeurtenissen: korte, welomschreven en op zichzelf staande acties met een duidelijk begin en einde. Voetbal is anders. Het is een veel meer continu spel, waarbij spelers zich voortdurend moeten aanpassen aan veranderende omstandigheden op het veld – waardoor het een minder voor de hand liggende kandidaat is voor data-gedreven analyse.
“In feite is naar schatting 31% van de uitkomst van een seizoen gebaseerd op geluk”, zegt Ruud van Elk, hoofd sportwetenschappen en analytics bij voetbalclub PSV in een artikel op de website van Brainport. “Het is onze taak om te proberen de overige 69 procent in de hand te houden.”
Meten, analyseren, verbeteren
Controle op prestaties begint met gegevens. Professionele voetbalclubs in Nederland werken met twee belangrijke datasets: event data en tracking data. De gebeurtenisgegevens zijn een handmatig logboek van opeenvolgende activiteiten van de bal op het veld, in eenvoudige bewoordingen, speler A passt de bal naar speler B, wat gewoonlijk leidt tot ongeveer 2.000 rijen gegevens per voetbalwedstrijd. De trackinggegevens zijn een geautomatiseerd logboek van de positie van elke speler en de bal op het veld, 25 keer per seconde gemeten, wat betekent dat het veel rijkere en contextuele gegevens zijn dan de gebeurtenisgegevens. Gespecialiseerde camera’s in het stadion leggen maar liefst vier miljoen rijen gegevens per wedstrijd vast.
“We werkten met beide soorten gegevens afzonderlijk”, zegt Van Elk. “Het stelde ons in staat om basisgegevens te verzamelen zoals de totale afgelegde afstand per speler, passes per speler, schoten op doelpunten. Maar om het complete plaatje te zien, moet je de gegevens als één geheel combineren en visualiseren. Niet veel sportteams hebben de expertise om dit goed te doen. Daarom keken we naar onze Brainport-partners voor ondersteuning.”
Toepassing van analytische expertise in de sport
Of meer specifiek, ASML’s Big Data Analytics afdeling. Met meer dan 300 mensen ondersteunt deze afdeling de R&D- en bedrijfsfuncties van ASML met geavanceerde analyses van lithografiemachinedata, operationele data en bedrijfsdata.
Rob Beeren, die aan het hoofd staat van ASML’s corporate analytics groep, herinnert zich dat hij voor het eerst hoorde over de ambities van PSV. “ASML maakt deel uit van het Brainport-partnerschap van PSV. Tijdens een kennisdelingsevenement in 2020 presenteerde PSV hun toekomstvisie voor de club. Het verbeteren van de prestaties door middel van data-analyse was een belangrijk onderdeel van deze visie. We realiseerden ons dat we elkaar konden helpen en van elkaar konden leren door de analytics-expertise van ASML toe te passen in de high-performance sportomgeving van PSV.”
Beeren had een speciaal team voor de klus in gedachten: het Innovation Lab, een gespecialiseerde groep van zes datawetenschappers binnen ASML’s Big Data Analytics-afdeling die zich richt op experimenteren, snel leren en rapid prototyping. Onder leiding van hoofd van ASML’s Innovation Lab, Diederick Edel werd het team gevraagd om met PSV om de tafel te gaan zitten en te kijken waar mogelijkheden voor samenwerking lagen.
Edel: “De PSV’ers waren in het begin een beetje huiverig, onzeker over hoe het zou zijn om samen met een hightechbedrijf als ASML prototypes te maken, en of het wel de resultaten zou opleveren waar ze naar op zoek waren. Maar we hebben onze ‘minder praten, meer doen’-filosofie in praktijk gebracht. Het ASML-PSV-team schetste samen de ambities en de weg ernaartoe.”
Tijdstempel aangepast
Een eerste cruciale stap in de samenwerking was om te proberen alle beschikbare datasets bij elkaar te brengen. Die uitdaging kwam terecht bij Maud Diepstraten, data scientist in Innovation Lab.
“Bij elk dataproject is het van cruciaal belang om de gegevens echt te begrijpen en vertrouwd te raken met wat je hebt – of niet hebt. Het handmatig vastleggen van gebeurtenisgegevens betekende bijvoorbeeld dat er vaak typefouten of ontbrekende waarden in voorkwamen. Dat is iets waar je op de een of andere manier mee moet werken”, zegt Diepstraten.
Het was ook een uitdaging om de manueel geregistreerde gebeurtenissen op het veld perfect te laten overeenstemmen met de geautomatiseerde trackinggegevens. Diepstraten: “Bijvoorbeeld, de tijdstempels voor passes kwamen gewoon niet goed overeen. Dat hebben we opgelost door de tijdstempel te matchen wanneer de bal het dichtst bij een speler is in een tijdsbestek van 1,5 seconde.”
Als afgestudeerde Toegepaste Wiskunde met een Data Science Management diploma in de maak, vindt Diepstraten het leuk om enorme datasets te doorgronden. Maar dit specifieke project bood een bijzonder persoonlijk perspectief, omdat ze ook middenvelder is bij de plaatselijke voetbalclub Beerse Boys.
“Werken met deze gegevens was voor mij een beetje een breuk met de norm. Meestal werk ik met de zeer abstracte data die uit de machines van ASML komt. Maar met voetbalgegevens kan ik me echt voorstellen wat er gebeurt met 22 spelers op het veld.”
Door meerdere bestanden met verschillende formaten te combineren, legde Diepstraten de basis voor visuele analyses in PSV’s favoriete analyseplatform Tableau. En het team slaagde erin om snel resultaten te boeken.
Richting, acceleratie snelheid, bochten
“We besloten onze nieuwe dataset te testen door te kijken naar een specifiek aspect van het spel: sprinten,” zegt Ruud van Elk. “Voorheen hadden we al gegevens over alle sprints van een speler in de loop van het spel, maar alleen de begin- en eindpunten. Een sprint is zoveel meer. Er is richting, versnelling, snelheid, bochten.”
Het team itereerde in snelle scrumcycli om een Tableau-visualisatie op te leveren op basis van de geaggregeerde dataset, kreeg feedback van Van Elk en stelde het productonderweg bij. Binnen twee weken was de sprintvisualisatie in handen van de performance trainers van PSV.
Van Elk: “Dat we dit allemaal kunnen visualiseren, is gewoon enorm belangrijk om te begrijpen hoe we het sprinten voor individuele spelers eigenlijk moeten trainen.”
Het ASML-PSV team bewees de waarde van hun samenwerking met de sprint analytics en kreeg het groene licht om de lat hoger te leggen.
Diepstraten: “Het echte plezier begint wanneer je complexiteit en granulariteit toevoegt aan de data. Samen besloten we een geavanceerd algoritmisch model te maken dat PSV kan helpen te begrijpen hoe het team het veld gedurende de wedstrijd beheerst.”
Definiëren veldcontrole
Met de ruwe trackinggegevens als basis voor het model berekende het team de controle over de worp door te begrijpen waar elke speler zich op een bepaald tijdstip bevindt, waar hij naartoe gaat en hoe snel hij beweegt. Diepstraten: “We definieerden veldcontrole als welke speler welk deel van het veld op een bepaald moment controleert. Dus door een raster op het veld te projecteren, kunnen we berekenen welke speler een bepaalde cel het snelst of het eerst zal bereiken”, legt ze uit. “Door dat voor elke rastercel te berekenen, kunnen we de algemene veldcontrole van een team visualiseren.”
Het berekenen van de pitchcontrole voor alle rastercellen bij 25 frames per seconde vereist enige rekenkracht van zwaar kaliber. Het ASML-team werkte samen met PSV aan de back-end infrastructuur, een krachtige van Azure, het cloud computing platform van Microsoft dat door ASML wordt gebruikt, en Tableau, een datavisualisatietool die al in gebruik is door de performance trainers van PSV.
Edel: “We hebben de analytics-omgeving van PSV binnen een dag opnieuw opgebouwd om de berekeningen op Azure te doen. We hebben de pitch control berekeningen geoffload naar de enorme rekenkracht van Azure Databricks.”
Om die rekenkracht terug te koppelen naar PSV’s visualisatieplatform Tableau, verbond het team de omgevingen via Azure Synapse. Dit stelde de PSV performance trainers in staat om tientallen miljoenen rijen data te analyseren in het platform waar ze al vertrouwd mee waren.
“Het werken met dit pitch control model is vrij uniek voor het Nederlandse voetbal”, zegt Ruud van Elk. “Het is iets dat we willen benutten in onze trainingen, maar we zien ook mogelijkheden om nog meer waarde toe te voegen. We hebben bijvoorbeeld geprobeerd om pitch control te koppelen aan bepaalde gebeurtenissen om te begrijpen hoe een pass de pitch control beïnvloedt.”
Klaar voor meer
Terugkijkend op de samenwerking is het ASML-PSV team trots. Groepsleider Rob Beeren prijst de wendbaarheid en snelheid van het organisatie-overkoepelende project. “We hebben onszelf en PSV gestimuleerd om ons echt in te zetten voor iets unieks – en om daar snel vooruitgang mee te boeken. Het team aan onze kant was ook erg enthousiast om met PSV te werken, veel collega’s zijn zelfs fan. Dat betekende een enorme hoeveleeheid extra energie!”
Ook PSV was onder de indruk van het snelle verloop, zo bevestigt Ruud van Elk. “Het hele project en alle deliverables hebben slechts drie maanden geduurd. Om in zo’n korte tijd zo’n resultaat te behalen, draagt bij aan de droom voor de toekomst van PSV.”
Het team is klaar voor meer en wil wat er al is industrialiseren, zodat de performance trainers van PSV na elke wedstrijd geautomatiseerde rapporten ontvangen. Het team is ook actief op zoek naar nieuwe use cases die aansluiten bij de ambities van PSV.
Ook Diederick Edel, kijkt met hoge verwachtingen vooruit: “Bij ASML weten we dat het gebied van data science zich snel ontwikkelt. Het potentieel is vrijwel eindeloos en we zullen slimme keuzes moeten maken voor de beste resultaten en de grootste impact. Als je het mij vraagt, zijn we nog maar net begonnen.”
Geselecteerd voor jou!
Innovation Origins is het Europese platform voor innovatienieuws. Naast de vele berichten van onze eigen redactie in 15 Europese landen, selecteren wij voor jou de belangrijkste persberichten van betrouwbare bronnen. Zo blijf je op de hoogte van alles wat er gebeurt in de wereld van innovatie. Ben jij of ken jij een organisatie die niet in onze lijst met geselecteerde bronnen mag ontbreken? Meld je dan bij onze redactie.