Data science in het profvoetbal
Liverpool FC (1892) won afgelopen seizoen de Premier League én een jaar eerder de UEFA Champions League. Een topclub dus. En net als bedrijven wordt er bij sportclubs ook geïnvesteerd in data science. In deze post lees je hoe de data scientists bij Liverpool te werk gaan!
In het geval van Liverpool FC zijn de resultaten erg goed. De verdediging van de ploeg staat als een huis en er wordt efficiënt met kansen omgegaan. Nu is Liverpool met een data-team van ±7 professionals niet uniek in het voetbal, maar toch doen ze het opvallend beter dan andere teams. Een uniek kijkje in de keuken van Liverpool FC laat zien hoe ze hun data science aangepakt hebben.

Inhoudsopgave
1 – Meten
De uitdaging is allereerst om zoveel mogelijk data te genereren van wat er op het veld gebeurt. Dit doen voetbalclubs over het algemeen via videosystemen en speler-tracking. Dit is natuurlijk geavanceerde (en dure) technologie, waarmee grote hoeveelheden data worden gegenereerd.
2 – Het speelveld
De uitdaging is om die big data om te zetten naar inzichten. Hiervoor creëert Liverpool een virtueel voetbalveld.
Op dit voetbalveld wordt Pitch Control gemeten. Daarmee probeert Liverpool in kaart te brengen welke speler een bepaald gedeelte van het veld onder controle heeft.
De basis van Pitch Control wordt gelegd door een Voronoi diagram over het voetbalveld te plaatsen. Deze diagram splitst het veld in regio’s op basis van de afstand tussen de spelers (S) onderling. Eén speler bezit één regio waar hij of zij de kortste afstand tot heeft.
Aangezien de afstand niet zoveel zegt, werkt Liverpool niet met de afstand, maar met de verwachte tijd tot een bepaald punt. Zie onderstaande afbeelding

Als je dit voor het hele voetbalveld doet, ziet dat er als volgt uit:

Dit framework is de basis voor het model van Liverpool FC. Naar verwachting wordt de situatie op het voetbalveld elke 0,1 seconde vastgelegd. Deze tijdsinterval zorgt voor erg veel data!
3 – De speler
Ten tweede werkt Liverpool FC met gegevens over de spelers. Via een kansberekening maken ze een inschatting van de tijd die een speler nodig heeft om een gecontroleerde handeling met de bal te doen.
Dit heet de Control Force.

Door de Control Force van spelers onderling te vergelijken, zie je per speler de kans dat ze een pass ontvangen of onderscheppen. In korte ruimtes is de kans op balcontact hoger, maar de tijd om te reageren korter. Spelers die vrijstaan hebben daarom een grotere kans op een gecontroleerde handeling.

Nu het speelveld én de speler vastgelegd zijn in het model, is het mogelijk de data te combineren.
We weten waar de spelers zich bevinden, waar de bal heen rolt en hoeveel tijd er nodig is voor een gecontroleerd balcontact. Liverpool FC bepaalt dus elke 0,1 seconde wat de kans is dat een speler in balbezit kan komen.
4 – Toepassingen in het spel
Leuk al die data, maar hoe kun je dit nou toepassen in het spel van een voetbalteam?
Vanuit het basismodel ontstaan er logische vragen om mee verder te werken. In de uitleg van Liverpool FC worden drie toepassingen benoemd:
– Wat voor invloed heeft de snelheid van de bal op het speelveld? (Dynamic Pitch Control)

De snelheid van de bal zorgt ervoor dat de pitch control veel minder duidelijk wordt. Dit zie je aan de witte gebieden, want daar heeft geen van beide teams overmacht. Een snelle aanval is dus moeilijker te verdedigen.
– Welke gebieden van het veld zijn het meest belangrijk tijdens een specifiek spelmoment? (Relevant Pitch Control)

De transition probability geeft aan waar de bal waarschijnlijk naar toe gespeeld gaat worden. Hierdoor wordt zichtbaar welk gedeelte van het speelveld relevant is voor de volgende pass of actie.
– Welk gedeelte van het speelveld heeft de hoogste scoringskans bij balbezit of balverlies? (Scoring Opportunity)

In het bovenstaande voorbeeld wordt duidelijk dat Liverpool FC (rood) in dit spelmoment het meest kwetsbaar is bij de rechter centrale verdediger. Deze locatie kent de hoogste scoringskans voor de tegenstander (blauw) en de laagste pitch control door een Liverpool speler.
5 – De trainer: Jürgen Klopp
Met de bovenste drie toepassingen is het voor trainer Jürgen Klopp en zijn staff inzichtelijk wat er op het veld gebeurt. Deze inzichten zijn enorm waardevol bij het maken van de sterkst mogelijke opstelling. Denk bijvoorbeeld aan anticiperen op balverlies of ruimte creëren op plekken waar de scoringskans het hoogst is.
Het mooie aan Klopp is dat hij als trainer erg open staat voor dit soort nieuwe technologieën. Zowel tijdens als na de wedstrijd zijn de data analisten druk bezig om Klopp van nieuwe inzichten te voorzien. Daarnaast is het ook mogelijk om allerlei spelsituaties te simuleren. Nog voordat er één bal getrapt is, kan Liverpool FC al bekijken waar de kansen en gevaren liggen!
6 – Toekomst
Het succes van Liverpool en Klopp is natuurlijk niet onopgemerkt gebleven. Ook andere topclubs in (en buiten) het voetbal maken steeds meer gebruik van data. De vraag is natuurlijk of Liverpool FC de concurrentie voor kan blijven.
Voetbal is 11 tegen 11 en uiteindelijk winnen de….
Bron
Interessant verhaal? Bekijk hier de masterclass van William Spearman van Liverpool FC over data science in het voetbal.
Leave a Reply