pondělí 7. září 2015

Pokročilé fotbalové statistiky: Expected Goals (a Premier League)

Expected goals modely jsou hodně využívaným nástrojem v rámci fotbalové analytiky. O co jde a kde najít čísla pro jednotlivé týmy Premier League?




Expected goals (ExpG, xG)

Česky bychom to mohli nejlépe přeložit jako Očekávané (předpokládané) góly. Ukazatel měří, kolik gólů měl tým v zápase a v průběhu sezóny vstřelit a inkasovat, a to na základě počtu a kvality střel. Každému ze střeleckých pokusů je dána pravděpodobnost, s jakou mohl skončit gólem. Například pokud měla střela 20 % pravděpodobnost, že skončí gólem, její hodnota je 0,2 ExpG.

Modely ExpG se vlastně snaží kvantifikovat kvalitu šancí a střeleckých pokusů a dávají nám lepší obrázek o vývoji zápasu a výkonech jednotlivých týmů v průběhu sezóny, než jen pohled na počty střel (či často zavádějící pohled na ligovou tabulku).

Právě to, že ExpG modely neberou střelu jako střelu je pokrokem oproti starším pokročilým statistikám Total shots ratio (TSR) a Shots on target ratio (SoTR). I když i ty jsou stále užitečné a využívané. Pro připomenutí, výpočet TSR (a podobně pak SotR) je následující:

TSR = střely pro / (střely pro+střely proti)

Existují různé modely ExpG, ale obvyklými vstupními parametry jsou lokace střely, typ střely (noha, hlava, přímý kop), rychlost útoku, informace o typu přihrávky (např. centr, přihrávka mezi obránce). Ale třeba Paul Riley vytvořil model, který využívá jen střely jdoucí na bránu a kde parametrem je jen místo, odkud střela šla (+ přímé kopy).

Nakolik modely založené na expected goals využívají kluby Premier League netuším (tipnul bych si že jo, určitě Arsenal), ale na internetu jsou k dispozici informace o modelech vytvořených lidmi zabývajícími se fotbalovou analytikou. Kromě Paula Rileyho svůj model celkem podrobně popisuje Michael Caley. Stejně jako Riley i zveřejňuje konkrétní čísla pro Premier League.

- Vysvětlení a využití modelu Paula Rileyho

- Popis modelu vytvořeného Michaelem Caleym

Riley šel dokonce dál než Caley a publikuje nejen čísla, ale přes Tableau i lokace střel plus některá další data. Doporučuji si s tím pohrát – data naleznete buď zde a nebo embedovaná o něco níž v tomto příspěvku. Na screenshotu vidíte Expected goals čísla pro jednotlivé kluby v dosavadním průběhu Premier League (po 4 kolech).



Na ukázku jsem vyfiltroval Arsenal. Čím větší bublina, tím větší hodnota ExpG dané střely. Gunners zatím v koncovce zaostávají za svými ExpG čísly.

Na této stránce pak je mnoho pokročilých statistik za předchozích pět sezón, taktéž od Rileyho. Blog Football in the clouds tato čísla nedávno podrobil statistické analýze a Rileyho model z toho vyšel dobře.



ExpG Ratio (Difference)

Obvykle se u expected goals využívá jejich poměr, případně rozdíl mezi nimi, jedná se o Expected goals Ratio a Expected goals Difference. Výpočet ExpG Ratio je obdobný jako u TSR:

ExpG Ratio = ExpG pro / (ExpG pro+ExpG proti)

ExpG Difference = ExpG pro – ExpG proti

ExpG Ratio a ExpG Difference vykazují vysokou korelaci s počtem získaných bodů a gólovým rozdílem (goal difference), takže tyto ukazatele do značné míry odrážejí skutečnou sílu týmů. Nabízí se zde paralela s analýzou fundamentů při investování do akcií.

Síla těchto ukazatelů je i v jejich schopnosti předvídat – ligová tabulka často lže, týmu se nemusí zrovna dařit (výsledkově, střelecky), ale pokud vykazuje dobré hodnoty ExpG, je zde velká šance, že půjde výsledkově nahoru.

A naopak, u týmu výsledkově či střelecky výrazně překonávajícího ExpG hodnoty může dojít brzy k obratu k horšímu. Předvídatelnost je využitelná v průběhu sezóny, ale i mezi předchozí a novou sezónou.

Ukazatele ExpG se dá využít i u jednotlivých hráčů, zejména těch ofenzivních (útočníci, křídla, ofenzivní záložníci…). Pokud se hráči gólově daří ale jeho ExpG čísla jsou nízká, může to naznačovat, že jeho střelecká forma není udržitelná. A naopak, útočníkovi to tam zrovna nemusí padat, ale pokud vykazuje dobrá ExpG čísla, dá se očekávat obrat k lepšímu.

Své využití to může mít při skautingu. Je dobré porovnat počet skutečně vstřelených branek s ExpG čísly. Můžete mít vytipovaného forvarda, který v předchozí sezóně nastřílel 20 gólů, ale pokud byla hodnota jeho ExpG výrazněji nižší, může to být varovný signál, že jeho střelecká forma se nemusí opakovat.

Velmi dobré je k tomuto tématu video s přednáškou od Omara Chaudhuriho, analytika společnosti Prozone.


Prozone Performance.Lab - Science + Football 2014 Omar Chaudhuri, Data Scientist from Prozone Sports on Vimeo


Nevýhody ExpG modelů

Samozřejmě Expected goals modely nejsou dokonalé a mají své slabiny (o nichž se v analytické komunitě hodně diskutuje). Za prvé, mezi jednotlivými hráči jsou rozdíly v jejich schopnosti zakončit. Střelecký pokus dvou hráčů může mít stejnou ExpG hodnotu, ale pravděpodobněji se strefí šutér typu Sergia Aguera než Phil Jones.

Ale to zas není tak fatální slabina, protože analýzy ukázaly, že špičkoví střelci střílejí více gólů primárně kvůli tomu, že se dostávají (vytvoří si) do větších počtu kvalitních šancí, což se odrazí i v ExpG číslech.

Modely (alespoň ty veřejně prezentované) také neberou do úvahy postavení obránců a jejich počet okolo zakončovatele. Ale je dost možné, že kluby mají k dispozici více dat, a dokáží to zohlednit nebo na tom jejich týmy analytiků pracují. Našly by se i další mouchy (vliv počasí, hrací plochy), ale to už bych se zbytečně zamotával do detailů.

Expected goals modely nám neprozradí vše, nejsou žádným Svatým grálem, ale je to jeden z nástrojů, jak objektivně hodnotit výkony týmů (případně ofenzivních hráčů).


---


Některé další odkazy

- On the topic of Expected Goals and the repeatability of finishing skill (Ted Knutson, analytik Brentford FC)

- The limits of expected goals models based on shots (Dan Altman, North Yard Analytics)

1 komentář:

  1. Hezký den, zaujali mě vaše články a rád bych s vámi něco probral, nikde na webu ale nemohu najít kontakt, můžete se mi prosím ozvat na mail stanislav.kolman@sportpeople.cz? Díky.

    OdpovědětVymazat