Dienstag, 30. Dezember 2014

Die eigene und die gegnerische Stärke

"Beim Fußball verkompliziert sich alles durch die Anwesenheit der gegnerischen Mannschaft."
Jean-Paul Sartre


Die Anwesenheit des Gegners verkompliziert nicht nur die Angelegenheit für die eigene Mannschaft massiv, vielmehr ist dessen Qualität und die Relation zwischen eigener und seiner Stärke der stärkste Prädikator für den Ausgang des Spiels. Auch wenn man sich als Zuschauer und Anhänger besonders gern an Spiele zurückerinnert, in denen die sich die unterlegene Mannschaft gegen einen favorisierten, vielleicht sogar übermächtigen Gegner durchsetzte: Im Normalfall gewinnt das stärkere Team, was sich auch darin manifestiert, dass der Meister am Ende der Spielzeit ein besseres zur Verfügung hatte als die sonstigen Europacupstarter, und diese wiederum bessere als Nachzügler und Absteiger.

Dennoch gibt es natürlich auch immer Ausnahmen, und in einzelnen Spielen gewonnene Vorteile können sich auch durchaus summieren, sodass niedriger eingeschätzte Teams in der Tabelle am Schluss weit vorne stehen, während favorisierte Klubs hinterherlaufen müssen. Der Wolfsberger AC in der heurigen Herbstsaison ist ein Musterbeispiel für einen solchen Klub, der die Erwartungen massiv übererfüllt und weit mehr Punkte einfuhr, als er angesichts der eigenen Qualität im Vergleich zur Stärke der anderen Teams sollte. Für diese Mannschaften gilt die Formel, die in Graphik 1 dargestellt ist, nicht mehr oder nur teilweise. 


Graphik 1

Diese Formel beschreibt die Tordifferenz, also den Ausgang eines Spiels z, als Differenz der Qualität von Mannschaft i und Mannschaft j, zuzüglich des statistischen Fehlers e. Unter diesen fällt alles, was den Ausgang eines Spieles sonst noch beeinflussen könnte, wie beispielsweise Wetter, Bodenverhältnisse, Schiedsrichterentscheidungen, oder ganz einfach Glück und Zufall. Bei den Mannschaften, die überperformen, ist also in vielen Spielen e übermäßig groß, wodurch der Einfluss von Qi und Qj auf das Ergebnis rückläufig ist.

Natürlich ist der Höhenflug des WAC beispielsweise derzeit nicht nur auf Glück und positive Schiedsrichterentscheidungen zurückzuführen. Möglich ist durchaus, dass er auch einer erhöhten Qualität der Kärntner entspricht und dementsprechend alles im Lot ist. Eine sehr gute Transferperiode weist darauf hin, dass der Kader durchaus besser geworden ist. Andererseits muss auch darauf hingewiesen werden, dass bis jetzt kein allgemein akzeptierter Indikator existiert, mittels dessen fußballerische Qualität überhaupt objektiv gemessen werden kann. Es gibt zwar einige Faktoren, die sehr stark mit Erfolg korrelieren, sowohl auf Ebene eines einzelnen Spiels als auch im Vergleich von Vereinen miteinander, allerdings sind diese immer nur Annäherungen. 

So ist beispielsweise anzunehmen, dass  sich Vereine mit höheren Budgets, die sich unter anderem darin äußern, dass man mehr Geld in Ablösesummen und Gehälter für gute Spieler investieren kann, weiter vorne in der Tabelle klassifizieren können. Allerdings ist auch das kein perfekter Indikator, aus mehreren Gründen: einerseits sind die Daten diesbezüglich oft nicht öffentlich vorhanden, oder wenn, dann nicht unbedingt miteinander vergleichbar. Dies liegt an mangelnden Transparenzvorschriften. Andererseits geht die Gleichsetzung Budget = Qualität von einer Annahme aus, die auf rationalen Akteuren mit perfekter Information beruht. Das diese nicht realistisch ist, zeigt nicht nur die wirtschaftspsychologische Forschung, sondern auch die Praxis. So dürfte in Österreich beispielsweise nie eine andere Mannschaft als RB Salzburg Meister werden, und WR. Neustadt wäre längst abgestiegen. Man kann sich der realen Qualität also nur bis zu einem gewissen Grad annähern, was allerdings ein häufiges Problem empirischer Untersuchungen ist, wenn abstrakte Konzepte in konkrete Zahlen umgewandelt werden sollen.

Im folgenden wird der Versuch unternommen, die bisherigen Spiele der Bundesligasaison auf die obige Formel hin zu überprüfen. Als Indikator für die Qualität eines Teams wird dabei jedoch nicht seine ökonomische Stärke angewandt. Nach dem Motto "Die Tabelle lügt nicht" (was natürlich zweifelsfrei so nicht stimmt, aber für dieses Anliegen tut es seinen Zweck) wird die Qualität mittels des bisherigen Abschneidens in der Tabelle gemessen. Je niedriger der Tabellenplatz in der jeweiligen Runde, desto höher die Qualität und vice versa. Deshalb wird auch die erste Runde nicht in die Analyse mitaufgenommen, da in dieser die Teams naturgemäß noch keine Platzierung hatten. Deshalb beträgt die Stichprobengröße 18 Spiele pro Team, also insgesamt 180 Untersuchungseinheiten. Dazu muss angemerkt werden, dass dies nicht ganz zulässig ist, da naturgemäß die Tordifferenzen von Mannschaft i und j in Spiel z nicht voneinander unabhängig sind, sondern einem Nullsummenspiel gemäß miteinandern korrelieren. Wenn Team i die Tordifferenz um 1 erhöht, wird gleichzeitig die von Team j um 1 gesenkt. Das Sample ist also eigentlich nur halb so groß und besteht aus Dyaden (n=90). Allerdings sind die Ergebnisse nicht signifikant anders, wenn nur ein Team pro Spiel als Untersuchungseinheit ausgewählt wird. Die Tordifferenz wird anstatt der Punkte verwendet, da diese metrisch skaliert ist und nicht nominal, was einige statistische Analysen erleichtert, beziehungsweise überhaupt erst ermöglicht. Zudem ist sie im Sample sehr schön normalverteilt, was ebenfalls von Bedeutung bei üblichen statistischen Verfahren ist.

Graphik 2 zeigt die Ergebnisse von Regressionsanalysen, wenn die eigene Platzierung eines Teams (Modell 1), und zusätzlich die der gegnerischen Mannschaft (Modell 2) auf seine Tordifferenz in Spiel z regressiert werden. Im letzten Modell wird zudem zwischen Heim- und Auswärtsmannschaft unterschieden. Es zeigt sich, dass die Variablen den angenommenen Effekt haben und zudem statistisch ausreichend signifikant sind. So schießt ein Team pro Platz, den es in der Tabelle weiter oben (=hinten) liegt, 0,2 Tore pro Spiel weniger. Dieser Effekt ist auch nicht abhängig von der gegnerischen Platzierung; zwar ist die Tordifferenz gegen stärkere Teams dementsprechend niedriger, die beiden Faktoren hängen allerdings nicht miteinander zusammen. Ein Heimteam hingegen schießt 0,85 Tore mehr als ein Auswärtsteam, wenn alle anderen Faktoren gleich sind.


Graphik 2

Die Modelle sind allerdings nicht besonders gut, was sich an den niedrigen Werten in der vorletzten Zeile, neben dem Adj. R² (adjusted R², also korrigiertes Bestimmtheitsmaß), manifestiert. Dieser Wert variiert zwischen 0 und 1 und zeigt an, wie gut das Modell die Varianz in der abhängigen Variable, also in diesem Fall der Tordifferenz in jedem Spiel, erklären kann. Je höher dieser Wert ist, desto besser ist das Modell geeignet, weil es weniger Ausreißer gibt. Werte um die 0,1 sind nicht sonderlich gut, was allerdings viel Raum für den oben angesprochenen statistischen Fehler e lässt. Es gibt also noch sonstige Faktoren, die den Ausgang eines Spiels (mit-)erklären. Wie sehr die Modelle bei der Vorhersage der Ergebnisse daneben liegen können, zeigen die Ausgänge zweier Partien in Runde 19. Sowohl Salzburg als auch Wolfsberg hätten ihre Partien gegen Rapid beziehungsweise Admira laut Vorhersage mit einem Tor Unterschied gewonnen, in Wirklichkeit jedoch mit demselben Unterschied verloren.

Dennoch sind die Erkenntnisse aus Graphik 2 nicht trivial. Wichtig zu beobachten ist, dass insgesamt der Effekt der eigenen Platzierung fast doppelt so hoch ist wie der der gegnerischen, und ein weit höheres Signifikanzniveau (99,9% statt 95%) aufweist, also mit noch viel höherer Wahrscheinlichkeit keinen zufälligen Zusammenhang beschreibt. Die eigene Stärke ist also ein wichtigerer Faktor als die gegnerische bei der Vorhersage des Ergebnisses einer Partie.

Obwohl die gegnerische Stärke also der vernachlässigbarere Faktor ist, ist sie von besonderem Interesse in diesem Beitrag, weshalb im Folgenden besonders darauf eingegangen wird. Sieht man sich lediglich den Zusammenhang zwischen der Tordifferenz und der Platzierung des Gegners in der Tabelle an (Graphik 3), so wird ersichtlich, dass dieser nicht sonderlich stark ist, wie auch in den vorgehenden Regressionsgleichungen. Lediglich knapp drei Prozent der Varianz in der Tordifferenz wird mittels der Platzierung der gegnerischen Mannschaft in der Tabelle erklärt. Allerdings ist der Zusammenhang ausreichend signifikant. 

Dieser Befund ist möglicherweise dadurch verzerrt, dass er auf Daten aus der ersten Hälfte der Meisterschaft (plus Runde 19) beruht. In dieser Phase ist die Tabelle noch nicht besonders aussagekräftig, der Zufall spielt eine noch größere Rolle bei der Platzierung einzelner Teams als über eine gesamte Saison. Die Platzierung ist deshalb ein noch schwächerer Indikator für die wahre Qualität eines Teams. Diese Verzerrungen gleichen sich unter Umständen über die gesamte Saison eher aus, weshalb eine gesamte Spielzeit eine aussagekräftigere Stichprobe ist als nur eine Herbstmeisterschaft. Wenn mit den Daten der vorgehenden Saison 2013/14 diese Analyse wiederholt wird, zeigt sich, dass der Zusammenhang tatsächlich etwas stärker ist (r² = 0,05), allerdings immer noch nicht besonders hoch. Insgesamt kann also gesagt werden, dass ein Team umso besser gegen ein anderes abschneidet, je höher (weiter hinten) dieses in der Tabelle klassifiziert ist. Allerdings gibt es auch eine Menge Spiele, in denen sich diese Tendenz nicht widerspiegelt.


Graphik 3



Diese Analyse basiert auf aggregierten Daten von allen Teams; interessant ist in diesem Zusammenhang jedoch auch, welche Klubs in etwa dem allgemeinen Muster entsprechen und welche davon abweichen. Die Analyse wurde also für jeden einzelnen Klub wiederholt und in einem ähnlichen Diagramm abgebildet (Graphik 4), allerdings nur mit linearen Regressionslinien und nicht mit den Punkten, um die Übersichtlichkeit halbwegs beizubehalten. 

Da diese Geraden auf nur jeweils 18 Datenpunkten basieren, sind die Ergebnisse jedoch einigermaßen mit Vorsicht zu genießen. Tatsächlich sind die Korrelationen, anders als beim Modell mit allen Teams, nur in zwei Fällen statistisch signifikant, nämlich bei der Wiener Austria und Grödig. Die beiden Mannschaften sind auch die mit den steilsten Linien; sie tun sich also gegen Teams auf vorderen Tabellenplätzen besonders schwer, zu punkten, und dafür umso leichter gegen Tabellennachzügler. Insgesamt passt die Hälfte der Teams ganz gut in das allgemeine Muster. Neben den beiden erwähnten Teams sind das Ried, Salzburg und Sturm. Die Admira und Rapid weisen nur ganz leicht ansteigende auf, Altach eine leicht fallende. Zwei Teams passen hingegen gar nicht hinein: Wolfsberg und Wr. Neustadt, was angesichts der Tabellenpositionen der beiden Klubs ein interessantes Ergebnis ist. Wolfsberg tut sich offensichtlich schwer, gegen Teams, die in der Tabelle weiter hinten liegen und dementsprechend auch meist tief stehende, abwartende Taktiken verfolgen, die ihrer Tabellenplatzierung entsprechenden hohen Siege herauszuschießen. Wiener Neustadt hingegen hat Probleme, in den Duellen gegen Teams, die zumindest punktemäßig in Reichweite wären, Resultate zu holen. Das könnte im Abstiegskampf zu einem veritablen Problem werden, auch wenn man gegen den Neuntplatzierten, die Admira, noch ohne Niederlage ist. Der Befund bezüglich beider Teams wird auch durch die Tatsache beeinflusst, dass Wr. Neustadt gegen Wolfsberg beide Spiele im Untersuchungszeitraum gewann. Weder gelang ihnen das gegen irgendein anderes Team noch blieb Wolfsberg gegen ein anderes Team punktelos.

.
Graphik 4

Die letzte Abbildung in diesem Beitrag erlaubt, genau nachzuvollziehen, welches Team gegen welchen Gegner Punkte geholt beziehungsweise liegen gelassen hat. Die Tordifferenz, die in den vorherigen Analysen zur Messung der sportlichen Bilanz diente, wird hier hingegen nicht berücksichtigt. Die Hintergrundfarbe in Graphik 5 entspricht den in der Zelle ausgewiesenen Punkten, also das Punktemaximun von sechs ist blau hinterlegt, null Punkte gegen ein Team hingegen rot, etc. 

Wenn man sich die beiden Teams, die dem allgemeinen Modell besonders gut entsprechen (Austria und Grödig), sowie die beiden, bei denen dies überhaupt nicht der Fall ist (Wolfsberg und Wr. Neustadt), ansieht, zeigt sich, dass die Ergebnisse der Analysen weitgehend nicht davon abhängig sind, ob Punkte oder Torverhältnisse benützt werden. Die Austria beispielsweise holte aus gegen die drei höchstplatzierten Teams in der Tabelle nur fünf von 18 möglichen Punkten (TD von -7), gegen die drei untersten hingegen elf (+7). Bei Grödig verteilen sich die Punkte zwar etwas anders, aber die Bilanz gegen die drei besten und die drei schwächsten Teams ist insgesamt gleich (fünf bzw. elf Punkte, bei gesamten Tordifferenzen von -11 und +9, wobei die erstere von der 0:8 Niederlage gegen Salzburg nach oben getrieben wird).

Wolfsberg hingegen holte gegen Wiener Neustadt gar keinen Punkt und nur jeweils drei gegen Ried und die Admira. Die Tordifferenz in den Spielen gegen diese drei Teams beträgt insgesamt -1. Gegen die direkten Tabellennachbarn Salzburg und Altach blieb man hingegen mit je einem Sieg und einem Remis ungeschlagen, auch wenn jeder Sieg nur mit einem Tor Unterschied gelang. Wiener Neustadt wiederum konnte gegen die Top Drei immerhin die Hälfte der möglichen Punkte holen (neun, bei einer interessanterweise negativen Tordifferenz von -5). Gegen die direkten Konkurrenten im Abstiegskampf Admira, Ried und Grödig allerdings blieb man mit vier von 18 möglichen Punkten meist im Hintertreffen, und schoss dabei elf Treffer weniger, als man kassierte.



Graphik 5

Die Qualität der gegnerischen Mannschaft spielt also eine Rolle beim Ergebnis, das ein Team in einer Partie erreichen kann. Allerdings ist diese kleiner als die der eigenen Qualität und unabhängig von dieser. Zusätzlich verhält es sich nicht mit allen Teams gleich; manche punkten "erwartungsgemäß", also wenig gegen vorne platzierte Teams und mehr gegen Nachzügler, während andere gar keinen Trend aufweisen und wieder andere das komplette Gegenteil zeigen. Diese Ausreißer können sowohl vorne (Wolfsberg) als auch hinten (Neustadt) in der Tabelle platziert sein, die eigene Platzierung selbst scheint dabei also keine Rolle zu spielen. Wie sich dieses Punktemuster auswirkt, also ob sich liegen gelassene Punkte gegen kleinere Teams in der Tabelle rächen, wenn sie nicht kompensiert werden, kann mittels der Daten aus einer Saison nicht beantwortet werden. Dafür müsste man mit mehr Teams aus mehreren Saisonen arbeiten, was Stoff für einen zukünftigen Beitrag ist.

Keine Kommentare:

Kommentar veröffentlichen