Sonntag, 9. Juni 2013

Defence wins championships?


Eine kleine statistische Untersuchung des Zusammenhangs zwischen erzielten und erhaltenen Toren und der Punkteanzahl. Mittels der Daten aus den zwölf abgelaufenen Saisonen kann gezeigt werden, dass die Anzahl der Punkte eher von der Anzahl der erzielten Tore als von der Anzahl der Gegentore abhängt. Die Annahme, die dem Satz zugrunde liegt, entspricht also zumindest in der österreichischen Bundesliga nicht der Realität.

1. Einleitung

Der Satz „Offence wins games, but defence wins championships“, also zu Deutsch „Die Offensive gewinnt Spiele, aber die Defensive gewinnt Meisterschaften“, ist vielen Fußballanhängern sicherlich geläufig. Die Annahme, dass sich im Verlauf einer Meisterschaft, die üblicherweise knapp vierzig Spielrunden andauern, eine gute Defensive besser auswirkt als eine gute Offensive, ist also weit verbreitet. 

Aber ist da auch etwas dran? Präziser gefragt: Lässt sich eine solche Tendenz auch in der österreichischen Bundesliga feststellen? Hält sie statistischen Methoden stand?

Um diese Frage beantworten zu können, wurden die letzten zwölf vorhergehenden Saisonen, also von 2000/01 bis 2011/12, untersucht. Die Daten wurden dabei in drei verschiedene Teilgruppen eingeteilt: Einerseits alle Teams (n=120), um den Einfluss der Toranzahl auf die Punkteanzahl insgesamt zu untersuchen; zweitens alle Meister (n=12), um zu prüfen, ob denn der oben zitierte Satz in der österreichischen Liga so stimmt; und drittens einige ausgewählte Nichtabsteiger (n=30), um zu erforschen, ob es für den Ligaerhalt besser ist, mehr Tore zu schießen, oder eher weniger Tore zu erhalten (idealerweise natürlich beides, aber das gilt für alle Teams). In diese letzte Gruppe fallen alle Teams, die Rang 8 und 9 in den Saisonen belegt haben, sowie zusätzlich alle jene, die nach dem letzten Spieltag zehn oder weniger Punkte Vorsprung auf den Absteiger hatten. 

2. Daten
 
Zuerst wurden die Daten graphisch in Form dreidimensionaler Scatterplots dargestellt (siehe Graphiken 1-3). Die erste Graphik, in der die Daten aller Teams dargestellt sind, zeigt den logischen und erwarteten Zusammenhang zwischen der Anzahl an Toren, Gegentoren und Punkten: Ein Band an Datenpunkten, das einigermaßen linear von links vorne oben in der Graphik (wenige Tore und Punkte, viele Gegentore) nach rechts hinten unten (viele Tore und Punkte, wenige Gegentore) führt.

 
Graphik 1

Der Großteil der Teams bewegt sich naturgemäß im Mittelfeld. Der Durchschnitt der Tore (und damit auch der Gegentore) beträgt über den gesamten Zeitraum 48,9. Während es jedoch einige Ausreißer nach oben in der Graphik gibt, also Teams mit übermäßig vielen Gegentoren, gibt es weniger davon nach rechts, also solche, mit „zu vielen“ Toren. Das ist bereits ein interessanter Hinweis auf die tatsächliche Natur des Zusammenhangs (die Standardabweichung über den gesamten Zeitraum beträgt 12,52 bei den Toren und 13,96 bei den Gegentoren).

 
Graphik 2

Bei der Reduktion der Darstellung nur auf die Meistermannschaften der zwölf untersuchten Saisonen ist die Tendenz naturgemäß etwas anders (siehe Graphik 2; beim Vergleich der unterschiedlichen Graphiken sind die unterschiedlichen Intervalle auf den Achsen zu beachten). So geht die Linie eher von links vorne unten weniger Tore, Gegentore und Punkte) nach rechts hinten oben (viele Tore, Gegentore und Punkte).

Allerdings fallen, auch bedingt durch die niedrigere Fallzahl, zwei Ausreißer auf: einerseits einer links vorne, also mit wenigen Toren und Punkten, und einer rechts hinten oben, also mit vielen Toren, aber auch besonders vielen Gegentoren. Bei beiden Teams handelt es sich um Meistermannschaften von RB Salzburg. Bei erstgenanntem handelt es sich um das Team von 2011/12, also dem letzten Jahr der Untersuchung, als wenige Punkte und Tore für den Titel reichten. Zweitgenannter Ausreißer ist das Team der Saison 2008/09, das unter Co Adriaanse die meisten Tore aller Meister erzielte, aber auch die mit Abstand meisten Gegentore erhielt.

 
 Graphik 3

In Graphik 3 wiederum sind die Daten der ausgewählten Nichtabsteiger abgebildet. Auch bei ihnen zeigen sich mehr Ausreißer, außerdem ist die Beziehung zwischen den Variablen nicht mehr so gleichmäßig linear von links oben vorne nach rechts unten hinten.

3. Berechnung

Nach dieser graphischen Aufarbeitung der Daten folgt die rechnerische. In Tabelle 1 sind die Korrelationen nach Pearson[1] zwischen Toren beziehungsweise Gegentoren und den Punkten für jede Saison einzeln sowie für alle Saisonen zusammen, die Meister und die ausgewählten Nichtabsteiger aufgeführt. Es zeigt sich, dass die Korrelationen im Zeitverlauf keinem Trend folgen. In fünf Saisonen ist die Korrelation zwischen Toren und Punkten höher als zwischen Gegentoren und Punkten, in sieben hingegen ist es umgekehrt. Das würde für die Richtigkeit der eingangs zitierten Phrase sprechen. Im langjährigen Mittel ist der Zusammenhang zwischen Toren und Punkten bei allen Teams jedoch leicht höher als der zwischen Gegentoren und Punkten. Noch viel größer sind die Unterschiede zwischen beiden Größen bei den Untergruppen der Meister und Nichtabsteiger, wobei hier jedoch auch die Zusammenhänge insgesamt kleiner sind. Dieser Befund wiederum spricht für das genaue Gegenteil des angenommenen Satzes, wonach die Defensive die Meisterschaft gewinnt.

Saison
Tore
Gegentore
2011/12
0,9357
-0,8206
2010/11
0,9427
-0,9607
2009/10
0,8598
-0,9005
2008/09
0,8514
-0,8620
2007/08
0,9398
-0,9227
2006/07
0,7896
-0,8731
2005/06
0,6690
-0,8903
2004/05
0,9612
-0,9135
2003/04
0,9820
-0,8972
2002/03
0,6989
-0,8061
2001/02
0,8948
-0,8766
2000/01
0,8728
-0,9704
Insgesamt
0,8477
-0,8460
Meister
0,5143
-0,1880
Nichtabsteiger
0,5035
-0,3148
Tabelle 1: Korrelationen nach Pearson zwischen Toren beziehungsweise Gegentoren und der Punkteanzahl, 2000-2012

Um die Frage nun endgültig im Rahmen der erhobenen Daten zu lösen, wurde eine multiple lineare Regression[2] für die drei Untergruppen errechnet. Die Daten sind in Tabelle 2 dargestellt. Es zeigt sich, dass in allen drei Kategorien der substantielle Effekt der Anzahl der erzielten Tore auf die Anzahl der Punkte höher ist als jener der Gegentore. Auch hier ist der Effekt zwar in der Gruppe der Meister und Nichtabsteiger niedriger als in der Gesamtheit der erhobenen Fälle, was allerdings auch an der niedrigeren Fallzahl liegen kann. 

Besonders interessant ist der große Unterschied zwischen beiden Werten in der Gruppe der Nichtabsteiger. Vor allem hier ist es also wichtiger, Tore zu erzielen, als möglichst wenige davon zu bekommen. 

Ebenfalls ist eine hohe statistische Signifikanz der Effekte aus der Tabelle abzulesen, es kann also ein zufälliger Zusammenhang ausgeschlossen werden, was allerdings der Tatsache, dass die von einem Team erreichte Punkteanzahl in einem Fußballspiel nun einmal eine Funktion der erzielten und erhaltenen Tore ist, auch nicht allzu sehr verwundern sollte. 


Alle Teams
Meister
Nichtabsteiger
Tore
0,6159**
(0,0325)
0.3681**
(0.1041)
0.3593**
(0.0892)
Gegentore
-0.5485**
(0.0291)
-0.3315*
(0.1219)
-0.1885**
(0.0635)
n
120
12
30
Standardfehler in Klammern
*signifikant für p≤0,05 **signifikant für p≤0,01
Tabelle 2: Lineare Regression 

4. Fazit

Zusammenfassend kann also gesagt werden, dass der oben zitierte Spruch für den untersuchten Zeitraum in der österreichischen Bundesliga nicht gültig ist. Vielmehr zeigt sich, dass die Anzahl der Punkte eher von der Anzahl der geschossenen Tore abhängt als von der Anzahl der Gegentore. Dieser Befund gilt gleichermaßen für Meister als auch für Mannschaften im Mittelfeld und solche, die sich vor dem Abstieg retten konnten. Zumindest in der österreichischen Bundesliga im Zeitraum von 200 bis 2012 galt also eher der Spruch: „Offence wins games – and championships“. Das ist einerseits eine gute Nachricht für alle Anhänger des Offensivfußballs, aber auch ein Hinweis auf die Verantwortlichen, dass sie sich nicht allzu sehr auf die Verhinderung von Toren fokussieren, sondern ruhig auch öfter selbst den Torerfolg suchen sollten.




[1] Für mehr Informationen über die Aussage einer Korrelation nach Pearson siehe: https://de.wikipedia.org/wiki/Korrelationskoeffizient
[2] Für mehr Informationen über lineare Regressionen siehe: https://de.wikipedia.org/wiki/Lineare_Regression