Sonntag, 9. Juni 2013

Defence wins championships?


Eine kleine statistische Untersuchung des Zusammenhangs zwischen erzielten und erhaltenen Toren und der Punkteanzahl. Mittels der Daten aus den zwölf abgelaufenen Saisonen kann gezeigt werden, dass die Anzahl der Punkte eher von der Anzahl der erzielten Tore als von der Anzahl der Gegentore abhängt. Die Annahme, die dem Satz zugrunde liegt, entspricht also zumindest in der österreichischen Bundesliga nicht der Realität.

1. Einleitung

Der Satz „Offence wins games, but defence wins championships“, also zu Deutsch „Die Offensive gewinnt Spiele, aber die Defensive gewinnt Meisterschaften“, ist vielen Fußballanhängern sicherlich geläufig. Die Annahme, dass sich im Verlauf einer Meisterschaft, die üblicherweise knapp vierzig Spielrunden andauern, eine gute Defensive besser auswirkt als eine gute Offensive, ist also weit verbreitet. 

Aber ist da auch etwas dran? Präziser gefragt: Lässt sich eine solche Tendenz auch in der österreichischen Bundesliga feststellen? Hält sie statistischen Methoden stand?

Um diese Frage beantworten zu können, wurden die letzten zwölf vorhergehenden Saisonen, also von 2000/01 bis 2011/12, untersucht. Die Daten wurden dabei in drei verschiedene Teilgruppen eingeteilt: Einerseits alle Teams (n=120), um den Einfluss der Toranzahl auf die Punkteanzahl insgesamt zu untersuchen; zweitens alle Meister (n=12), um zu prüfen, ob denn der oben zitierte Satz in der österreichischen Liga so stimmt; und drittens einige ausgewählte Nichtabsteiger (n=30), um zu erforschen, ob es für den Ligaerhalt besser ist, mehr Tore zu schießen, oder eher weniger Tore zu erhalten (idealerweise natürlich beides, aber das gilt für alle Teams). In diese letzte Gruppe fallen alle Teams, die Rang 8 und 9 in den Saisonen belegt haben, sowie zusätzlich alle jene, die nach dem letzten Spieltag zehn oder weniger Punkte Vorsprung auf den Absteiger hatten. 

2. Daten
 
Zuerst wurden die Daten graphisch in Form dreidimensionaler Scatterplots dargestellt (siehe Graphiken 1-3). Die erste Graphik, in der die Daten aller Teams dargestellt sind, zeigt den logischen und erwarteten Zusammenhang zwischen der Anzahl an Toren, Gegentoren und Punkten: Ein Band an Datenpunkten, das einigermaßen linear von links vorne oben in der Graphik (wenige Tore und Punkte, viele Gegentore) nach rechts hinten unten (viele Tore und Punkte, wenige Gegentore) führt.

 
Graphik 1

Der Großteil der Teams bewegt sich naturgemäß im Mittelfeld. Der Durchschnitt der Tore (und damit auch der Gegentore) beträgt über den gesamten Zeitraum 48,9. Während es jedoch einige Ausreißer nach oben in der Graphik gibt, also Teams mit übermäßig vielen Gegentoren, gibt es weniger davon nach rechts, also solche, mit „zu vielen“ Toren. Das ist bereits ein interessanter Hinweis auf die tatsächliche Natur des Zusammenhangs (die Standardabweichung über den gesamten Zeitraum beträgt 12,52 bei den Toren und 13,96 bei den Gegentoren).

 
Graphik 2

Bei der Reduktion der Darstellung nur auf die Meistermannschaften der zwölf untersuchten Saisonen ist die Tendenz naturgemäß etwas anders (siehe Graphik 2; beim Vergleich der unterschiedlichen Graphiken sind die unterschiedlichen Intervalle auf den Achsen zu beachten). So geht die Linie eher von links vorne unten weniger Tore, Gegentore und Punkte) nach rechts hinten oben (viele Tore, Gegentore und Punkte).

Allerdings fallen, auch bedingt durch die niedrigere Fallzahl, zwei Ausreißer auf: einerseits einer links vorne, also mit wenigen Toren und Punkten, und einer rechts hinten oben, also mit vielen Toren, aber auch besonders vielen Gegentoren. Bei beiden Teams handelt es sich um Meistermannschaften von RB Salzburg. Bei erstgenanntem handelt es sich um das Team von 2011/12, also dem letzten Jahr der Untersuchung, als wenige Punkte und Tore für den Titel reichten. Zweitgenannter Ausreißer ist das Team der Saison 2008/09, das unter Co Adriaanse die meisten Tore aller Meister erzielte, aber auch die mit Abstand meisten Gegentore erhielt.

 
 Graphik 3

In Graphik 3 wiederum sind die Daten der ausgewählten Nichtabsteiger abgebildet. Auch bei ihnen zeigen sich mehr Ausreißer, außerdem ist die Beziehung zwischen den Variablen nicht mehr so gleichmäßig linear von links oben vorne nach rechts unten hinten.

3. Berechnung

Nach dieser graphischen Aufarbeitung der Daten folgt die rechnerische. In Tabelle 1 sind die Korrelationen nach Pearson[1] zwischen Toren beziehungsweise Gegentoren und den Punkten für jede Saison einzeln sowie für alle Saisonen zusammen, die Meister und die ausgewählten Nichtabsteiger aufgeführt. Es zeigt sich, dass die Korrelationen im Zeitverlauf keinem Trend folgen. In fünf Saisonen ist die Korrelation zwischen Toren und Punkten höher als zwischen Gegentoren und Punkten, in sieben hingegen ist es umgekehrt. Das würde für die Richtigkeit der eingangs zitierten Phrase sprechen. Im langjährigen Mittel ist der Zusammenhang zwischen Toren und Punkten bei allen Teams jedoch leicht höher als der zwischen Gegentoren und Punkten. Noch viel größer sind die Unterschiede zwischen beiden Größen bei den Untergruppen der Meister und Nichtabsteiger, wobei hier jedoch auch die Zusammenhänge insgesamt kleiner sind. Dieser Befund wiederum spricht für das genaue Gegenteil des angenommenen Satzes, wonach die Defensive die Meisterschaft gewinnt.

Saison
Tore
Gegentore
2011/12
0,9357
-0,8206
2010/11
0,9427
-0,9607
2009/10
0,8598
-0,9005
2008/09
0,8514
-0,8620
2007/08
0,9398
-0,9227
2006/07
0,7896
-0,8731
2005/06
0,6690
-0,8903
2004/05
0,9612
-0,9135
2003/04
0,9820
-0,8972
2002/03
0,6989
-0,8061
2001/02
0,8948
-0,8766
2000/01
0,8728
-0,9704
Insgesamt
0,8477
-0,8460
Meister
0,5143
-0,1880
Nichtabsteiger
0,5035
-0,3148
Tabelle 1: Korrelationen nach Pearson zwischen Toren beziehungsweise Gegentoren und der Punkteanzahl, 2000-2012

Um die Frage nun endgültig im Rahmen der erhobenen Daten zu lösen, wurde eine multiple lineare Regression[2] für die drei Untergruppen errechnet. Die Daten sind in Tabelle 2 dargestellt. Es zeigt sich, dass in allen drei Kategorien der substantielle Effekt der Anzahl der erzielten Tore auf die Anzahl der Punkte höher ist als jener der Gegentore. Auch hier ist der Effekt zwar in der Gruppe der Meister und Nichtabsteiger niedriger als in der Gesamtheit der erhobenen Fälle, was allerdings auch an der niedrigeren Fallzahl liegen kann. 

Besonders interessant ist der große Unterschied zwischen beiden Werten in der Gruppe der Nichtabsteiger. Vor allem hier ist es also wichtiger, Tore zu erzielen, als möglichst wenige davon zu bekommen. 

Ebenfalls ist eine hohe statistische Signifikanz der Effekte aus der Tabelle abzulesen, es kann also ein zufälliger Zusammenhang ausgeschlossen werden, was allerdings der Tatsache, dass die von einem Team erreichte Punkteanzahl in einem Fußballspiel nun einmal eine Funktion der erzielten und erhaltenen Tore ist, auch nicht allzu sehr verwundern sollte. 


Alle Teams
Meister
Nichtabsteiger
Tore
0,6159**
(0,0325)
0.3681**
(0.1041)
0.3593**
(0.0892)
Gegentore
-0.5485**
(0.0291)
-0.3315*
(0.1219)
-0.1885**
(0.0635)
n
120
12
30
Standardfehler in Klammern
*signifikant für p≤0,05 **signifikant für p≤0,01
Tabelle 2: Lineare Regression 

4. Fazit

Zusammenfassend kann also gesagt werden, dass der oben zitierte Spruch für den untersuchten Zeitraum in der österreichischen Bundesliga nicht gültig ist. Vielmehr zeigt sich, dass die Anzahl der Punkte eher von der Anzahl der geschossenen Tore abhängt als von der Anzahl der Gegentore. Dieser Befund gilt gleichermaßen für Meister als auch für Mannschaften im Mittelfeld und solche, die sich vor dem Abstieg retten konnten. Zumindest in der österreichischen Bundesliga im Zeitraum von 200 bis 2012 galt also eher der Spruch: „Offence wins games – and championships“. Das ist einerseits eine gute Nachricht für alle Anhänger des Offensivfußballs, aber auch ein Hinweis auf die Verantwortlichen, dass sie sich nicht allzu sehr auf die Verhinderung von Toren fokussieren, sondern ruhig auch öfter selbst den Torerfolg suchen sollten.




[1] Für mehr Informationen über die Aussage einer Korrelation nach Pearson siehe: https://de.wikipedia.org/wiki/Korrelationskoeffizient
[2] Für mehr Informationen über lineare Regressionen siehe: https://de.wikipedia.org/wiki/Lineare_Regression

Samstag, 18. Mai 2013

Mit Österreichern zum Erfolg?

Mannschaften, die mehr österreichische Spieler einsetzen, werden von der Bundesliga aus dem sogenannten Österreichertopf finanziell entlohnt. Doch welche Auswirkungen hat dieser Topf auf die sportliche Leistung der Teams? Wie schneiden Teams ab, die mehr Österreicher einsetzen? Die Daten zeigen, dass der Einsatz von Österreichern tatsächlich negative Auswirkungen auf das sportliche Abschneiden eines Teams hat. 


Downloadlink für das gesamte pdf-Dokument:
 https://docs.google.com/file/d/0B0vhspCsRtRbNW5HME9IX1NMeGs/edit?usp=sharing

Mittwoch, 18. Juli 2012

Analyse der Kader der Bundesligisten

Analog zu einem ähnlichen Eintrag über die Kader der heurigen EM-Teilnehmer werden im Folgenden einige Statistiken über die Kader der Bundesligisten graphisch aufbereitet.

1. Alter 

Die Kategorie, die üblicherweise benützt wird, um das Alter zu ermitteln, ist das durchschnittliche Alter der Kaderspieler. Diese Größe ist nicht ganz unproblematisch, so wie jeder Durchschnitt nicht unproblematisch ist, soll aber dennoch herangezogen werden. Graphik 1 zeigt das durchschnittliche Alter der zehn Bundesligisten. 

 Graphik 1

Interessant ist, dass acht von zehn Bundesligisten im Bereich von 24 Jahren liegen (± ein halbes Jahr). Die einzigen beiden Ausnahmen sind (wenig überraschend )Ried, das durchschnittlich über ein Jahr jünger ist als die zweitjüngste Mannschaft, und Aufsteiger Wolfsberg, der den mit Abstand ältesten Kader hat. Weniger überraschend ist, dass Meister Salzburg den zweitältesten Kader hat, vielleicht schon eher hingegen, dass Sturm Graz, das regelmäßig für die Durchlässigkeit vom Nachwuchs- in den Profibereich gelobt wird, einen doch eher älteren Kader hat. Allerdings befindet sich dieser im Umbruch, und wahrscheinlich zeigt sich nächstes Jahr bereits ein ganz anderes Bild. 

Da diese Kategorie wie gesagt nicht ausreicht, um einen genaueren Einblick in die Kaderstruktur zu bekommen, zeigt Graphik 2 die Kader der Bundesligisten in vier Alterskategorien eingeteilt: bis 19 (blau), 20 bis 24 (rot), 25 bis 29 (gelb) sowie 30 und älter (grün).

Graphik 2

Hier zeigt sich ein etwas differenzierteres Bild:

  • Wolfsberg kommt auf seinen hohen Altersschnitt durch den hohen Anteil an Spielern zwischen 25 und 29, der fast 2/3 beträgt. 
  • Bei Salzburg ist der Sachverhalt ähnlich.
  • Die Admira sowie auch Rapid und Wr. Neustadt setzen als einzige Mannschaften zu über 50% auf Spieler zwischen 20 und 24, was den relativ niedrigen Altersschnitt der drei Klubs erklärt.
  • Sturm, Innsbruck und Mattersburg haben alle in etwa ein Fünftel an Spielern, die über 30 sind, die anderen Vereine höchstens ein Achtel.
  • Ried hat davon nur einen einzigen (Gebauer), und auch den höchsten Anteil an Teenagern (über 22%), wodurch der niedrigste Altersschnitt aller Teams erklärt wird. 

2. Erfahrung

Ein anderer wichtiger Faktor, der häufig hervorgehoben wird, ist die Erfahrung der Spieler. Graphik 3 zeigt diese, gemessen anhand der durchschnittlichen Anzahl an absolvierten Erstligaspielen.

Graphik 3

Wenig überraschend haben die beiden durchschnittlich zweit- und drittältesten Teams, nämlich Salzburg und Sturm, auch die meiste Erfahrung. Auch die Wiener Vereine sowie Mattersburg finden sich weit vorne. Wolfsberg hat hingegen beinahe eine reine Zweitligatruppe, die sich unter Umständen erst an das geänderte Umfeld gewöhnen wird müssen. Allerdings hat auch die Admira einen relativ unerfahrenen Kader, und bekanntlich im letzten Jahr weit vorne mitgespielt. 

3. Fazit

Graphik 4 zeigt das Ergebnis, wenn die beiden Variablen Durchschnittsalter und Durchschnittserfahrung miteinander verbunden werden. Interessant ist, dass dabei kaum Unterschiede zu Graphik 3 bestehen. Daraus kann geschlossen werden, dass es kaum junge Spieler in der Liga gibt, die überdurchschnittlich viele Spiele bestritten haben und kaum ältere, die noch über wenig Erfahrung verfügen. 

Graphik 4