Posts mit dem Label Gegentore werden angezeigt. Alle Posts anzeigen
Posts mit dem Label Gegentore werden angezeigt. Alle Posts anzeigen

Sonntag, 24. Januar 2021

Salzburg: Could their defensive weakness cost them the title?

Although they finished the first part of the season in first place, they cannot be wholly satisfied with the way things are going. They lead the table only by goal difference and average only slightly more than two points per game, their lowest tally in recent years. Even last season, when they went into the Play-Offs technically six points behind their opponents LASK, they had a better point average, more goals scored and less goals conceded.

Their current problems are mainly down to defensive issues. They have conceded 15 goals in 12 league games, which is way more than their competitors Sturm (five goals conceded in the same period) and LASK (ten). From a historic perspective, their troubles become more evident: for the first time since the start of the 2016/17 season, they are averaging more than one goal conceded per game. This holds for both expected (1.15) and actual (1.25) goals.

We can see from this number that some of this is down to variation, given that they concede more goals than an average team would. But the difference of 0.1 per game amounts to only two goals in the course of the regular season, so not a huge factor to explain their worrying trends.

The issue was more pronounced in their international campaign. They finished third in the Champions League group and will therefore continue in the Europa League in February. Finishing in this position was however a bit more unfortunate than their current league standing. According to FBREF, they conceded 17 gaols from 8.7 expected ones. Their underlying performances had them as an only slightly below average (8.4 xG conceded) team, but their number of actual goals conceded was the second worst of the 32 teams in the group stage. Accordingly, no team had a higher percentage of xG that ended in goal (195%) or a bigger difference between expected (+2.7) and actual (-7) goal difference. They also had the best xG-difference in their group, topping reigning Champions League winners Bayern Munich (+2.4) and current La Liga leaders Atlético Madrid (+0.3).

Their domestic numbers this year leave them however only in 14th position in terms of expected goals per game conceded, out of a total of 56 club seasons in the league since 2016. They find themselves behind teams like Altach 2016/17 and LASK 2017/18, which both finished fourth. Another indicator of their relative weakness is that four of the six best teams in this ranking were previous versions of their own club.

 


The only conclusion from these numbers is that they have to improve defensively if they are to win the league yet again. But preparation during the winter break (which normally lasts around two months in Austria) was shortened to two weeks this year due to the full calendar, so the question remains if they were able to work a lot on the issue. They also did not do very much on the transfer market to alleviate their problems, bringing back in only defensive all-rounder Bernardo on loan from Brighton. At the same time, central defender Jérôme Onguéné left the club also on loan towards Genoa CFC.

So we can expect that their defensive numbers won't change much in the near future, which makes their offensive output the more important. The graph shows the expected number of points per game for different levels of expected goals per game scored, maintaining their current number of xG per game conceded at the fixed level. The vertical dotted lines show the actual levels of xG scored for the current and last two previous seasons.

If they keep scoring the same way, they are expected to finish the season with around 2.25 points per game, which in turn would be approximately 47 points after the end of the Play-Offs (note that points after the regular season are halved). This would be less than 2018/19 (52) and 2020/21 (50), but would in both years still have been enough to win the title.

The problem with these metrics is that until now, there are two teams in the league with also outstanding numbers, nearly reaching Salzburg's performance levels. LASK and Rapid (both not playing international football anymore, which might be a slight advantage), will challenge them in the upcoming months. This was not the case at the same level in previous years. If Salzburg are to overcome this challenge, they will have improve their defensive work and decrease the chances they concede to a lower level.

Montag, 21. Dezember 2020

Do supporters in the grounds affect results? Some evidence from Austria.

Remember when we (myself included) declared the end of home-ground advantage after football restarted? Well, not so fast. At least in the Austrian Bundesliga, things are pretty much back to normal, although we are back to closed gates after some games with fans in September and October.

We can see that away teams were actually slightly more successful even before the pandemic halted football for almost three months. They obtained around 0.1 points per game more than home teams in the 22 games before lockdown. This difference skyrocketed after restart to almost 0.5, which is generally why home-ground advantage was supposed to be at least severely damaged. Things have however changed since the start of the current season. Home teams obtain around one point more every five games than their opponents. Roughly the same is true for the number of goals scored. 

 

Interestingly, the pattern is almost identical for home and away teams if we look only at goals scored in the first half: a massive drop after restart and comparable levels in the 2020-21 games to the ones with full attendance. This also means that away teams completely outperformed home teams after the break in the ten matchdays between restart and the end of the season. Whether this is due to the absence of supporters and psychological effects thereof or just some random variation is unclear. 

Underlying statistics show a similar, although less contrastive picture. Home teams suffered a significant drop of performance levels after football restarted, both in terms of shots and expected goals. Games were almost completely level between home and away teams; hence the absence of home-ground advantage can be confirmed for this period. Interestingly, also away teams suffered a drop in expected goals after restart yet is was much smaller than the one for home teams.

 

 Since the start of the current season, things are however back to comparable levels to before the pandemic. Both home and away teams actually create around 0.1 xG per game more than before football was halted, hence the difference between them is basically the same. The question why all teams create more or better chances now than at the same time last year would be an interesting question for a separate thread or blog entry. In line with what we saw when looking at actual goals scored, analyzing expected goals shows that away teams massively outperformed their opponents especially after half-time.

One decisive point why away teams performed substantially better after restart was discipline. Referees seemed to punish them much less than before Covid, both in absolute terms as well as in comparison to home teams.

This pattern was somehow reversed after the start of the 2020/21 season. Not so much in terms of penalties, where away games are still treated preferably, although the difference between home and away teams is at the moment minimal. They still get around one penalty more every eight games, this difference was around three times higher in the final games of last season. Both get more penalties now than last season; the pressure on referees to award penalties is at least in this case negatively proportional to the number of fans in the stands.

 

Likewise, the conversion rate of penalties is much higher this season than last and also way above the long-term average of around 0.8. More than nine in ten penalties are converted this season, and the difference between home and away teams is again small. As in the case of penalties awarded, home teams suffered greatly after restart and are now at higher levels than they were before the pandemic.

Other disciplinary topics show more diverse patterns. Offside calls have been on the rise ever since, something I would not directly link to the number of spectators in stadia. These are (despite some confusing VAR cases) obviously more objective, binary decisions than fouls, cards or penalties.

 

Fouls and personal punishments were in my opinion the main drivers of away teams’ improved results after lockdown. In all three categories (fouls, yellow cards, send-offs), home teams were treated worse than their opponents in the ten rounds after football restarted, unlike before Covid. This pattern was reversed but for players sent off (both straight reds and second yellows), where they are still worse off. In all cases, the difference is however smaller than it was when fans where still allowed without restrictions, which would indicate that having full grounds does influence refereeing decisions.

So, do supporters influence results? To answer this question, the current scenario offers us nearly a natural experiment. Until matchday 22 of the past season, they were allowed without restrictions. After that, games where played completely behind closed doors until the end of the season. Then in summer, there was an initial limit of up to 10.000 visitors, which was in place however only for matchday 1 due to growing infection numbers. This limit was subsequently lowered to 3.000 and then 1.500, before the league had to return to closed gates. Under each scenario we had a couple of games played, although with a limited sample size, so conclusions should be taken with a grain of salt.

 

We can see that point average for home and away teams was relatively stable before a few games before football was stopped, with away teams overperforming their counterparts during a long time early in the season. They then started to perform worse, but immediately rose again to levels unseen before after restart and maintained this level for the rest of the season. With the return of fans, their performance levels dropped again and reached a low point a few games in the 3.000 supporters period. They then started to rise again and have reached parity with home teams lately, as one would suspect if we are to suppose that the presence of fans influences results for the teams they support. Evidence is not really robust, but we can definitely show that away teams performed better with lower attendance figures or no fans at all in the stadia.


Dienstag, 30. Dezember 2014

Die eigene und die gegnerische Stärke

"Beim Fußball verkompliziert sich alles durch die Anwesenheit der gegnerischen Mannschaft."
Jean-Paul Sartre


Die Anwesenheit des Gegners verkompliziert nicht nur die Angelegenheit für die eigene Mannschaft massiv, vielmehr ist dessen Qualität und die Relation zwischen eigener und seiner Stärke der stärkste Prädikator für den Ausgang des Spiels. Auch wenn man sich als Zuschauer und Anhänger besonders gern an Spiele zurückerinnert, in denen die sich die unterlegene Mannschaft gegen einen favorisierten, vielleicht sogar übermächtigen Gegner durchsetzte: Im Normalfall gewinnt das stärkere Team, was sich auch darin manifestiert, dass der Meister am Ende der Spielzeit ein besseres zur Verfügung hatte als die sonstigen Europacupstarter, und diese wiederum bessere als Nachzügler und Absteiger.

Dennoch gibt es natürlich auch immer Ausnahmen, und in einzelnen Spielen gewonnene Vorteile können sich auch durchaus summieren, sodass niedriger eingeschätzte Teams in der Tabelle am Schluss weit vorne stehen, während favorisierte Klubs hinterherlaufen müssen. Der Wolfsberger AC in der heurigen Herbstsaison ist ein Musterbeispiel für einen solchen Klub, der die Erwartungen massiv übererfüllt und weit mehr Punkte einfuhr, als er angesichts der eigenen Qualität im Vergleich zur Stärke der anderen Teams sollte. Für diese Mannschaften gilt die Formel, die in Graphik 1 dargestellt ist, nicht mehr oder nur teilweise. 


Graphik 1

Diese Formel beschreibt die Tordifferenz, also den Ausgang eines Spiels z, als Differenz der Qualität von Mannschaft i und Mannschaft j, zuzüglich des statistischen Fehlers e. Unter diesen fällt alles, was den Ausgang eines Spieles sonst noch beeinflussen könnte, wie beispielsweise Wetter, Bodenverhältnisse, Schiedsrichterentscheidungen, oder ganz einfach Glück und Zufall. Bei den Mannschaften, die überperformen, ist also in vielen Spielen e übermäßig groß, wodurch der Einfluss von Qi und Qj auf das Ergebnis rückläufig ist.

Natürlich ist der Höhenflug des WAC beispielsweise derzeit nicht nur auf Glück und positive Schiedsrichterentscheidungen zurückzuführen. Möglich ist durchaus, dass er auch einer erhöhten Qualität der Kärntner entspricht und dementsprechend alles im Lot ist. Eine sehr gute Transferperiode weist darauf hin, dass der Kader durchaus besser geworden ist. Andererseits muss auch darauf hingewiesen werden, dass bis jetzt kein allgemein akzeptierter Indikator existiert, mittels dessen fußballerische Qualität überhaupt objektiv gemessen werden kann. Es gibt zwar einige Faktoren, die sehr stark mit Erfolg korrelieren, sowohl auf Ebene eines einzelnen Spiels als auch im Vergleich von Vereinen miteinander, allerdings sind diese immer nur Annäherungen. 

So ist beispielsweise anzunehmen, dass  sich Vereine mit höheren Budgets, die sich unter anderem darin äußern, dass man mehr Geld in Ablösesummen und Gehälter für gute Spieler investieren kann, weiter vorne in der Tabelle klassifizieren können. Allerdings ist auch das kein perfekter Indikator, aus mehreren Gründen: einerseits sind die Daten diesbezüglich oft nicht öffentlich vorhanden, oder wenn, dann nicht unbedingt miteinander vergleichbar. Dies liegt an mangelnden Transparenzvorschriften. Andererseits geht die Gleichsetzung Budget = Qualität von einer Annahme aus, die auf rationalen Akteuren mit perfekter Information beruht. Das diese nicht realistisch ist, zeigt nicht nur die wirtschaftspsychologische Forschung, sondern auch die Praxis. So dürfte in Österreich beispielsweise nie eine andere Mannschaft als RB Salzburg Meister werden, und WR. Neustadt wäre längst abgestiegen. Man kann sich der realen Qualität also nur bis zu einem gewissen Grad annähern, was allerdings ein häufiges Problem empirischer Untersuchungen ist, wenn abstrakte Konzepte in konkrete Zahlen umgewandelt werden sollen.

Im folgenden wird der Versuch unternommen, die bisherigen Spiele der Bundesligasaison auf die obige Formel hin zu überprüfen. Als Indikator für die Qualität eines Teams wird dabei jedoch nicht seine ökonomische Stärke angewandt. Nach dem Motto "Die Tabelle lügt nicht" (was natürlich zweifelsfrei so nicht stimmt, aber für dieses Anliegen tut es seinen Zweck) wird die Qualität mittels des bisherigen Abschneidens in der Tabelle gemessen. Je niedriger der Tabellenplatz in der jeweiligen Runde, desto höher die Qualität und vice versa. Deshalb wird auch die erste Runde nicht in die Analyse mitaufgenommen, da in dieser die Teams naturgemäß noch keine Platzierung hatten. Deshalb beträgt die Stichprobengröße 18 Spiele pro Team, also insgesamt 180 Untersuchungseinheiten. Dazu muss angemerkt werden, dass dies nicht ganz zulässig ist, da naturgemäß die Tordifferenzen von Mannschaft i und j in Spiel z nicht voneinander unabhängig sind, sondern einem Nullsummenspiel gemäß miteinandern korrelieren. Wenn Team i die Tordifferenz um 1 erhöht, wird gleichzeitig die von Team j um 1 gesenkt. Das Sample ist also eigentlich nur halb so groß und besteht aus Dyaden (n=90). Allerdings sind die Ergebnisse nicht signifikant anders, wenn nur ein Team pro Spiel als Untersuchungseinheit ausgewählt wird. Die Tordifferenz wird anstatt der Punkte verwendet, da diese metrisch skaliert ist und nicht nominal, was einige statistische Analysen erleichtert, beziehungsweise überhaupt erst ermöglicht. Zudem ist sie im Sample sehr schön normalverteilt, was ebenfalls von Bedeutung bei üblichen statistischen Verfahren ist.

Graphik 2 zeigt die Ergebnisse von Regressionsanalysen, wenn die eigene Platzierung eines Teams (Modell 1), und zusätzlich die der gegnerischen Mannschaft (Modell 2) auf seine Tordifferenz in Spiel z regressiert werden. Im letzten Modell wird zudem zwischen Heim- und Auswärtsmannschaft unterschieden. Es zeigt sich, dass die Variablen den angenommenen Effekt haben und zudem statistisch ausreichend signifikant sind. So schießt ein Team pro Platz, den es in der Tabelle weiter oben (=hinten) liegt, 0,2 Tore pro Spiel weniger. Dieser Effekt ist auch nicht abhängig von der gegnerischen Platzierung; zwar ist die Tordifferenz gegen stärkere Teams dementsprechend niedriger, die beiden Faktoren hängen allerdings nicht miteinander zusammen. Ein Heimteam hingegen schießt 0,85 Tore mehr als ein Auswärtsteam, wenn alle anderen Faktoren gleich sind.


Graphik 2

Die Modelle sind allerdings nicht besonders gut, was sich an den niedrigen Werten in der vorletzten Zeile, neben dem Adj. R² (adjusted R², also korrigiertes Bestimmtheitsmaß), manifestiert. Dieser Wert variiert zwischen 0 und 1 und zeigt an, wie gut das Modell die Varianz in der abhängigen Variable, also in diesem Fall der Tordifferenz in jedem Spiel, erklären kann. Je höher dieser Wert ist, desto besser ist das Modell geeignet, weil es weniger Ausreißer gibt. Werte um die 0,1 sind nicht sonderlich gut, was allerdings viel Raum für den oben angesprochenen statistischen Fehler e lässt. Es gibt also noch sonstige Faktoren, die den Ausgang eines Spiels (mit-)erklären. Wie sehr die Modelle bei der Vorhersage der Ergebnisse daneben liegen können, zeigen die Ausgänge zweier Partien in Runde 19. Sowohl Salzburg als auch Wolfsberg hätten ihre Partien gegen Rapid beziehungsweise Admira laut Vorhersage mit einem Tor Unterschied gewonnen, in Wirklichkeit jedoch mit demselben Unterschied verloren.

Dennoch sind die Erkenntnisse aus Graphik 2 nicht trivial. Wichtig zu beobachten ist, dass insgesamt der Effekt der eigenen Platzierung fast doppelt so hoch ist wie der der gegnerischen, und ein weit höheres Signifikanzniveau (99,9% statt 95%) aufweist, also mit noch viel höherer Wahrscheinlichkeit keinen zufälligen Zusammenhang beschreibt. Die eigene Stärke ist also ein wichtigerer Faktor als die gegnerische bei der Vorhersage des Ergebnisses einer Partie.

Obwohl die gegnerische Stärke also der vernachlässigbarere Faktor ist, ist sie von besonderem Interesse in diesem Beitrag, weshalb im Folgenden besonders darauf eingegangen wird. Sieht man sich lediglich den Zusammenhang zwischen der Tordifferenz und der Platzierung des Gegners in der Tabelle an (Graphik 3), so wird ersichtlich, dass dieser nicht sonderlich stark ist, wie auch in den vorgehenden Regressionsgleichungen. Lediglich knapp drei Prozent der Varianz in der Tordifferenz wird mittels der Platzierung der gegnerischen Mannschaft in der Tabelle erklärt. Allerdings ist der Zusammenhang ausreichend signifikant. 

Dieser Befund ist möglicherweise dadurch verzerrt, dass er auf Daten aus der ersten Hälfte der Meisterschaft (plus Runde 19) beruht. In dieser Phase ist die Tabelle noch nicht besonders aussagekräftig, der Zufall spielt eine noch größere Rolle bei der Platzierung einzelner Teams als über eine gesamte Saison. Die Platzierung ist deshalb ein noch schwächerer Indikator für die wahre Qualität eines Teams. Diese Verzerrungen gleichen sich unter Umständen über die gesamte Saison eher aus, weshalb eine gesamte Spielzeit eine aussagekräftigere Stichprobe ist als nur eine Herbstmeisterschaft. Wenn mit den Daten der vorgehenden Saison 2013/14 diese Analyse wiederholt wird, zeigt sich, dass der Zusammenhang tatsächlich etwas stärker ist (r² = 0,05), allerdings immer noch nicht besonders hoch. Insgesamt kann also gesagt werden, dass ein Team umso besser gegen ein anderes abschneidet, je höher (weiter hinten) dieses in der Tabelle klassifiziert ist. Allerdings gibt es auch eine Menge Spiele, in denen sich diese Tendenz nicht widerspiegelt.


Graphik 3



Diese Analyse basiert auf aggregierten Daten von allen Teams; interessant ist in diesem Zusammenhang jedoch auch, welche Klubs in etwa dem allgemeinen Muster entsprechen und welche davon abweichen. Die Analyse wurde also für jeden einzelnen Klub wiederholt und in einem ähnlichen Diagramm abgebildet (Graphik 4), allerdings nur mit linearen Regressionslinien und nicht mit den Punkten, um die Übersichtlichkeit halbwegs beizubehalten. 

Da diese Geraden auf nur jeweils 18 Datenpunkten basieren, sind die Ergebnisse jedoch einigermaßen mit Vorsicht zu genießen. Tatsächlich sind die Korrelationen, anders als beim Modell mit allen Teams, nur in zwei Fällen statistisch signifikant, nämlich bei der Wiener Austria und Grödig. Die beiden Mannschaften sind auch die mit den steilsten Linien; sie tun sich also gegen Teams auf vorderen Tabellenplätzen besonders schwer, zu punkten, und dafür umso leichter gegen Tabellennachzügler. Insgesamt passt die Hälfte der Teams ganz gut in das allgemeine Muster. Neben den beiden erwähnten Teams sind das Ried, Salzburg und Sturm. Die Admira und Rapid weisen nur ganz leicht ansteigende auf, Altach eine leicht fallende. Zwei Teams passen hingegen gar nicht hinein: Wolfsberg und Wr. Neustadt, was angesichts der Tabellenpositionen der beiden Klubs ein interessantes Ergebnis ist. Wolfsberg tut sich offensichtlich schwer, gegen Teams, die in der Tabelle weiter hinten liegen und dementsprechend auch meist tief stehende, abwartende Taktiken verfolgen, die ihrer Tabellenplatzierung entsprechenden hohen Siege herauszuschießen. Wiener Neustadt hingegen hat Probleme, in den Duellen gegen Teams, die zumindest punktemäßig in Reichweite wären, Resultate zu holen. Das könnte im Abstiegskampf zu einem veritablen Problem werden, auch wenn man gegen den Neuntplatzierten, die Admira, noch ohne Niederlage ist. Der Befund bezüglich beider Teams wird auch durch die Tatsache beeinflusst, dass Wr. Neustadt gegen Wolfsberg beide Spiele im Untersuchungszeitraum gewann. Weder gelang ihnen das gegen irgendein anderes Team noch blieb Wolfsberg gegen ein anderes Team punktelos.

.
Graphik 4

Die letzte Abbildung in diesem Beitrag erlaubt, genau nachzuvollziehen, welches Team gegen welchen Gegner Punkte geholt beziehungsweise liegen gelassen hat. Die Tordifferenz, die in den vorherigen Analysen zur Messung der sportlichen Bilanz diente, wird hier hingegen nicht berücksichtigt. Die Hintergrundfarbe in Graphik 5 entspricht den in der Zelle ausgewiesenen Punkten, also das Punktemaximun von sechs ist blau hinterlegt, null Punkte gegen ein Team hingegen rot, etc. 

Wenn man sich die beiden Teams, die dem allgemeinen Modell besonders gut entsprechen (Austria und Grödig), sowie die beiden, bei denen dies überhaupt nicht der Fall ist (Wolfsberg und Wr. Neustadt), ansieht, zeigt sich, dass die Ergebnisse der Analysen weitgehend nicht davon abhängig sind, ob Punkte oder Torverhältnisse benützt werden. Die Austria beispielsweise holte aus gegen die drei höchstplatzierten Teams in der Tabelle nur fünf von 18 möglichen Punkten (TD von -7), gegen die drei untersten hingegen elf (+7). Bei Grödig verteilen sich die Punkte zwar etwas anders, aber die Bilanz gegen die drei besten und die drei schwächsten Teams ist insgesamt gleich (fünf bzw. elf Punkte, bei gesamten Tordifferenzen von -11 und +9, wobei die erstere von der 0:8 Niederlage gegen Salzburg nach oben getrieben wird).

Wolfsberg hingegen holte gegen Wiener Neustadt gar keinen Punkt und nur jeweils drei gegen Ried und die Admira. Die Tordifferenz in den Spielen gegen diese drei Teams beträgt insgesamt -1. Gegen die direkten Tabellennachbarn Salzburg und Altach blieb man hingegen mit je einem Sieg und einem Remis ungeschlagen, auch wenn jeder Sieg nur mit einem Tor Unterschied gelang. Wiener Neustadt wiederum konnte gegen die Top Drei immerhin die Hälfte der möglichen Punkte holen (neun, bei einer interessanterweise negativen Tordifferenz von -5). Gegen die direkten Konkurrenten im Abstiegskampf Admira, Ried und Grödig allerdings blieb man mit vier von 18 möglichen Punkten meist im Hintertreffen, und schoss dabei elf Treffer weniger, als man kassierte.



Graphik 5

Die Qualität der gegnerischen Mannschaft spielt also eine Rolle beim Ergebnis, das ein Team in einer Partie erreichen kann. Allerdings ist diese kleiner als die der eigenen Qualität und unabhängig von dieser. Zusätzlich verhält es sich nicht mit allen Teams gleich; manche punkten "erwartungsgemäß", also wenig gegen vorne platzierte Teams und mehr gegen Nachzügler, während andere gar keinen Trend aufweisen und wieder andere das komplette Gegenteil zeigen. Diese Ausreißer können sowohl vorne (Wolfsberg) als auch hinten (Neustadt) in der Tabelle platziert sein, die eigene Platzierung selbst scheint dabei also keine Rolle zu spielen. Wie sich dieses Punktemuster auswirkt, also ob sich liegen gelassene Punkte gegen kleinere Teams in der Tabelle rächen, wenn sie nicht kompensiert werden, kann mittels der Daten aus einer Saison nicht beantwortet werden. Dafür müsste man mit mehr Teams aus mehreren Saisonen arbeiten, was Stoff für einen zukünftigen Beitrag ist.

Sonntag, 9. Juni 2013

Defence wins championships?


Eine kleine statistische Untersuchung des Zusammenhangs zwischen erzielten und erhaltenen Toren und der Punkteanzahl. Mittels der Daten aus den zwölf abgelaufenen Saisonen kann gezeigt werden, dass die Anzahl der Punkte eher von der Anzahl der erzielten Tore als von der Anzahl der Gegentore abhängt. Die Annahme, die dem Satz zugrunde liegt, entspricht also zumindest in der österreichischen Bundesliga nicht der Realität.

1. Einleitung

Der Satz „Offence wins games, but defence wins championships“, also zu Deutsch „Die Offensive gewinnt Spiele, aber die Defensive gewinnt Meisterschaften“, ist vielen Fußballanhängern sicherlich geläufig. Die Annahme, dass sich im Verlauf einer Meisterschaft, die üblicherweise knapp vierzig Spielrunden andauern, eine gute Defensive besser auswirkt als eine gute Offensive, ist also weit verbreitet. 

Aber ist da auch etwas dran? Präziser gefragt: Lässt sich eine solche Tendenz auch in der österreichischen Bundesliga feststellen? Hält sie statistischen Methoden stand?

Um diese Frage beantworten zu können, wurden die letzten zwölf vorhergehenden Saisonen, also von 2000/01 bis 2011/12, untersucht. Die Daten wurden dabei in drei verschiedene Teilgruppen eingeteilt: Einerseits alle Teams (n=120), um den Einfluss der Toranzahl auf die Punkteanzahl insgesamt zu untersuchen; zweitens alle Meister (n=12), um zu prüfen, ob denn der oben zitierte Satz in der österreichischen Liga so stimmt; und drittens einige ausgewählte Nichtabsteiger (n=30), um zu erforschen, ob es für den Ligaerhalt besser ist, mehr Tore zu schießen, oder eher weniger Tore zu erhalten (idealerweise natürlich beides, aber das gilt für alle Teams). In diese letzte Gruppe fallen alle Teams, die Rang 8 und 9 in den Saisonen belegt haben, sowie zusätzlich alle jene, die nach dem letzten Spieltag zehn oder weniger Punkte Vorsprung auf den Absteiger hatten. 

2. Daten
 
Zuerst wurden die Daten graphisch in Form dreidimensionaler Scatterplots dargestellt (siehe Graphiken 1-3). Die erste Graphik, in der die Daten aller Teams dargestellt sind, zeigt den logischen und erwarteten Zusammenhang zwischen der Anzahl an Toren, Gegentoren und Punkten: Ein Band an Datenpunkten, das einigermaßen linear von links vorne oben in der Graphik (wenige Tore und Punkte, viele Gegentore) nach rechts hinten unten (viele Tore und Punkte, wenige Gegentore) führt.

 
Graphik 1

Der Großteil der Teams bewegt sich naturgemäß im Mittelfeld. Der Durchschnitt der Tore (und damit auch der Gegentore) beträgt über den gesamten Zeitraum 48,9. Während es jedoch einige Ausreißer nach oben in der Graphik gibt, also Teams mit übermäßig vielen Gegentoren, gibt es weniger davon nach rechts, also solche, mit „zu vielen“ Toren. Das ist bereits ein interessanter Hinweis auf die tatsächliche Natur des Zusammenhangs (die Standardabweichung über den gesamten Zeitraum beträgt 12,52 bei den Toren und 13,96 bei den Gegentoren).

 
Graphik 2

Bei der Reduktion der Darstellung nur auf die Meistermannschaften der zwölf untersuchten Saisonen ist die Tendenz naturgemäß etwas anders (siehe Graphik 2; beim Vergleich der unterschiedlichen Graphiken sind die unterschiedlichen Intervalle auf den Achsen zu beachten). So geht die Linie eher von links vorne unten weniger Tore, Gegentore und Punkte) nach rechts hinten oben (viele Tore, Gegentore und Punkte).

Allerdings fallen, auch bedingt durch die niedrigere Fallzahl, zwei Ausreißer auf: einerseits einer links vorne, also mit wenigen Toren und Punkten, und einer rechts hinten oben, also mit vielen Toren, aber auch besonders vielen Gegentoren. Bei beiden Teams handelt es sich um Meistermannschaften von RB Salzburg. Bei erstgenanntem handelt es sich um das Team von 2011/12, also dem letzten Jahr der Untersuchung, als wenige Punkte und Tore für den Titel reichten. Zweitgenannter Ausreißer ist das Team der Saison 2008/09, das unter Co Adriaanse die meisten Tore aller Meister erzielte, aber auch die mit Abstand meisten Gegentore erhielt.

 
 Graphik 3

In Graphik 3 wiederum sind die Daten der ausgewählten Nichtabsteiger abgebildet. Auch bei ihnen zeigen sich mehr Ausreißer, außerdem ist die Beziehung zwischen den Variablen nicht mehr so gleichmäßig linear von links oben vorne nach rechts unten hinten.

3. Berechnung

Nach dieser graphischen Aufarbeitung der Daten folgt die rechnerische. In Tabelle 1 sind die Korrelationen nach Pearson[1] zwischen Toren beziehungsweise Gegentoren und den Punkten für jede Saison einzeln sowie für alle Saisonen zusammen, die Meister und die ausgewählten Nichtabsteiger aufgeführt. Es zeigt sich, dass die Korrelationen im Zeitverlauf keinem Trend folgen. In fünf Saisonen ist die Korrelation zwischen Toren und Punkten höher als zwischen Gegentoren und Punkten, in sieben hingegen ist es umgekehrt. Das würde für die Richtigkeit der eingangs zitierten Phrase sprechen. Im langjährigen Mittel ist der Zusammenhang zwischen Toren und Punkten bei allen Teams jedoch leicht höher als der zwischen Gegentoren und Punkten. Noch viel größer sind die Unterschiede zwischen beiden Größen bei den Untergruppen der Meister und Nichtabsteiger, wobei hier jedoch auch die Zusammenhänge insgesamt kleiner sind. Dieser Befund wiederum spricht für das genaue Gegenteil des angenommenen Satzes, wonach die Defensive die Meisterschaft gewinnt.

Saison
Tore
Gegentore
2011/12
0,9357
-0,8206
2010/11
0,9427
-0,9607
2009/10
0,8598
-0,9005
2008/09
0,8514
-0,8620
2007/08
0,9398
-0,9227
2006/07
0,7896
-0,8731
2005/06
0,6690
-0,8903
2004/05
0,9612
-0,9135
2003/04
0,9820
-0,8972
2002/03
0,6989
-0,8061
2001/02
0,8948
-0,8766
2000/01
0,8728
-0,9704
Insgesamt
0,8477
-0,8460
Meister
0,5143
-0,1880
Nichtabsteiger
0,5035
-0,3148
Tabelle 1: Korrelationen nach Pearson zwischen Toren beziehungsweise Gegentoren und der Punkteanzahl, 2000-2012

Um die Frage nun endgültig im Rahmen der erhobenen Daten zu lösen, wurde eine multiple lineare Regression[2] für die drei Untergruppen errechnet. Die Daten sind in Tabelle 2 dargestellt. Es zeigt sich, dass in allen drei Kategorien der substantielle Effekt der Anzahl der erzielten Tore auf die Anzahl der Punkte höher ist als jener der Gegentore. Auch hier ist der Effekt zwar in der Gruppe der Meister und Nichtabsteiger niedriger als in der Gesamtheit der erhobenen Fälle, was allerdings auch an der niedrigeren Fallzahl liegen kann. 

Besonders interessant ist der große Unterschied zwischen beiden Werten in der Gruppe der Nichtabsteiger. Vor allem hier ist es also wichtiger, Tore zu erzielen, als möglichst wenige davon zu bekommen. 

Ebenfalls ist eine hohe statistische Signifikanz der Effekte aus der Tabelle abzulesen, es kann also ein zufälliger Zusammenhang ausgeschlossen werden, was allerdings der Tatsache, dass die von einem Team erreichte Punkteanzahl in einem Fußballspiel nun einmal eine Funktion der erzielten und erhaltenen Tore ist, auch nicht allzu sehr verwundern sollte. 


Alle Teams
Meister
Nichtabsteiger
Tore
0,6159**
(0,0325)
0.3681**
(0.1041)
0.3593**
(0.0892)
Gegentore
-0.5485**
(0.0291)
-0.3315*
(0.1219)
-0.1885**
(0.0635)
n
120
12
30
Standardfehler in Klammern
*signifikant für p≤0,05 **signifikant für p≤0,01
Tabelle 2: Lineare Regression 

4. Fazit

Zusammenfassend kann also gesagt werden, dass der oben zitierte Spruch für den untersuchten Zeitraum in der österreichischen Bundesliga nicht gültig ist. Vielmehr zeigt sich, dass die Anzahl der Punkte eher von der Anzahl der geschossenen Tore abhängt als von der Anzahl der Gegentore. Dieser Befund gilt gleichermaßen für Meister als auch für Mannschaften im Mittelfeld und solche, die sich vor dem Abstieg retten konnten. Zumindest in der österreichischen Bundesliga im Zeitraum von 200 bis 2012 galt also eher der Spruch: „Offence wins games – and championships“. Das ist einerseits eine gute Nachricht für alle Anhänger des Offensivfußballs, aber auch ein Hinweis auf die Verantwortlichen, dass sie sich nicht allzu sehr auf die Verhinderung von Toren fokussieren, sondern ruhig auch öfter selbst den Torerfolg suchen sollten.




[1] Für mehr Informationen über die Aussage einer Korrelation nach Pearson siehe: https://de.wikipedia.org/wiki/Korrelationskoeffizient
[2] Für mehr Informationen über lineare Regressionen siehe: https://de.wikipedia.org/wiki/Lineare_Regression