Freitag, 26. Juni 2015

Die Dreierkette brachte den Umschwung

Der verantwortliche Trainer ist zwar weg, aber er hinterlässt doch ein interessantes taktisches Vermächtnis. Nach einem durchaus mäßigen Start in die Saison, als man für zwei Runden sogar am letzten Tabellenplatz lag, stellte Oliver Glasner formativ auf eine Dreierabwehr um. Dadurch konnte sich die Mannschaft stabilisieren und landete ungefährdet auf dem sechsten Abschlussplatz, noch einen Punkt vor der weit höher eingeschätzten Wiener Austria und insgesamt punktemäßig in etwa dort, wo man das Team vor der Saison auch erwartet hätte.

Die Umstellung selbst war zwar vielleicht etwas aus der Not geboren, da die Personallage vor dem Spiel in Salzburg in der 12. Runde so dünn wurde, dass kaum mehr Alternativen verblieben. Dazu mag die Qualität des Gegners eine besondere Rolle gespielt haben. Wie der Beitrag zeigen will, war die taktische Neuorientierung allerdings genau richtig. Die SV Ried spielte mit Dreierkette signifikant besser als mit Viererabwehr.


1. Einleitung: Die Dreierkette als internationaler Trend


Sonntag, 10. Juni 2012, Danzig. Welt- und Europameister Spanien beißt sich an Italiens Hintermannschaft im ersten Gruppenspiel der Gruppe C beinahe die Zähne aus. Trotz eindeutiger Dominanz und klarer Überlegenheit kann sich der Favorit kaum Torchancen herausspielen, der letzte Pass will einfach nicht gelingen. Schließlich gerät man durch ein Kontertor von Di Natale sogar in Rückstand, erst nach einer Superkombination über Iniesta und Silva, der durchsteckt, gelingt Fàbregas der Ausgleich, das Spiel endet 1:1.

Zumindest teilweise kann man die starke Defensivleistung Italiens auf den Einsatz einer extrem variablen Dreierkette um Daniele de Rossi zurückführen, die Spaniens Offensivakteure mit striktem Positionsspiel und aggressivem Tackling vor beinahe unlösbare Probleme stellte (eine ausführliche taktische Analyse des Spieles findet sich beispielsweise hier und hier).
Auch in der italienischen Liga ist diese Defensivformation durchaus üblich: Napoli beispielsweise setzte schon vor einigen Jahren darauf, und Juventus wurde (teilweise) mit Dreierkette in der abgelaufenen Doublesieger und Champions League-Finalist

Doch dieser Trend beschränkt sich nicht nur auf Italien; beispielsweise konnte Chile unter Coach Marcelo Bielsa mit einer Dreierkette bei der WM 2010 bis ins Achtelfinale vorstoßen. Auch Pep Guardiola beim FC Bayern experimentierte in der vergangenen Saison teilweise damit. Bei der letztjährigen Weltmeisterschaft lag die Dreier- bzw. Fünferkette absolut im Trend. Umso bezeichnender, dass sie außer bei Ried bei keinem österreichischen Bundesligisten regelmäßig eingesetzt wurde. Das Land hinkt eben taktisch hinterher.

Die Gründe, sich für eine derartige Formation in der Defensive zu entscheiden, können vielfältig sein. Einerseits kann man mit drei zentralen Verteidigern die Mitte des Spielfeldes besser kontrollieren und dominieren, was sicherlich einer der ausschlaggebenden Gründe für Italiens Coach Prandelli war. Vor allem gegen Teams, die von der Qualität her höher einzuschätzen sind, kann dieser Faktor eine wichtige Rolle spielen. Gegen Gegner, die mit zwei zentralen Sturmspitzen agieren, hat die Dreierkette für die verteidigende Mannschaft wiederum den Vorteil, leichter Überzahlsituationen herzustellen, was einer der Beweggründe Bielsas war. Guardiola wiederum wollte seine Mannschaft weiterentwickeln und sie formationstechnisch noch flexibler und weniger ausrechenbar zu machen.

Natürlich hat die Formation nicht nur Vorteile. Einerseits „verliert“ man natürlich durch den zusätzlichen Verteidiger einen offensiven Spieler, was die Optionen im Spiel nach vorne beschränkt. Andererseits ist die Einübung dieser Formation mit Spielern, die sie nicht gewohnt sind, eine Angelegenheit, die viel Zeit in Anspruch nimmt. Zeit, die man im Profifußball grundsätzlich nicht hat. Deshalb hat der bereits erwähnte Bielsa sie beispielsweise als Vereinstrainer bei Athletic Bilbao nach einigen Versuchen, sie einzuführen, ad acta gelegt. Dies könnte ein Grund sein, warum sie doch vor allem im deutschsprachigen Raum noch eher selten eingesetzt wird (mit Ausnahme der situativen Dreierkette im Spielaufbau, aber das ist ein anderes Thema).


2. Die Dreierkette bei der SV Ried


Erstmals setzte Oliver Glasner wie bereits erwähnt in Runde 12 auf eine Dreierkette; eine Entscheidung, die sofortige Auswirkungen auf die Leistung seiner Mannschaft hatte. Als Indikator für die Leistung eines Teams benütze ich wie üblich TSR und STR, die in diesem Interview näher erläutert werden. Wie Graphik 1 zeigt, stabilisierte sich die Performance seines Teams bereits zwei Runden später nachhaltig. Zwar war die TSR des Teams noch knapp über 0,5, also positiv; der Trend ging in den Spielen allerdings nach unten, und die aussagekräftigere STR war bereits nach drei Runden in den negativen, obwohl noch nicht besorgniserregenden, Bereich gefallen. Deren Trend war zwar positiv, das schlug sich jedoch nicht in den Resultaten nieder. Der PDO der SV Ried war zu diesem Zeitpunkt der zweitniedrigste der Liga, was darauf hinweist, dass die Mannschaft besser war als der Tabellenrang.  Darauf zu warten, dass die Ergebnisse endlich die Leistungen widerspiegeln, ist im Fußball allerdings nicht immer die klügste Lösung. Zu diesem Zeitpunkt könnte es bereits zu spät sein, die sportlichen Ziele könnten sich bereits außer Reichweite befinden. 

 
 Graphik 1: Entwicklung von TSR (schwarz) und STR (blau) der SV Ried in der Saison 2014/15 während der ersten 35 Runden. Die vertikale rote Linie markiert den erstmaligen Einsatz der Dreierkette.

Die Entscheidung entpuppte sich auf jeden Fall im Nachhinein als richtig. Im ersten Spiel mit Dreierkette selber konnte man zwar keine Punkte einfahren, allerdings den Meister in dessen Heimstadion immerhin stark fordern und zweimal dessen Führungstreffer ausgleichen. Wenngleich die Niederlage in der Partie insgesamt verdient war, markierte das Spiel doch eine Zäsur. Weder TSR noch STR fielen ab Runde 14 jemals wieder unter die 0,5-Grenze. Speziell im Frühjahr präsentierte man sich diesbezüglich auch sehr stabil (das letzte Saisonspiel ist in allen Graphiken ausgespart, da Oliver Glasner zu diesem bereits beurlaubt war). Anders ausgedrückt: Während man mit Viererkette in über einem Drittel der Spiele auf eine negative STR kam, war dies mit Dreierkette lediglich in etwa einem Viertel der Spiele der Fall.

Interessanterweise diente die Dreierkette bei Ried nicht nur für defensive Stabilisierung, was unter Umständen ein wichtiger Beweggrund für die Umstellung war (Ried hielt vor der Umstellung bei einem negativen Torverhältnis und einem Schnitt von fast zwei Gegentoren pro Spiel). Vielmehr profitierte auch das Spiel nach vorne von der taktischen Maßnahme.

 Graphik 2: Vergleich von Schussstatistiken der SV Ried mit Dreier- und Viererkette, wiederum basierend auf Daten der Runden 1-35 der Saison 2014/15.

Wie in Graphik 2 ersichtlich wird, kam die SV Ried in Spielen, in denen sie mit Dreierkette, auf fast eineinhalb Schüsse mehr als in jenen mit Viererkette. Auch konnten etwa 0,9 Schüsse pro Spiel mehr aufs Tor abgegeben werden. Die Überlegenheit der Dreierkette ist bei den Defensivstatistiken kurioserweise etwas weniger stark ausgeprägt, aber auch anzufinden. Etwa 1,1 Schüsse pro Spiel wurden weniger zugelassen, dazu gaben die Gegner 0,1 Schüsse aufs Tor weniger ab. Diese Unterschiede klingen vielleicht nicht besonders groß, summieren sich im Laufe einer ganzen Saison jedoch. Hochgerechnet auf 36 Spiele würde dies ceteris paribus bedeuten, dass das Team 50 Schüsse mehr abgeben und 39 weniger zulassen würd. Wenn man davon ausgeht, dass ungefähr jeder zehnte Schuss zu einem Tor führt, bedeutete das, dass in den 36 Spielen rund fünf Tore mehr erzielt und vier weniger erhalten würden. Wenn man weiters davon ausgeht, dass in Österreich ein erzieltes Tor im Durchschnitt 0,62 Punkte mehr bringt und ein erhaltenes dementsprechend 0,55 weniger, verursachten diese vermeintlich nur kleinen Unterschiede über eine gesamte Saison gerechnet einen Unterschied von immerhin fünf Punkten mehr; wie weiter unten ausgeführt, hätte man damit heuer durchaus in den Kampf um Europa eingreifen können. Diese Rechnung ist zwar sehr abstrahiert und nur ein Erwartungswert, erweist sich aber als robust, selbst wenn man sie wie unten mit weniger aussagekräftigen Statistiken wie Punkten pro Spiel vergleicht.

Der Zusammenhang ist zwar indirekt, aber mit der Dreierkette landeten auch mehr der abgegebenen Schüsse tatsächlich am Tor (35,69% gegenüber 32,76%). Paradoxerweise gilt dies auch für die gegnerischen Schüsse (40% wenn Ried mit Dreierkette antrat, nur 37,11% bei Viererkette). Man schaffte es also offensichtlich, zwar insgesamt besser zu verteidigen, und weniger gegnerische Schüsse zuzulassen. Die Schüsse allerdings, die zugelassen wurden, waren allerdings gefährlicher. Dies schlägt sich auch in den Torquoten nieder; mit Dreierkette führten 10,15% der Rieder Schüsse zum Torerfolg, mit Viererkette hingegen nur 9,2%. Die Unterschiede bei den gegnerischen Torquoten sind wiederum nur minimal: Wenn Ried mit einer Dreierkette antrat, landeten 12,65% der gegnerischen Schüsse im Tor, mit Viererkette 12,58%, also nur unwesentlich weniger.


Graphik 3: Vergleich von Punkten, Toren und Gegentoren unter Dreier- und Viererkette, wiederum basierend auf Daten der Runden 1-35 der Saison 2014/15. Die roten waagrechten Linien zeigen den Ligadurchschnitt an.

Wie aufgrund der verbesserten Schussstatistiken zu erwarten war, schlug sich die taktische Umstellung auch auf die Rieder Ergebnisse durch. Man beendete die Spielzeit in der Endabrechnung mit einem Punkt mehr als in der Saison davor, zudem mit einer beinahe ausgeglichenen Tordifferenz (-2).Wenn man den Punkteschnitt der Spiele mit Dreierkette über die gesamten 36 Runden halten hätte können, wäre man wie aufgrund der Schussstatistiken erwartet auf 49 Punkte in der Endabrechnung gekommen und hätte mit etwas Glück sogar in die Europacupplätze rutschen können. Mit dem Punkteschnitt aus Partien mit Viererkette wäre man hingegen mit 36 Zählern nur Achter geworden, also noch zwei Plätze schwächer. Zudem erzielte man mit Dreierkette mehr Tore und erhielt weniger als der durchschnittliche Bundesligist, während man mit Viererkette nur unterdurchschnittliche Leistungen abrufen konnte.


3. Fazit

 

Der verantwortliche Trainer ist wie bereits erwähnt weg, und deshalb bleibt fraglich, ob die vorhergehenden Zeilen aus einer anderen denn einer historischen und theoretischen Sichtweise relevant bleiben können. Sein Nachfolger wäre allerdings nicht schlecht beraten, die Grundformation mit drei zentralen Verteidigern beizubehalten und sie zumindest als taktische Variante in petto zu haben. Auch für andere Vereine kann die Rieder Erfahrung als Anleitung für eigene taktische Maßnahmen dienen. Natürlich kann aus den Ergebnissen der letzten Saison nicht geschlossen werden, dass in der nächsten Saison automatisch mit einer Dreierkette bessere Ergebnisse eingefahren werden würden als ohne. Allerdings spricht doch einiges dafür, dass sie weiterhin eine potentiell sehr effektive taktische Waffe sein wird. Dazu zählt beispielsweise ihre weiterhin geringe Verbreitung in der österreichischen Bundesliga, verbunden damit ist eine geringe Vertrautheit vonseiten der Gegner, sie effektiv zu bespielen. Zwar setzten einige Vereine (Admira, Austria, Sturm) in Einzelfällen in der vergangenen Saison auf Dreier- oder Fünferketten, dies aber meist als Ad-hoc-Maßnahme, um individuell (vermeintlich) überlegenen Gegnern das Toreschießen zu erschweren. Das ist zwar einer der möglichen Vorteile einer Dreierkette, beileibe aber nicht der einzige. Dazu kommt, dass dies nur funktioniert, wenn die Mannschaft einigermaßen mit den formativ geänderten Abläufen vertraut ist. Sonst dient der zusätzliche Abwehrmann oft nur einer vorsätzlichen Abwehrschlacht, erschwert also nicht nur gegnerische, sondern auch eigene Angriffsbemühungen. Das Beispiel Ried zeigt allerdings, dass eine wohlsituierte Dreierkette sowohl Defensiv- als auch Offensivspiel und damit die gesamte Leistung eines Teams verbessern kann. 


Anmerkung: Graphiken zum Vergrößern anklicken.



Montag, 15. Juni 2015

Comparing the Predictive Power of Market Value, Goalimpact and Club Elo

1. Introduction: Assessing football clubs' quality

 

Football results are extremely hard to predict. Due to the low-scoring nature of the game, surprising results are more common than in other sports, making the exact prediction of single matches' outcome increasingly difficult. On the long run however, quality tends to pay off, and better teams finish ahead of clubs with lower quality in the final classification. Although seasons with 34 or 38 matchdays as in the case of the two leagues studied hereafter are not long enough to completely rule out statistical noise and the role of coincidence and luck, tables based on them are certainly way more meaningful than single games. The fact that Barcelona were crowned Spanish champion did surely not surprise a lot of people, neither did Paderborn's relegation.

But how can the competing teams' quality be assessed? And how do these assessments transfer into predictions? There is no generally accepted measurement to examine individual players' or complete squads' footballing quality. Yet there are some intents of providing objective evaluations, which are also making their work public. Some of these are assessed in this blog entry and compared according to their ability to predict teams' performances correctly. The three measures I chose are Market Value, Goalimpact and Club Elo. The main reason for this choice was public availability and comparability over teams and leagues. These factors also ruled out all European football leagues but two, since I found data for the Goalimpact index only for the German Bundesliga and the Premier League.  The number of observations is therefore limited to 38 (18 German and 20 English clubs from the 2014/15 season).

All of them share some features, but also have some different characteristics which in turn might influence their predictive power. Goalimpact and Market Value are assessments of individual players, whose values are averaged in order to calculate a value for the total team. Averaging has the problem that it is possibly a biasing step; the value contains no information on the composition of the team, hence two teams with equal values might in fact have very different preconditions to work with. Consider the extreme examples of one team which comprises players of exactly the same quality and one which value might be driven by outliers, especially if the squad is small. Market Value and Goalimpact are on the other side more flexible indicators than Elo, since their values are altered immediately if the overall quality of a team is changed through transfers. Elo itself is in my understanding not susceptible to transfers.

Goalimpact and especially Elo are based above all on past performances, i.e. results. Results themselves are no perfect, yet acceptable predicator for future results. Goalimpact tries to overcome this issue by taking players' age and their expected peak performance into account, Elo weights results according to opposition strength, which makes them a more sound assessment of quality. The other side of the coin is that the two are at least in theory more objective than Market Values which are based on users' subjective evaluations of players' quality and their future potential, although this weakness might be overcome by the wisdom of the crowd.

In spite of these differences, the values of the three indices for the 38 clubs in the sample correlate highly with each other. As can be seen in Graph 1, the strongest correlation exists between Market Value and Goalimpact. This fact might be due to the mentioned fact that they are both based on individual players' assessments which take into account past performances but also future potential. Although the correlations of these two with Club Elo is lower, it is still quite impressive (an r² of around 0.8).

Graph 1 

In order to examine which of these three indicators works best to predict teams' sporting performances, the correlations of the respective values with the teams' points per game values are presented in the following graphs. Data therefore were gathered using the websites of the indicators. In order to avoid endogeneity, i.e. values influenced by the footballing performances themselves, timing have to be taken into account. Market Value data where therefore taken from October 2014. This value is arguably the most convincing, since it is the only one updated between the two transfer periods. Taking the value of July would bias results since a lot of transfers happened in the weeks before deadline, consider only Louis van Gaal's massive spending on the likes of Di María, Rojo and Blind, which raised Manchester United's average Market Value from 14.4 million € on July 10th to 16.4 on October 23th. Since the majority of games is played after transfer deadline, the market value after the last transfers should be a more precise predicator than an earlier one. Goalimpact data were collected from the link above, and the value taken for Club Elo was the one before the first league game of the season.

2. Which indicator works best?

 

Every of the following three graphs shows the relationship between one of the indicators (on the x-axis) and the teams' performance (points per game on the y-axis). The points are coloured differently according to the league each team belongs to; red spots represent German teems and green ones English teams. The grey shades represent 95% confidence intervals, the blue line an OLS regression. All three correlations are statistically highly significant (p<0.001 in each case).

Graph 2 shows the relationship between the Average Market Value and the sporting performance of the 38 teams during the 2014/15 season. The relationship is the second strongest and reaches an r² of 0.66. There are however also some interesting outliers: the teams which ended up highest above the regression line and outside the confidence interval are all German, meanwhile underperformers are predominantly English teams.


 Graph 2

The highest ordered teams are then again assessed with great precision and all ended within the confidence interval, i.e. they performed within the expected range of points per game. One conclusion of this might be that low-estimated teams are just as likely to over- and underperform globally, although different mechanisms seem to be at work in the two countries. The best teams perform more or less exactly as you would expect them, although some had disappointing years (Liverpool, Dortmund). Then again it is generally very unlikely to overperform if expectations are already very high; if data predicts that your team will collect around 2.2 or 2.3 points per game, there is little range to finish even better, hence we should not be too surprised that none of the high quality teams in terms of Market Value finished high above the regression line in Graph 2.

Graph 3

Goalimpact as shown in Graph 3 displays some similar characteristics, although the values are much more dispersed, i.e. standard deviation is much higher than in the case of Market Value. The level of correlation is slightly lower than in the former case and hence the lowest one of the three indicators, although the relationship is still very strong in overall terms. There is however not such a clear relationship between the league of a club and the fact that it finished better or worse than predicted; over- and underperformers are to be found in both leagues. Similarly, there is no relationship between a clubs level of Goalimpact and its over- or underperformance, as it can be found in the case of Market Value, although the differences between expected and actual performance are again higher for lower quality teams. 

Graph 4

Finally, Club Elo (see Graph 4) turned out the best predicator for final performance during the 2014/15 season in England and Germany. The correlation reaches an r² level of 0.71. The final performance in terms of points per game is well predicted especially for teams with very high and very low Elo values, although there are some mid-range teams which over- or underperformed expectations significantly (plus Chelsea, which finished far over the regression line and confidence interval).

The advantage of Club Elo over the other indicators persists even if we take all of them into one single equation. For this purpose, a multivariate regression was calculated, with all three indicators as independent variables explaining the outcome, i.e. points per game. This procedure enables us to directly compare the explanatory power of every index over the others, but also to check whether one index evens out omissions of others. Results (which are displayed in Graph 5) show that Club Elo is the only indicator which remains significant if the other two indicators are controlled for. This means that the variance of teams' performance outcomes not explained by Club Elo is likely not a result of shortcomings of the index itself, but rather due to actual over- or underperformance of teams. Note also that the adjusted r², i.e. the overall predictive power of the model, is around 0.7, which means that Market Value and Goalimpact do not offer additional predictive value.

 Graph 5

3. Which teams are the outliers?

Based on these analyses, we can take the issue to the next level and see which teams actually performed the way the underlying numbers before the season would expect them to and which ones did not. In order to do so, I took the strongest predicator Club Elo and present the difference between the predicted value of points per game and the actual points per game each team achieved (in technical terms, these differences are called residuals). Graph 6 shows each team's difference between expected and actual points per games. Teams are ordered according to the size of the difference, and dots are also coloured according to this size.

Graph 6

As can be seen, overperforming actually pays off. The highest overperformers Wolfsburg and Mönchengladbach qualified directly for the Champions League group stage. Third in the list is Chelsea, which even one the title, by collecting more than 0.3 more points per game than expected (in total terms, this accounts for 12 points more in the whole season than predicted, without which Chelsea would have finished second or third, depending on goal difference). 

On the other end, three of the four worst achievers also made it into European competitions. Dortmund will participate in the Europa League in spite of gaining a total of twenty points less than predicted. This shows that grave underachievement is a real threat for highly- but not highest assessed teams. The next underachievers were however all relegated (Freiburg, Burnley, QPR) or in severe danger (Hannover, Sunderland).

Over- or underachievement itself is in any case not related to overall season results. Consider Bayern München and Paderborn, which are among the teams with the lowest residuals. Meanwhile Bayern won the league some weeks in advance of the final matchday, Paderborn finished last and were relegated, i.e. were not able to upset predictions.

4. Conclusions


Club Elo turned out to be the best predictor for a club's league points. Does this mean that the other two indicators are worse? Well, not necessarily. The answer depends on what you are looking for. First of all, the results are just based on averages over all clubs. How one single club will finish is still not easy to predict. The fact that Club Elo has the highest correlation with points per game expresses only that the residuals, i.e. the differences between predicted and actual points, even out more than in the case of Average Market Value and Goalimpact. Secondly, if you are a bettor, you will most certainly not be interested in the average residual, but more in individual teams, for instance which team will conquer the title. In the case of the two leagues analysed here, only Average Market Value predicted both champions correctly. Meanwhile all indices assessed Bayern München as the strongest German club, Goalimpact and Club Elo saw Manchester City ahead of Chelsea. Then again, Club Elo did the best job in predicting relegated teams (four out of six; I count Hamburg as relegated, although they managed to avoid relegation through their win over Karlsruhe in the play off). The other two indicators only predicted two out of six relegated teams correctly. League position itself is also not only dependent on the performance of one particular team itself, but also on the clubs' this one is competing with. Therefore, individual final positions are an outcome even more difficult to predict. Thirdly, as stated above, Average Market Value and Goalimpact are average numbers of individual assessments. They provide information which Club Elo is completely silent about and are hence much more useful if you are looking for individual players' quality. Fourthly, a more general caveat is the sample of the analyses these results are based on. The size (38) is reasonably large to draw conclusions using methods of quantitative data analyses, although a larger size would of course be desirable. One possible but unlikely danger is that the sample is biased, i.e. the fact that only English and German teams are included influences the results of analyses. Repeating the analyses with the inclusion of clubs from more countries would therefore enlighten the question even more and make results more robust.

Tip: Click on graphs to enlarge them.

Dienstag, 21. April 2015

Kurzgeschichte: Die Wiener Austria unter Andreas Ogris

Natürlich ist es für ein abschließendes Urteil nach drei Ligaspielen noch zu früh. Dennoch hat ein Zwischenfazit insofern Sinn, als ein neuer Trainer durchaus in gewissen Aspekten sofort für Veränderungen im Spiel seiner Mannschaft sorgen kann. Zwar ist der vielzitierte Trainereffekt kein Automatismus, allerdings zeigen sich neue Ansätze in Details durchaus schon nach wenigen Spielen.

Die Daten reflektieren tatsächlich bereits einen signifikanten Wandel im Spiel der Wiener Austria in den drei Spielen unter der Regie von Interimscoach Ogris (siehe Graphik 1). Zu beachten ist dabei, dass die Daten der drei Spiele unter Ogris natürlich noch mehr von den Gegnern, gegen die gespielt wurde, beeinflusst werden. So ist es kaum verwunderlich, dass die Austria gegen den generell eher reaktiv agierenden WAC auf überdurchschnittlich viele Pässe kam (485), während gegen das Salzburger Pressing oft auf lange Bälle gesetzt wurde, was eine dementsprechend etwas niedrigere Passquote (68%) zur Folge hatte. Bei nur drei Spielen können solche Eigenheiten die Durchschnittswerte stärker beeinflussen als bei einer größeren Stichprobe. 

Die gespielten Pässe pro Spiel sowie die Passquote unterscheiden sich kaum voneinander (die jeweils linke Säule in Graphik 1 repräsentiert den Mittelwert unter Baumgartner, die rechte dementsprechend den unter Ogris). In beiden Kategorien kam die Austria unter Baumgartner auf leicht höhere Werte, die Unterschiede sind jedoch minimal und dementsprechend in der Beurteilung zu vernachlässigen.

Wo sich jedoch gewaltige Differenzen zeigen, ist bei den Flanken. Seit Ogris am Werk ist, schlägt die Austria mehr als doppelt so viele Flanken pro Spiel als noch unter Baumgartner. Mit anderen Worten: Von den insgesamt 400 geschlagenen Flanken in dieser Saison wurden 77 (dies entspricht 19,25%) unter Ogris abgegeben, obwohl er nur in 10,34% der Spiele Cheftainer war.


Graphik 1

Die Unterschiede zwischen beiden Perioden zeigen sich noch deutlicher, wenn man die Anzahl der Flanken auf die Anzahl der gespielten Pässe standardisiert (Graphik 2). Von 100 gespielten Pässen unter Baumgartner waren nur knapp drei Flanken, unter Ogris hingegen mehr als sechs.

Graphik 2

Das Problem mit dem Spiel, das sich auf Flanken fokussiert, ist, dass Flanken sehr ineffiziente Mittel sind, um Gefahr zu kreieren. Selbst die genauesten Spieler in dieser Hinsicht bringen nur etwa ein Viertel der Flanken an den eigenen Mann (man vergleiche dies mit der allgemeinen Passquote von etwa 70%). Und selbst wenn sie nicht von der gegnerischen Abwehr geklärt werden, sind sie schwiergier weiterzuverarbeiten beziehungsweise ins Tor zu bringen als Flachpässe.

Dementsprechend ist auch eher nicht zu erwarten, dass es der Austria gelingt, unter Ogris mehr Gefahr zu erzeugen als unter Baumgartner. Graphik 3 bestätigt diese Vermutung auch zumindest für die drei bereits absolvierten Spiele. Die Austria schoss vor dem Trainerwechsel pro Spiel etwa zweieinhalbmal öfter in Richtung gegnerisches Tor als danach. Der Unterschied bezüglich der Schüsse, die auch auf das gegnerische Tor gingen, ist zwar geringer (etwa ein Torschuss pro Spiel mehr als unter Ogris), allerdings ist diese Zahl nicht trivial angesichts der oftmals engen Ergebnisse. Ein Schuss mehr oder weniger kann ein Resultat bereits in die eine oder andere Richtung beeinflussen.

Graphik 3

Andererseits wurde dieser Rückgang bei den eigenen Torschüssen dadurch aufgefangen, dass die Austria auch weniger gegnerische Torschüsse zulässt. Während die Gegner unter Baumgartner noch etwa 14 Schüsse pro Spiel abgaben (4,58 davon aufs Tor), ließ sie unter Ogris nur noch elf pro Spiel zu (3,67 aufs Tor). Man konnte sich also defensiv stabilisieren und sich auch in den beiden Indikatoren TSR (von 0,51 auf 0,52) und STR (0,52 auf 0,56) steigern, was auf insgesamt überlegenere Leistungen schließen lässt. Der Rückgang in der offensiven Chancenkreation hatte jedoch zur Folge, dass man in der Liga seit dem Trainerwechsel immer noch sieglos ist. Im Spiel nach vorne hat man also sicher noch Luft nach oben und kann sich verbessern, um enttäuschende Punkteverluste gegen individuell schlechter eingeschätzte Gegner wie Grödig und Wolfsberg zu vermeiden; beispielsweise, indem man etwas seltener Flanken schlägt.

Dienstag, 17. März 2015

Die Zuschauerzahlen im zeitlichen und internationalen Vergleich

Seit bereits einigen Saisonen sind die Zuschauerzahlen in der österreichischen Bundesliga rückläufig. Allerdings hat man sich auf einem höheren Niveau eingependelt als noch vor zwanzig Jahren, auch im Vergleich zu anderen europäischen Ländern liegt man nicht schlecht. Dieser Beitrag untersucht die Entwicklung der Zuschauerzahlen über die Zeit sowie im Vergleich zu anderen europäischen Ligen. Die Daten bezüglich der Zuschauerzahlen stammen von der Webseite European Football Statistics

Bereits zweimal in dieser Spielzeit wurden Partien der österreichischen Bundesliga vor weniger als 1000 Zusehern ausgetragen. Beide Male war Grödig die Heimmannschaft und spielte gegen einen der niederösterreichischen Tabellennachzügler. Mit Ausnahme eines einzigen Spiels der Admira gegen den GAK im Herbst 2005 waren es zudem die beiden Spiele mit der niedrigsten Zuschauerzahl der gesamten Bundesligageschichte. Dass die Heimspiele eines Teams aus einer ländlich geprägten Gemeinde mit knapp 7000 Einwohnern, das vor einigen Jahren noch im Unterhaus spielte und nach und nach in den Abstiegskampf gesogen wird, keine Publikumsmagnete sind, sollte klar sein; allerdings ist Grödig kein Ausreißer nach unten, vielmehr hat die gesamte Liga seit einigen Jahren mit rückläufigen Besucherzahlen zu kämpfen. 

Ein Vergleich mit der Spielzeit 2007/08, der absoluten Rekordsaison bezüglich Zuschauerschnitt, zeigt, dass die durchschnittliche Besucheranzahl in wenigen Jahren um etwa 2800 Zuseher abgenommen hat. Natürlich könnte dies daran liegen, dass Teams mit geringerem Zuschauerpotenzial in die Liga aufgestiegen sind und Vereine mit hohem Fanaufkommen sportlich verdrängt haben. Ein Vergleich der vier Teams, die damals noch in der obersten Spielklasse vertreten waren (Innsbruck, LASK, Austria Kärnten und Mattersburg) mit den vieren, die an ihre Stelle getreten sind (Admira, Wiener Neustadt, Wolfsberg und Grödig) zeigt tatsächlich massive Unterschiede. Die ersten vier hatten 2007/08 zusammen einen Schnitt von knapp über 9000 Besuchern, während die jetzigen vier Bundesligisten in der heurigen Saison lediglich auf einen Schnitt von etwa 3400 Zuschauern kommen. Die Aufsteiger der vergangen Jahre haben also den Gesamtschnitt der Bundesliga nachhaltig nach unten gedrückt.

Das ist allerdings nur die halbe Wahrheit. Einerseits ging nicht nur der Zuschauerschnitt, sondern auch die Auslastung der Stadien nach unten. Der Rückgang liegt also nicht nur daran, dass Vereine mit schlechterer Infrastruktur, also kleineren Stadien, nach oben gekommen sind. Andererseits zeigt ein Vergleich der anderen sechs Bundesligisten, also jener, die bereits damals in der obersten Liga spielten und seitdem nicht abstiegen (Austria Wien, Salzburg, Rapid, Sturm und Ried) beziehungsweise den Wiederaufstieg schafften (Altach), ein Rückgang. Von diesen sechs haben nur die beiden Wiener Vereine in der heurigen Saison einen höheren Zuschauerschnitt als vor sieben Jahren, die anderen mussten teilweise massive Einbußen hinnehmen. Den größten Zuwachs verzeichnet im Vergleich die Wiener Austria mit +7,43%, Rapid kommt auf 4,62% mehr Zuseher. Den größten Einbruch hatte die SV Ried mit -32,4%, auch Sturm (-23,12%) und Salzburg (-16,94%) verloren deutlich an Zusehern. Auch Altach konnte trotz des Aufstiegs nicht mehr Zuschauer anlocken und verlor 8,8% im Vergleich zu 2007/08.

Graphik 1: Die Zuschauerschnittentwicklung in der österreichischen Bundesliga seit 1974/75. Die schwarze Linie zeigt den tatsächlichen Zuschauerschnitt in jeder Saison, die blaue Linie den linearen Trend, die rote Linie den Durchschnitt über alle Saisonen.

Die Rekordsaison 2007/08 ist als Vergleichswert allerdings natürlich verzerrend. Seit Einführung der Bundesliga war der Zuschauerschnitt nur in dieser und in der unmittelbar folgenden Spielzeit höher als 9000 Besucher pro Spiel. Über 8000 lag er auch nur in zwei weiteren Saisonen (1997/98 und 2006/07). Neben einer Kombination an vielen zuschauerstarken Vereinen in der obersten Spielklasse dürfte das Auftreten signifikant höherer Zuschauerzahlen um 2008 durchaus mit der in diesem Jahr stattfindenden Europameisterschaft und einer dadurch ausgelösten Fußballeuphorie in Zusammenhang stehen.

Wenn man den langjährigen Trend der Zuschauerschnittentwicklung ansieht, wird auch klar, dass die Saison 2007/08 der Endpunkt eines Aufwärtstrends war, und die derzeitige vielleicht die Talsohle des darauffolgenden mehrjährigen Einbruchs ist. Wie Graphik 1 zeigt, verlief die Entwicklung der Besucherzahlen seit Schaffung der Bundesliga zyklisch. Zwar gab es auch zwischen einzelnen Saisonen eklatante Unterschiede, allerdings scheinen sich doch Aufwärts- und Abwärtstrends einigermaßen die Waage zu halten. So folgte auf ein Tief 1977/78 ein erster Höhepunkt 1979/80, mit etwa 6500 Zusehern im Schnitt. Danach kam allerdings eine Flaute, die beinahe die gesamten Achtzigerjahre und länger andauerte und erst 1995 endete. Bis zur Jahrtausendwende blieben die Zuschauerzahlen überdurchschnittlich, bevor zu Beginn der Nullerjahre wiederum eine Flaute begann, wenn auch auf höherem Niveau als zwanzig Jahre zuvor. Darauf folgte der bereits erwähnte Aufschwung, der in der Rekordsaison gipfelte und von einem bis heute andauerndem Abwärtstrend abgelöst wurde.

Der Gesamttrend dieses Zeitraums geht allerdings nach oben und ist in Graphik 1 durch die blaue Linie dargestellt. Anhand dieser Linie kann auch gezeigt werden, dass die Zahlen der letzten drei Saisonen unter den Erwartungen liegen; die Saison 2011/12 war die erste seit 2004/05, die unterhalb der blauen Linie liegt, also schwächer war als es der Trend vermuten lassen würde. Diese negative Entwicklung setzte sich in den beiden folgenden Saisonen noch fort.

Andererseits muss auch angemerkt werden, dass diese Saisonen immer noch über dem langjährigen Durchschnitt liegen (die rote Linie in Graphik 1). Seit 1994/95 waren alle Saisonen über diesem Wert mit Ausnahme von 2002/03, während vorher lediglich 1979/80 darüber lag. Mitte der Neunzigerjahre vollzog sich also ein Wandel bezüglich der Zuseherzahlen, der bis heute nachwirkt. Während davor Durchschnittswerte von unter 5000 Besuchern pro Spiel keine Seltenheit waren, ist man seitdem nur in einer Saison unter 6000 gelandet. Es ist also einigermaßen wahrscheinlich, dass die derzeitige Saison der Tiefpunkt oder diesem zumindest sehr nahe ist. Da es durchaus möglich ist, dass der heurige Absteiger durch einen Aufsteiger mit mehr Zuschauerandrang ersetzt wird, könnte mit dem nächsten Jahr sogar wieder ein Aufwärtstrend starten.

Der langfristige Aufwärtstrend könnte natürlich in Zusammenhang mit dem Wachstum der Gesamtbevölkerung stehen. Die Bevölkerung wuchs von 1981 bis 2011 (aufgrund der früheren Praxis der Volkszählungen sind keine Daten für einzelne Jahre vor 2001 verfügbar) um 11,21%, der Zuschaueranstieg im selben Zeitraum betrug allerdings 27,84%, ist also mehr als doppelt so hoch. Wirklich vergleichbar sind beide Kennzahlen allerdings nicht; während die Bevölkerung relativ gleichmäßig zunimmt, gibt es bei den Zuschauerzahlen recht starke Schwankungen, sowohl nach oben als auch nach unten.  

Graphik 2: Der Zuschauerschnitt in 49 europäischen Fußballligen in der Saison 2014/15.

Im internationalen Vergleich von 49 erfassten nationalen Ligen liegt die österreichische Bundesliga sogar im oberen Mittelfeld (Platz 19). Wie Graphik 2, in der Österreich mit einem etwas vergrößerten roten Punkt dargestellt ist, zeigt, sind die größten Ligen Europas weit außer Reichweite (Deutschland, England, Spanien, Italien, Frankreich und die Niederlande). Auch Länder wie Belgien, die Schweiz und Portugal, die in Bezug auf die Einwohnerzahl mit Österreich einigermaßen vergleichbar sind, haben einen Zuschauerschnitt über 10.000, also mehr als die heimische Liga selbst in den besten Jahren. Andererseits liegen Länder mit teilweise weit höherer Einwohnerzahl wie Tschechien, Kasachstan, Rumänien, Griechenland und Ungarn in dieser Statistik hinter Österreich. 

Der österreichische Zuschauerschnitt liegt zwar ganz knapp unter dem gesamten europäischen Durchschnittswert von etwa 6700 Zusehern, dieser wird allerdings durch die sechs Länder mit dem höchsten Schnitt weit nach oben getrieben. Wenn man die zwei Extremwerte an beiden Enden der Stichprobe außer Acht lässt (also Deutschland, England, Lettland und Estland), sinkt der Durchschnittswert bereits auf 5500, liegt also deutlich unter dem heurigen Wert der österreichischen Liga und auf einem Niveau, auf dem sich diese zuletzt Anfang der 1990er befand. Der Medianwert, der von Ausreißern weniger stark beeinflusst wird, liegt sogar nur bei 2718 und damit weit unterhalb des österreichischen Schnitts (in jeder der vierzig Saisonen). Anders ausgedrückt: 30 der 49 Länder liegen unterhalb von 5000 Zuschauern pro Spiel, ein Schnitt, den die österreichische Bundesliga seit 1993/94 nicht mehr unterschritten hat.

Graphik 3: Der Zusammenhang zwischen Einwohnerzahl und Zuschauerschnitt. Die blaue Linie zeigt die lineare Regressionsgerade an, der dunkelgraue Schatten die 95%-Konfidenzintervalle. Die österreichische Bundesliga ist durch den roten Punkt gekennzeichnet.

Geht man davon aus, dass das Interesse an Fußball und damit der Besuch von Fußballspielen über alle europäischen Länder gleichmäßig verteilt ist, müsste der Zuschauerschnitt hoch mit der Einwohnerzahl eines Landes korrelieren. Die Logik dahinter ist klar: Je mehr Leute in einem Land wohnen, desto mehr Fußballinteressierte gibt es, die Partien der höchsten Liga besuchen. Dass diese Annahme nicht ganz realistisch ist und der Zusammenhang auf keinen Fall monokausal, zeigt alleine die Tatsache, dass es in einem einzelnen Land wie Österreich zu hohen Schwankungen über die Zeit kommt. Allerdings besteht der Zusammenhang tatsächlich, und er ist auch recht stark (=0,4) und statistisch hoch signifikant (p<0.01). Je mehr Einwohner ein Land hat, desto höher wird also tendenziell auch der Zuschauerschnitt in diesem Land sein; eine Million Einwohner mehr erhöht den Schnitt dabei um etwa 200. Nach diesem Modell sollte Österreich einen Zuschauerschnitt von knapp 4700 haben, schneidet also weit besser ab, als es die Einwohnerzahl erwarten ließe. Diese Tatsache zeigt auch Graphik 3, die den Zusammenhang zwischen Einwohnerzahl und Zuschauerschnitt mittels eines Punktdiagramms darstellt. Österreich liegt dabei über der Regressionslinie und innerhalb des Konfidenzintervalls. Seit nunmehr 20 Saisonen liegt der Schnitt über dem (für die derzeitige Einwohnerzahl geschätzten) Erwartungswert.

Die Tatsache, dass viele der Beobachtungen weit entfernt von der Regressionsgeraden und außerhalb der Konfidenzintervalls liegen, weist darauf hin, dass das Modell noch verbessert werden kann. Sowohl die Ligen mit dem höchsten Zuschauerschnitt (die Top Fünf) als auch Russland und die Türkei als Ausreißer nach unten passen schlecht in das Modell. Das liegt allerdings weniger an den Ausreißern per se, sondern an der Verteilung der Daten. Sowohl die Einwohnerzahl pro Land als auch der Zuschauerschnitt sind nicht normalverteilt, was eine zentrale Annahme sowohl bei Korrelations- als auch Regressionsanalysen ist. Die Verteilung ist bei beiden vielmehr rechtsschief, was sich im bereits erwähnten großen Unterschied zwischen Mittelwert und Median äußert. Die Ergebnisse sind also verzerrt. Um dieses Problem zu umgehen, wird in Graphik 4 der gleiche Zusammenhang dargestellt, diesmal wurden die Daten allerdings logarithmiert (natürlicher Logarithmus).

Graphik 4: Der gleiche Zusammenhang wie in Graphik 3, nur sind beide Variablen logartihmiert.

Dadurch entsteht ein viel besserer Zusammenhang, das r² steigt von 0,4 in Graphik 3 auf 0,6, die statistische Signifikanz bleibt logischerweise sehr hoch. Zwar ist das Ergebnis durch die Logarithmierung nicht mehr ganz eins zu eins zu interpretieren, die österreichische Bundesliga ist jedoch auch in diesem Modell unter den besseren Ligen. Das Modell prognostiziert für Österreich ein Zuschauerschnitt von etwa 3400, also etwa nur halb so viele wie aktuell und weniger als in der schlechtesten aller Saisonen (1984/85). 

Natürlich sollte man sich von diesen Daten nicht blenden lassen. Zwar liegt die heimische Liga besser als zwei Drittel der europäischen Ligen und hat auch mehr Zuschauer pro Spiel als die Bevölkerungszahl vermuten ließe; andererseits sind diese Erwartungen auch mittels Daten errechnet worden, die für Österreich katastrophal niedrig sind. 12 Länder haben weniger als 1000 Zuschauer pro Spiel, eine Zahl, die in österreichischen Einzelspielen Negativrekorde kennzeichnet. Die Hälfte der Länder liegt unter einem Schnitt von 2718, was immer noch weit niedriger als die schlechteste Saison der heimischen Bundesliga ist. An diesen Ländern sollte man sich also was Zuschauerzahlen angeht nicht orientieren. Andererseits gibt es Länder, die was den Zuschauerschnitt angeht, weiter vor Österreich liegen, als es kleinere Unterschiede bezüglich der Einwohnerzahl vermuten ließen. Dazu zählen Schottland, Schweden, die Schweiz und Belgien. Was in diesen Ländern genau besser gemacht wird als in Österreich, kann hier nicht beantwortet werden. Klar wurde allerdings, dass die Zuschauerzahlen auch in einem einzelnen Land großen Schwankungen unterworfen sein können, dass sie in Österreich zyklisch verlaufen und deshalb der derzeitige Tiefpunkt nicht überraschend ist, dass diese Zyklen unter anderem von den in der Liga vertretenen Teams abhängig sind und dass die Einwohnerzahl zwar ein wichtiger Faktor bei der Höhe des Zuschauerschnitts einer Liga ist, allerdings als alleinige Erklärung nicht ausreicht.