Frankreich wird Europameister
Nach dem Weltmeistertitel hat Frankreich jetzt auch gute Chancen die Fußball-EM für sich zu entscheiden. Zu diesem Ergebnis kommt ein Team europäischer Forscherinnen und Forscher – und künstliche Intelligenz (KI).
Am Freitag, 11. Juni, startet die Fußball-Europameisterschaft mit einem Jahr Verspätung. Geht es nach einem internationalen Team an Forscherinnen und Forschern, dann ist der Favorit diesmal Frankreich mit einer Gewinnwahrscheinlichkeit von 14,8 %. Das zeigten Andreas Groll und Franziska Popp (beide TU Dortmund), Gunther Schauberger (TU München), Christophe Ley und Hans Van Eetvelde (beide Universität Gent), Achim Zeileis (Universität Innsbruck) und Lars Hvattum (Hochschule Molde, Norwegen) mithilfe von maschinellem Lernen.
Ihre Prognose kombiniert dabei mehrere statistische Modelle über die Spielstärken der Männermannschaften mit Informationen über die Teamstruktur (etwa Marktwert, Anzahl Champions-League-Spieler, Vereinsspiele-Performance einzelner Spieler) sowie sozio-ökonomische Faktoren des Herkunftslands (Bevölkerung und Bruttoinlandsprodukt).
100 000 Mal durch die Simulation
Mit den vorhergesagten Werten aus dem Modell der Forscherinnen und Forscher wurde die gesamte EM 100 000 Mal durchsimuliert: Spiel für Spiel, der Turnierauslosung und allen Uefa-Regeln folgend. Damit ergeben sich Wahrscheinlichkeiten für das Weiterkommen aller Teams in einzelnen Turnierrunden und letztendlich für den Sieg in der Europameisterschaft. Mit einer Gewinnwahrscheinlichkeit von 14,8 % liegt Frankreich an der Spitze, gefolgt von England (13,54 %) und Spanien (12,3 %).
Bislang erfolgreiche Prognosen
Dass dennoch noch alles drin ist, zeigen die relativ knappen Abstände bei den Gewinnwahrscheinlichkeiten an der Spitze ebenso wie die relativ niedrige Wahrscheinlichkeit selbst der Topnationen. „Es liegt in der Natur von Prognosen, dass sie auch danebenliegen können – sonst wären Fußballturniere auch sehr langweilig“, erklärt Achim Zeileis. „Wir liefern eben Wahrscheinlichkeiten, keine Gewissheiten, und eine Gewinnwahrscheinlichkeit von 15 % heißt zugleich, dass die Mannschaft zu 85 % nicht Turniersieger werden kann.“
Bisher waren die Prognosen aber durchaus erfolgreich: Das Innsbrucker Modell von Achim Zeileis, das auf bereinigten Quoten der Wettanbieter basiert, konnte unter anderem bereits 2008 das Euro-Finale sowie 2010 und 2012 Welt- und Europameister Spanien richtig vorhersehen. Dieses Jahr wird es als Teil eines umfassenderen kombinierten Modells eingesetzt, das von den Teams um Andreas Groll (TU Dortmund), Gunther Schauberger (TU München) und Christophe Ley (Universität Gent) entwickelt wurde und das bei der Fußball-WM 2018 die Prognosegüte der Wettanbieter übertroffen hatte.
Deutschlands Chancen fürs Achtelfinale
Es ist kein Geheimnis, dass die deutsche Nationalmannschaft dieses Jahr in eine besonders herausfordernde Gruppe gelost wurde: „In Gruppe F sind drei sehr starke Teams, darunter der amtierende Weltmeister Frankreich und der Europameister Portugal, beide zugleich die Finalisten der Euro 2016, plus eben Deutschland“, erläutert Andreas Groll. „In dieser Gruppe ist die Wahrscheinlichkeit deshalb verglichen mit den Favoriten in den anderen Gruppen geringer, es bis ins Achtelfinale zu schaffen. Wer das aber schafft, hat dann ganz gute Chancen, weiterzukommen.“
Die Prognose sieht sowohl für Deutschland als auch für Portugal eine Wahrscheinlichkeit von 85,3 %, es ins Achtelfinale zu schaffen; für Frankreich liegt diese Wahrscheinlichkeit etwas höher bei 89,7 %. Dass Deutschland Europameister wird, ist mit 10,1 % Wahrscheinlichkeit deutlich unter den Werten der Favoriten und genau gleichauf mit Portugal.
Machine Learning führt Quellen zusammen
Die Berechnung der Forscherinnen und Forschern basiert auf vier Informationsquellen: Ein statistisches Modell für die Spielstärke jedes Teams auf Basis aller Länderspiele der vergangenen acht Jahre (Universität Gent), ein weiteres statistisches Modell für die Spielstärke der Teams auf Basis der Wettquoten von 19 internationalen Buchmachern (Universität Innsbruck), weitere Informationen über die Teams, zum Beispiel der Marktwert, und ihre Herkunftsländer, etwa die Bevölkerungszahl (TU Dortmund und TU München), außerdem detaillierte Ratings der einzelnen Spieler und deren individueller Performance sowohl in ihren Stammvereinen und Nationalmannschaften (Hochschule Molde).
Fünfter „Partner“ ist ein Machine-Learning-Modell, das die anderen vier Quellen zusammenführt und sie schrittweise optimiert. Die Wissenschaftler und Wissenschaftlerinnen haben das Modell zuvor mit historischen Daten trainiert, wie Andreas Groll erläutert: „Wir haben das Modell mit den jeweils zu dem Zeitpunkt aktuellen Daten für die vergangenen vier Europameisterschaften, also zwischen 2004 und 2016, gefüttert und mit den tatsächlichen Spielausgängen aller Spiele der jeweiligen Turniere vergleichen lassen – so wird die Gewichtung der einzelnen Informationsquellen für das aktuelle Turnier im Idealfall sehr genau ausfallen.“ Wie gut das KI-Modell in diesem Jahr abschneidet, dürften Fußballfans spätestens am Abend des 11. Juli erfahren.