Kochen, Statistik und Graphik

Ich habe ja einen Hang zu Software für statistische Spielereien. Da werden Fussballtabellen ausgewertet, um zu erfahren, wie hoch die Chance für Verbleib in einer Liga ist oder ob man einen Champions-League-Platz erreichen kann. Sehr beliebt ist bei mir auch die Mitschrift der Wetterdaten in unserem Bereich und die Korrelation mit unseren Nebenkosten (was ja noch einigermaßen einen Zweck hat).

Nun hat aber der Mann einer Freundin (der hat anders als ich Ahnung von Statistik) mit einem meiner Lieblingswerkzeuge (R und als Entwicklungsoberfläche am liebsten R-Studio) ein online-Tool entwickelt, mit dem man die Häufigkeit von Worten aus Dateien ermitteln und in verschiedene Arten der Wort-, Text- oder Bildwolken darstellen kann.

Die Software ist noch nicht freigegeben, daher gibt es hier auch noch keinen Link. Ich durfte aber schon mal damit spielen und probieren; was sehr mutig war, denn ich mache immer alle Software kaputt, mit der ich spiele, auch wenn ich das nicht beabsichtige. Auch finden sich regelmäßig alle Fehler bei mir ein, wenn ich mit Software arbeite. Anstrengend, aber man sagt, dass mich das zum perfekten Tester machen sollte.

Ich habe es auf die Rezepte anwenden lassen, die noch nicht in meiner Datenbank oder meiner Rezeptsammlung stehen, sondern in meinem Notizkasten Zettlr herumliegen.

„Minuten“ kam am häufigsten vor, gefolgt von „Pfeffer“, „Salz“, „lassen“ und „Butter“, was jetzt nicht außergewöhnlich überraschend ist. Dennoch: Sehr schönes Produkt, schöne Darstellung, auch wenn dies ein Unfall war und so wie es abgebildet ist, nicht geplant war. Ich werde berichten, wenn die Software frei ist

Wortwolke Kochen

Fussballbundesliga – Ende einer Saison

Jedes Jahr spiele ich am Ende der Saison mit den Statistiken der Bundesliga herum und werte ein paar Sachen aus. Wie viel Punkte braucht man zur Teilnahme an der Champions League oder wie viel muss man haben, um gerade nicht abzusteigen? Wie sieht es mit der viel gerühmten Heimstärke einiger Mannschaften oder in der Bundesliga allgemein aus? Dabei betrachte ich zum Teil auch zeitliche Entwicklungen.

Die Mindestpunktzahl für den Klassenerhalt (letzter Platz vor der Relegation) wurde auf Grundlage der Dreipunkteregel rückwirkend angepasst.

Mindestpunkte für den Klassenerhalt

Ich glaube, dass das obige Histogramm auf der linken Seite über die Jahre anwachsen wird. Denn dies scheint der Trend zu sein. Man benötigt immer weniger Punkte, um nicht abzusteigen, wie das nachfolgende Bild zeigt.

Trend Klassenerhalt

Das deckt sich mit der Entwicklung für die Mindestpunktzahl, um auf den dritten Platz zu kommen. Dieser ist seit einigen Jahren der letzte sichere CL-Platz (seit mehreren Jahren ist es auch der vierte Platz, aber ich fürchte, dass wir den bald wieder als Qualifikationsplatz haben werden).

Trend Mindestpunktzahl CL-Teilnahme

Der Trend zeigt eine permanente Zunahme mit einigen Schwankungen. Das bedeutet aber auch, dass es für Platz 1 und 2 ebenso eine Steigerung gegeben haben muss. Bei gleichzeitig sinkenden Punkten für den Klassenerhalt heißt dies eine Vergrößerung der „Schere“ zwischen Oben und Unten in der Tabelle.

Heimstärke in der Bundesliga

Die Heimstärke ist seit Beginn der Bundesliga im Abwärtstrend: noch immer erkennbar, aber abnehmend. Einige Mannschaften ragen dabei heraus (München, Dortmund), aber allgemein ist der Heimsieg nicht mehr so wahrscheinlich wie vor 1985.

Die Auswertungen erstelle ich mit R und RStudio. Die notwendigen Zahlen erhält man aus frei zugänglichen Bundesliga-Tabellen und einer englischen Seite mit allem, was das statistische Herz begehrt.

Die gesamten Darstellungen können hier heruntergeladen werden: