Allgemein

Ein Experiment – Startnummernvergabe nach Triathlonranking Austria

Published

on

Seit 2010 werden in das Triathlonranking Austria regelmäßig Ergebnisse österreichischer Triathletinnen und Triathleten eingepflegt. Viel Diskussion gab es in dieser Zeit über die Verlässlichkeit der Berechungsmethode und der damit entstandenen Leistungsrangliste. Die Macher verzichteten dabei ganz bewusst darauf, Windschattenrennen ins Ranking einzurechnen. Zum einen wissen Teilnehmer und Teilnehmerinnen von EC, WC oder ähnlichen Bewerben ohnedies genau, welches Leistungslevel sie haben; zum anderen verzerrt das Windschattenfahren die Einzelleistungen. Das Ranking dient vor allem den Hunderten von Hobbysportlerinnen und Hobbysportlern in Österreich, die sich vom Leistungsniveau her auch mithilfe des Rankings einordnen können.

Was macht nun das Triathlonranking eigentlich?

Im Prinzip ist es relativ simpel: Das Team von Triathlonranking analysiert einen Triathlonbewerb aufgrund der erbrachten Leistungen bzw. den Abständen zwischen den Athleten und Athletinnen. Diese Leistungen werden mit bereits vorhandenen Daten in Zusammenhang gebracht und kombiniert. Dies geschieht fortlaufend mit jedem eingerechneten Bewerb und mit jeder Person, die bei einem Bewerb ins Ziel gekommen ist. Um nun Bewerbe miteinander vergleichen zu können, muss zuerst eine Vergleichsbasis geschaffen werden. Diese Basis wird ebenfalls aus den Leistungen der teilnehmenden Personen errechnet.

Wer steckt hinter Triathlonranking Austria?

Mag. Thomas Doblhammer, Sportwissenschafter und Trainer in eigener Praxis: Erfinder des Rankingsystems, verantwortlich für die Grundideen und Pflege der Daten.

FH-Prof. Mag. DI Dr. Andreas Stöckl, Mathematiker und Geschäftsführer von Cyberhouse – verantwortlich für die mathematischen Berechnungen, Statistik und Programmierung des Rankings in der Firma Cyberhouse.

Im Sommer des Jahres 2014 wurde das Team von einem österreichischen Veranstalter eines Sprinttriathlons (Gmunden) angesprochen, ob die Startnummern der teilnehmenden Personen über unser Rankingsystem vergeben können.

Eine Gelegenheit, für uns das Ranking in der Praxis zu testen, sollte doch nach unseren Vorstellungen die Zieleinlaufliste etwa jener des Rankings entsprechen.

Um nun aber Vergleiche anstellen zu können müssen wir erst wissen, ob nicht andere Bewerbe ohnedies mit den Startnummern eine gewisse Übereinstimmung mit dem Endergebnis erreichen. Wir haben dazu wahllos einen Bewerb der Saison 2014 herausgenommen und diesen auf die gleiche Weise analysiert, wie später den Sprinttriathlon Gmunden 2014 mit der Startnummernvergabe durch das Triathlonranking (siehe Abb.1).

Abb.1: Verteilung Startnummern zu Endplatzierung der Männer beim Kurzdistanztriathlon Mostiman 2014. Korrelationskoeffizient Rang / Startnummer 0,07

Betrachtet man die Punktewolke, ist mit freiem Auge bereits zu erkennen, dass es keinen Zusammenhang zwischen der Startnummer und dem späteren Endrang gibt. Einzig bei den Topathleten sind die Punkte annähernd passend – dies verwundert allerdings nicht, da beinahe alle Veranstalter den Topathleten entsprechend der Leistung die niedrigsten – also vordersten – Startnummern zuweisen. Statistisch ausgedrückt, erhält man einen Korrelationskoeffizienten von 0,07. Von Korrelation spricht man, wenn ein Zusammenhang zwischen zwei Größen besteht. Bei einer Korrelation von 1 ist eine vollständige Abhängigkeit, bei einer Korrelation von 0 kein Zusammenhang gegeben. Wenn wir diesen Zusammenhang auf den Mostiman 2014 anwenden, so bedeutet dies, dass die dort vergebene Startnummer praktische keine Auswirkung auf den Endrang im Bewerb aufweist. Der optische Eindruck wird also durch die Statistik in diesem Fall bestätigt. Überraschend ist dies allerdings nicht, da die Startnummern – wie gesagt mit Ausnahme der Topathlet/innen – oftmals in der Reihenfolge der Anmeldung vergeben werden.

Tatsächlich könnte diese Verteilung aber auch ein Einzelfall sein. Daher wählten wir noch einen zweiten Bewerb, dieses Mal sollte es eine Sprintdistanz sein. Zum optimalen Vergleich haben wir daher den Bewerb Gmunden aus dem Jahre 2013 analysiert (siehe Abb.2).

Abb.2: Verteilung Startnummern zu Endplatzierung der Männer beim Sprinttriathlon in Gmunden 2013. Korrelationskoeffizient Rang / Startnummer 0,35

Zu erkennen ist, dass dieses Mal die Punktewolke geringer streut als jene aus Abb.1. Besonders im Bereich der Startnummern bis etwa 20 decken sich Startnummer und erreichter Endrang recht gut. Die höheren Startnummern weisen eine ähnliche (zufällige) Verteilung auf wie jene beim Mostiman 2014. In der statistischen Auswertung ergibt sich ein Korrelationskoeffizient von 0,35. Dieser Wert entsteht zum großen Teil durch die Arbeit des Veranstalters und der gezielten Vergabe der vorderen Startnummern. Ein statistisch relevanter Zusammenhang ergibt sich daraus aber nicht.

Wie verhält es sich nun aber im Vergleich dazu mit dem Event Gmunden 2014, in welchem die Startnummern ganz bewusst in einer mathematisch berechneten und von vielen vorherigen Ergebnissen abgeleiteten Reihenfolge vergeben wurden?

Abb. 3: Verteilung Startnummern zu Endplatzierung beim Sprinttriathlon in Gmunden 2014 nach der Startnummernvergabe über das Triathlonranking, verwendet wurde hier die unveränderte Einlaufliste der Männer! Korrelationskoeffizient Rang / Startnummer 0,77

Rein optisch betrachtet, wirkt die Punktewolke in Abb.3 zwar verändert, die Streuung ist nicht mehr so ausgeprägt wie in Abb1 und 2 zu erkennen, dennoch liegen noch sehr viele Punkte von einer optimalen Geraden – dies würde bedeuten jede Startnummer erreicht auch genau diesen Endrang – entfernt. In statistischer Korrelation erreichen wir einen Wert von 0,77 – man spricht bei so einem Wert bereits von einem hohen Zusammenhang.

Obwohl dieser Wert unserer Berechnung bereits zu einem hohen Teil Recht gibt und damit auch bestätigt, dass unser Rankingsystem eine sehr realitätsnahe Abbildung der Leistungsfähigkeit schafft, waren wir damit noch nicht ganz zufrieden.

Bei genauerer Betrachtung erkannten wir, dass nachträglich – durch Absage der Teilnahme oder Nachmeldungen und dergleichen – die Startnummernzuweisung nicht mehr exakt der Originalliste über das Triathlonranking entsprach. Der Vergleich der Ergebnisliste zwischen 2013 und 2014 mit den Korrelationskoeffizienten ist zwar insofern interessant, da ja eine kurzfristige Änderung der Teilnehmer/innen immer möglich ist, allerdings zeigt diese „Verunreinigung“ nicht mehr, in wie weit das Ranking auch in der Lage ist, den Zieleinlauf eines realen Bewerbes aufgrund der Teilnehmer/innen vorherzusagen.

Wir haben daher in einem weiteren Schritt die Ergebnisliste soweit bereinigt, dass wir nur jene Finisher, die über das Triathlonranking ihre Startnummer zugewiesen bekommen hatten, berücksichtigt und diese wiederum mit 1 beginnend sortiert haben.

Abb.4: Verteilung Startnummern zu Endplatzierung beim Sprinttriathlon in Gmunden 2014 der Männer nach der Startnummernvergabe über das Triathlonranking sowie einer manuellen Korrektur bzw. Löschung aller Personen, die die Startnummer nicht durch das Ranking automatisch zugewiesen bekommen haben! Korrelationskoeffizient Rang / Startnummer 0,93

Betrachtet man nun die Punktewolke der bereinigten Ergebnisliste in Abb.4 so ist nun eine ganz starke Gruppierung der Punkte entlang einer gedachten Linie (Geraden) zu erkennen. Selbstverständlich gibt es vereinzelte Ausreißer, sowohl nach oben wie auch nach unten, die Korrelation zwischen Startnummer und Endrang liegt dennoch bei einem Wert von 0,93. Statistisch betrachtet liegt nun ein sehr hoher Zusammenhang vor.

In einem biologischen System bzw. in einem System der sportlichen Leistung von Menschen ist ein Wert von 0,93 bereits sehr hoch und lässt den Schluss zu, dass die generelle Berechnung des Triathlonrankings und die daraus entstehende Reihenfolge ein sehr realitätsnahes Abbild schafft.

Dennoch sehen wir auch noch Verbesserungspotential in der Vorhersage der Ergebnisse. Für die Verteilung der Startnummern wurde in diesem Fall das 24-Monatsranking als Grundlage genommen. Sollte sich nun aber ein Sportler innerhalb dieser 24 Monate sehr stark entwickelt oder verschlechtert haben, entsteht möglicherweise eine Verzerrung zur möglichen Saisonleistung.

Ein weiterer Verzerrungsgrund ist uns bewusst: unser Rankingsystem mischt alle Distanzen von Sprintdistanz bis zum Ironman. Je mehr Bewerbe man nun aber auf seiner besten Distanz absolviert, umso niedriger ist im Schnitt möglicherweise der prozentuelle Gesamtrückstand. Diese Vermischung spielt im obersten Leistungsbereich der Athleten eine noch nicht so erhebliche Rolle, mit wenigen Abweichungen liegen die ersten 25 Athleten fast auf einer Linie. Danach streuen die Punkte doch deutlich mehr. Je weiter wir im Endrang nach hinten kommen, umso mehr ist wohl der Triathlonsport „nur“ mehr Hobby und das Training wird noch spezieller auf die eigentliche Wettkampfdistanz zugeschnitten. Damit haben die Sprintspezialisten natürlich einen gewissen Vorteil gegenüber den Langdistanzlern, wenn sich beide bei einem Sprinttriathlon messen. Dadurch lässt sich ein Teil der Abweichungen erklären.

Ein weiterer Punkt ist, dass gerade im Mittelfeld (Endrang 50-100 Gmunden 2014) die prozentuellen Abstände im Ranking untereinander sehr gering sind. Betrachtet man die prozentuellen Abstände im 24-Monatsranking (Stand 22.09.2014) von Platz 1 zu 10, so beträgt dieser bereits 7% – für weitere 7% erreicht man bereits Rang 81 – und weitere 7% führen uns zu Platz 315. Dies bedeutet, dass eine Leistungsschwankung von 1-2% bereits eine deutliche Rangverbesserung bedeuten kann. Da die Tagesleistung eines Sportler/einer Sportlerin von vielen Faktoren abhängig ist, kann diese auch mal um 5% oder mehr schwanken. Dies würde in unserem konkreten Fall bedeuten, dass die Startnummer 50 mit einem schlechten Renntag auch mal auf Rang 65 landen kann. Diese Schwankungen werden sich aber mit keiner mathematischen Berechnung ausschalten bzw. vorhersagen lassen, menschliche Leistung ist nicht zu 100% berechenbar.

Dennoch sind wir mit einem Korrelationskoeffizienten Rang/Startnummer von 0,93 sehr zufrieden. Unser Ranking bzw. das Berechnungssystem wurde damit mehr als bestätigt und beweißt damit auch, dass die abgebildete Leistungsreihenfolge nicht auf Zufall basiert.

Was lernen wir nun aus diesem Experiment:

* Wir werden 2015 versuchen, bei mehreren Events die Startnummern über das Triathlonranking vergeben zu lassen, um so noch mehr Daten zu sammeln und eventuell auch Rückschlüsse zu erhalten, ob die Qualität der Vorhersage über alle Distanzen gehalten werden kann.
* Eine Trennung in Rankinglisten für verschiedene Distanzen würde möglicherweise eine noch genauere Leistungsanalyse zulassen
* Unser Weg stimmt und die Daten des Rankingsystems sind sehr stabil und verlässlich, soweit dies bei menschlicher sportlicher Leistung möglich ist.

Darüber hinaus ist noch erwähnenswert: Eine sehr erfreuliche Rückmeldung von mehreren Athleten und so von uns eigentlich gar nicht beabsichtigt, war, dass man durch die Vergabe der Startnummern nach Leistung während dem gesamten Bewerb als Sportler/Sportlerin recht gut abschätzen kann, wo man im Feld liegt. Hat man selbst Startnummer 100 und befindet sich immer im Umkreis von Startnummern um 80 weiß man: heute hat man einen guten Tag. Ein für Sportler und Sportlerinnen nicht uninteressanter Nebeneffekt.

[author image=“http://www.topsportaustria.at/sites/default/files/imagecache/author_photo/Bild%20006.jpg“ ]Mag. Thomas Doblhammer – Sportwissenschafter und Statistiker – Erfinder des Triathlonranking Austria[/author]

News

Die mobile Version verlassen