Forum

Willkommen zum Forum!

Schnittstelle zu Rennberichten und Formenspiegel öffentlich zugänglich?
Autor Beitrag
Montag 25 März 18:05 Uhr
author

Leporello

Themen: 3
Beiträge: 297

Hallo zusammen,

ich konnte keine richtige Kategorie finden in welche meine Frage passt. Gibt es eine Möglichkeit, als Privatperson auf Ergebnisse von Rennen und ähnlichen Ereignissen über eine Schnittstelle zuzugreifen, oder bleibt mir nichts anderes übrig, als die Daten aus PDFs zu extrahieren?

Es wäre sehr interessant, eigene Excel etc. für den persönlichen Gebrauch zu erstellen. Auch wenn man die Rennberichte vom PDF digital einlesen kann, gestaltet sich der Prozess doch recht aufwendig und fehleranfällig.

Kennt jemand von euch vielleicht eine Lösung?

Danke Euch.

Montag 25 März 18:16 Uhr
author

Andreas Gruber

Themen: 4696
Beiträge: 2998

Nein, gibt es (leider) nicht.

Montag 25 März 18:31 Uhr
author

Leporello

Themen: 3
Beiträge: 297
Andreas Gruber schreibt:

Nein, gibt es (leider) nicht.

Echt schade, aber danke der schnellen Rückmeldung. Könnte mir gut vorstellen, dass es für manche von Interesse ist, wenn so Abfragen:

"wie häufig, wann und wo ist Pferd A schonmal gegen Pferd B etc gelaufen?"

einfach zu beantworten wären. Käme ja im Grunde den HVT durch zusätzliche Wetteinnahmen wieder zu gute..

Montag 25 März 22:00 Uhr
author

Nichtstarter

Themen: 7
Beiträge: 434

Das ist ein sehr gutes Thema, bei dem auch kaum verständlich ist, warum die Daten nicht frei zugänglich sind, so wie in FR z.B.
Für die richtigen Enthusiasten bleibt da nur eigene Software zu schreiben, die die Daten von den Webseiten auslesen. Insofern man überhaupt über entsprechende Kenntnisse verfügt.

Montag 25 März 22:56 Uhr
author

Leporello

Themen: 3
Beiträge: 297

Ich habe angefangen, Rennberichte aus Straubing und Daglfing für dieses Jahr automatisch einzulesen. Das ist extrem aufwendig, weil die PDFs für unser Auge zwar wohl strukturiert aussehen, für den Rechner jedoch gruselig sind. Es fängt schon damit an, dass Pferdenamen aus mehreren Wörtern bestehen können, aber nicht müssen. Dann fehlen manchmal Zwischenzeiten, die aber maschinell recht ähnlich zu den Quoten aussehen. Zudem fehlen die Startnummern, und man kann sich höchstens anhand der ersten drei bis vier Pferde im Einlauf orientieren.

Das dauert alles ewig, und kaum denke ich, dass ich eine Routine habe, kommt wieder eine Abweichung der Regel und somit eine Fehlermeldung. Es ist wirklich kaum vorstellbar, dass ein eigentlich zahlengetriebener Sport so etwas den Kunden nicht zur Verfügung stellt.

Wenn ich mit Straubing und Daglfing für dieses Jahr fertig bin, stelle ich die Daten gerne zur Verfügung. Das kann aber noch dauern... So sieht es bislang bei mir aus, und ich habe mich nur auf einige Angaben konzentriert. Jede weitere Spalte macht es noch komplexer.

Ergo: Ein Heidenaufwand für einen eigentlich primitiven Datensatz, aber es wäre einfach zu cool damit Auswertungen selbst zu erstellen..

Im Anschluss könnte man Wetterdaten etc. einfach ranspielen, das ist deutlich leichter zu beziehen...

 

 

Dienstag 26 März 07:27 Uhr
author

Nichtstarter

Themen: 7
Beiträge: 434

Wofür brauchst du denn die Auswertungen. Zum Wetten? 

Dienstag 26 März 19:21 Uhr
author

Leporello

Themen: 3
Beiträge: 297

Du scheinst aufgrund deines Avatarbilds ja durchaus datenaffin zu sein. Das gefällt mir. ;)

Ich glaube, zum Wetten an sich bzw. zum Erstellen eines KI-basierten Wettmodells ist es noch deutlich zu früh.

Ich würde mich aber schrecklich gerne der Pferdethematik analytisch zuwenden. Mich interessieren einfach Fragestellungen, die sich für einen Neuling wie mich schwer bzw. nur mit sehr intensiver jahrelanger Beschäftigung mit der Thematik ohne PC-Analysen erschließen.

Beispiele:

-Was ist die durchschnittliche Siegzeit je Rennbahn?

-Welche Zeit läuft durchschnittlich der Zweitplatzierte, der Drittplatzierte, etc.?

-Auf welcher Bahn gibt es die meisten Disqualifikationen?

-Wie hat sich das alles im Laufe der Jahre geändert? Sind hier eindeutige Trends ableitbar?

-Variiert die Siegzeit in Abhängigkeit von der Anzahl der Pferde?

-Ist es mathematisch möglich, Effekte eines Fahrers auf die Siegwahrscheinlichkeit abzuleiten?

-Wie häufig gewinnt ein Favorit?

-Was wäre passiert, wenn ich konsequent 10 Euro auf den Favoriten gesetzt hätte?

-Welche Pferde sind wie häufig gegeneinander gelaufen? Welches Duell gab es am häufigsten und wie waren die Ergebnisse?

Das fällt mir spontan ein und wäre alles ein Leichtes mit der oben erwähnten Excel-Struktur zu ermitteln. Prädiktoren für einen Sieg könnte man versuchen abzuleiten, aber hier ein treffsicheres Modell zu finden, halte ich für nahezu unwahrscheinlich. Vorstellen könnte ich mir aber durchaus, dass die Pferde vorab in 1-2, 2-3, 3-4, 4-5 eingeteilt werden könnten. Für die meisten ist das per Augenschein ersichtlich, für mich allerdings nicht.

Mittwoch 27 März 08:11 Uhr
author

Nichtstarter

Themen: 7
Beiträge: 434

Leporello Leporello Schön dass sich noch neue Leute im Sport finden, auch wenn du das Ganze ja eher aus technischer Sicht angehst. Andere gelangen ja mehrheitlich über Rennbahnbesuche oder Kontakte zu bestimmten Pferden bzw. Aktiven zum Sport. Finde ich aber trotzdem gut 😀

Für deine angedachten Analysen brauchst du aber viel mehr Daten, als nur Straubing und Daglfing. Excel ist als Datenhaltungstool auch eher ungeeignet, wenn überhaupt dann nur zur Auswertung mit Anbindung an ein Datenhaltungssystem. 
Manche deiner Fragen sind auch bereits irgendwo offiziell beantwortet. Insbesondere die letzten drei. (Frag mich aber nicht wo, das können dir andere sicher besser beantworten). 

Deiner These, dass es für KI-basierte Wettmodelle wohl noch zu früh ist, muss ich ausdrücklich widersprechen. Kommt aber auch darauf an, was man genau damit meint. Wir arbeiten seit ca. 2 Jahren an einer Lösung mit kleineren Machine Learning Elementen (hauptsächlich aber normale statistische Auswertungen) und werden diese auch umsetzen. Für uns ist aber wichtig, dass in erster Linie der Pferderennsport davon profitieren wird und keine anderen Interessensgruppen, die dann dem Sport einfach wieder das Wasser abgraben.
Der Plan ist, dass es ein USP (Alleinstellungsmerkmal) für den deutschen Pferderennsport ist, der nicht kopierbar ist und der ausschliesslich offizielle Totalisatoren bedient. (Als technisches Testprojekt hab ich ja diese private TG-Auswertung programmiert und online gestellt) 

Datenverarbeitung in der MS Azure Cloud via Json / REST Api's / SqlServer / NoSql / Azure Data Lake / Microservices Architektur / Blazor /Javascript. In etwa so:


Falls dir das etwas sagt und du Interesse hast, schreib mich privat an. Vielleicht kannst du dich ja mit einbringen.
(Leute die Daten überarbeiten brauchen wir auch immer)

Donnerstag 28 März 11:02 Uhr
author

Thorge Klütz

Themen: 2
Beiträge: 41

Leporello Leporello : Ich glaube, die erste Frage, die du dir stellen solltest ist "Was möchte ich Messen" und "Welches sind die passenden Indikatoren".

Die Datengrundlage ist zum Beispiel ein Problem. Auf racebets findet man eine Historie über die Duelle zwischen den Pferden, aber da in der Regel nur wenige Duelle gibt und es diese dann auch nur für einen Teil der an einem Rennen teilnehmenden Pferde gibt, sollten diese kein geeigneter Indikator sein.

Die für mich wesentliche Frage ist "Woran erkenne ich die besten Rennpferd im Feld" und  "welche messbaren Indikatoren gibt es dafür". Ein einfaches Beispiel wäre die Gewinnsumme. In einem Rennen treten oft Pferde ähnlicher Gewinnsumme an, aber manche Pferde haben diese mit weniger Rennen erreicht als andere. Bessere Pferde gewinnen mehr Geld in weniger Rennen und sollten daher eine höhere Wahrscheinlichkeit haben, kommende Rennen zu gewinnen. Die Rennzeiten sind in meinen Augen schwerer zu beurteilen- manche Rennen werden schnell gelaufen, andere verbummelt. Mal ist die Rennbahn in einem guten Zustand und an anderen Tagen regnet es in Strömen. Mal hat man einen aufwändigen Rennverlauf, manchmal passt alles. Das alles muss man mit einbeziehen, wenn man eine gelaufene Zeit beurteilen möchte und das lässt sich in meinen Augen schwer automatisieren. Vermutlich wird es einfacher, wenn man einen Durchschnitt über die letzten Rennen bildet und hofft, dass sich diese Effekte gegenseitig aufheben oder man schaut, ob die Zeiten der Pferde auf einer bestimmten Bahn um einen bestimmten Wert geschwankt sind. Aber da kommen wir wieder in einen Bereich, der ein wenig subjektiv ist und sich nicht so einfach automatisieren lässt.

Donnerstag 28 März 12:35 Uhr
author

Nichtstarter

Themen: 7
Beiträge: 434

Genau so ist es 😀 Um dieser Problematik ein bisschen entgegenzuwirken, haben wir geplant, auch manuelle Beurteilungen und Einschätzungen mit einzubauen. So hätte man die Möglichkeit, jedes Pferd in einem bestimmten Rennen zu beurteilen bzgl. der gezeigten Leistung. Wichtig dabei ist natürlich, dass man Beurteilungskriterien hat, die am Ende elektronisch bewertet und ausgewertet werden können. Da haben wir bis heute schon sehr viel Zeit, Herzblut und Fachwissen investiert. Man muss die Herausforderung einfach mal angehen 😀 

Donnerstag 28 März 21:36 Uhr
author

Leporello

Themen: 3
Beiträge: 297

Finde ich sehr gut.  Ich kann ein bisschen SQL und R und natürlich Tableau. Mit Python und co habe ich mich leider nie beschäftigt.  Bei den mathematischen Modellen hört es bei mir nach mutlivariaten bzw. logistischen Regressionsmodellen und maximal neuronalen Netzen auf. Ihr werdet wahrscheinlich viel aktuellere machine learning Verfahren anwenden. Bin hier nicht mehr am Puls der Zeit und wüsste derzeit auch nicht, wass bspw. ChatGPT standardmäßig eingebaut hat.

Wird aber mal Zeit, da insbesonder Python wohl keine Raketenwissenschaft sein soll.  Ich finde den Ansatz jedenfalls richtig gut, wenn ich unterstüzen kann, gerne. 

 

Mein Ansatz war zunächst in der Tat deutlich simpler und nicht auf die große Lösung bedacht. Für meine eigne Wissensbildung hätte ich meine erwähnten Fragen einfach beantwortet. 

arrow