Machine Vision beim Fußball | Softarex Blog

Maschinelles Sehen im Fussball: Analyse der Bewegung von Fussballer und Ball

Wenn Sie unserem Blog gefolgt sind, kennen Sie die moderne KI und ihre Möglichkeiten, die wir bei Softarex entwickeln, bereits. Folgen Sie uns, um mehr darüber zu erfahren.

In früheren Posts haben wir diskutiert, wie Maschinelles Sehen unser Verständnis von Sport und das Herangehen an diesen verändern kann. In diesem Post wollen wir darstellen, wie man diese Technologie für den Fußball nutzen kann.

Landmark Lokalisierung

Der Zustand des Objekts im Video kann durch Schlüsselpunkte beschrieben werden. Diese Punkte werden Landmarker genannt und ermöglichen ein besseres Verständnis der Struktur des zu analysierenden Objekts. Beispielsweise können Gesichts-Landmarken sehr nützlich sein für die Gesichtserkennung, Gesichtsanimation, Emotionserkennung, der Pupillenzustände oder des Blinzelns, Fotos und mehr.

Gleiches gilt für die Orientierungspunkte (Landmarker) des Körpers – sie können zur Erkennung von Gesten und Körperhaltungen einer Person, zur kontaktlosen Interaktion mit Gamecontrollern, zur Interaktion mit der Umgebung in Augmanted Reality-Anwendungen und zur Sportanalytik der Bewegungen von Athleten verwendet werden.

Das Bestimmen der Objektreferenzpunkte oder das Zentrieren eines Objekts ist das Extrapolieren einer Menge von Schlüsselpunkten aus einem gegebenen Bild. Für Gesichter sind wir nur an Landmarken interessiert, die die Form von Einzelteilen wie Augen, Augenbrauen, Nase, Mund und Kinn beschreiben. Oder es könnte zum Beispiel die Körperform sein: Kopf, Schultern, Ellbogen, Hände, Hüften, Knie und Füße.

Grundlegende Methoden

Es gibt viele verschiedene Methoden zum Erkennen dieser Punkte, aber hier sind die drei wichtigsten:

  • Die erste erhält ein zuverlässiges und genaues Ergebnis durch Analyse des aus dem zweidimensionalen Bild extrahierten dreidimensionalen Modells des Gesichts;
  • Die zweite beruht auf den Fähigkeiten von CNN (Convolutional Neural Networks) oder RNN (Recurrent Neural Networks);
  • Die dritte, ERT,  verwendet einfache, aber schnelle Funktionen, um die Position von Punkten zu schätzen.

Maschinelles Sehen im Fussball

Dlib, eine bekannte Open Source Bibliothek für maschinelles Lernen, die in C++ geschrieben wurde, verwendet die dritte Option. Es implementiert eine Vielzahl von Algorithmen, die sowohl auf PCs als auch auf mobilen Plattformen verwendet werden können. Der von Dlib vorgeschlagene Algorithmus zum Erkennen der Bezugspunkte der Person ist eine Realisierung des Regression Tree Ensemble – ERT.

ERT ist eine Kaskade von Regressionsfunktionen mit hoher Kapazität, die unter Verwendung der Gradientenverstärkung eingelernt werden. Dieses Verfahren verwendet Unterschiede in der Pixelintensität, eine einfache und schnelle Funktion, um die Position eines Landmarks direkt zu schätzen. Diese geschätzten Positionen werden anschließend korrigiert durch einen iterativen Prozess von Regressionskaskaden und Lernen durch Gradientenverstärkungen.

Regressionsmodelle erstellen einen neuen Wert aus dem vorherigen, wobei die Ausrichtungsfehler der Punkte bei jeder Iteration reduziert werden. Der Algorithmus ist sehr schnell – auf einem PC dauert es 1 bis 3 ms, um einen Satz von 68 Orientierungspunkten zu erkennen.

Im Wesentlichen wird ein Shape predictor aus einem Satz von Bildern, Anmerkungen und Lernparametern generiert. Eine einzelne Annotation besteht aus einem Objektbereich und markierten Punkten, die lokalisiert werden sollen. Der Bereich des Objekts kann leicht durch einen beliebigen Erkennungsalgorithmus ermittelt werden, aber die Punkte selbst können nur manuell markiert werden.

Die Haar- oder HOG-Kaskade in Kombination mit einem SVM-Detektor oder einem einzelnen CNN-Detektor kann verwendet werden, um Objekte wie Personen oder deren Gesichter automatisch zu erkennen. Dieser Prozess erstellt einen Rahmen um das Objekt.

Maschinelles Sehen im Fussball DE

Das Problem der hochpräzisen Analyse der Bewegungen von Fußballspielern beim Training und Spiel kann mit diesem Ansatz in der Sportanalytik gelöst werden.

Dazu müssen Sie eine Reihe wichtiger Punkte für den menschlichen Körper und Punkte für den Ball festlegen. Auf Basis von Schulungsvideos werden eine Reihe von Markierungspunkten gebildet. Für eine genaue Erkennung reicht eine Basis von 300 Bildern.

Der nächste Schritt besteht darin, das ERT-Modell einzulernen und die Genauigkeit der Ausführung zu analysieren. Wenn das Modell nicht präzise genug ist, müssen Sie den Datensatz erweitern und die Parameter des Lernmodells anpassen.

Ein vollständig eingelerntes Modell verarbeitet neue Videos in zwei Schritten:

Erstens – auf dem neuen Bild wird ein Rahmen um die analysierten Objekte gebildet – den Spieler und den Ball.

Zweitens – das ERT-Modell berechnet die Koordinaten der Schlüsselpunkte innerhalb dieses Rahmens.

Wenn wir diese Schlüsselpunkte verbinden, erhalten wir das digitale Skelett des Spielers und z.B. die Position des Balls beim Schuß.

Die digitale Bewegungsbahn jedes Punktes von Körper und Ball des Spielers wird dann für das gesamte Video nachgebaut. Das Modell berechnet außerdem die Parameter für die Geschwindigkeit über das gesamte Video und die Beschleunigung in bestimmten Zeitintervallen.

Dank der erhaltenen Informationen können die Trainer z.B. die Trainingseinheiten oder Übungen anpassen, um die Leistung der Spieler zu verbessern und viel mehr.

Fazit

Die Möglichkeiten der Verwendung von Maschinellem Sehen (Computer Vision) in Kombination mit passenden Algorithmen sind im Fußball nahezu unbegrenzt, da das Erfassen und Analysieren der Statistiken des Angreifers oder Verteidigers nur der Anfang ist. Es kann z.B.  auch die Leistung des Torwarts verfolgen und analysieren, die Geschwindigkeit des Balls im Spiel berechnen und vieles mehr. Wir haben mehrere Projekte bei Softarex, die ähnliche Aufgaben lösen.

Das dargestellte Beispiel ist nur eines von sehr vielen. Sie können hier mehr über unser Portfolio erfahren. Gern tauschen wir uns mit anderen Entwicklern aus. Bitte treten Sie dazu mit uns in Kontakt.

Machen Sie jetzt den Test! Überprüfen Sie digital Ihr Unternehmen ist und wo Sie sich noch steigern können.