Computer Vision: Analyse des dynamischen Zustandes eines Objektes - Digitalisierung mit Softarex

Computer Vision: Analyse des dynamischen Zustandes eines Objektes

Computer Vision – eine junge IT-Disziplin

Computer Vision und KIComputer Vision (Maschinelles Sehen) ist eine junge IT-Disziplin, in der es um die Entwicklung von Methoden, Hard- und Software für die Lösung von visuellen Aufgabenstellungen geht. Die Aufgabenstellungen von Computer Vision orientieren sich am menschlichen Sehvermögen. Beispiele für maschinelles Sehen sind:

  • Texterkennung
  • Objektverfolgung in der Industrie
  • Biometrieanalyse auf dem Smartphone
  • Autonome Steuerung von Fahrzeugen und Flugobjekten (Drohnen)
  • Sport – Analyse des dynamischen Zustands eines Objektes

Analyse des dynamischen Zustandes eines Objektes – ein Beispiel

Stellen Sie sich das Betrachten eines Sportvideos vor. Die Spieler eines Fußballspieles bewegen sich auf dem Spielfeld, treiben den Ball voran, passen, laufen, dribbeln und schießen auf das Tor. Dabei durchläuft ihr Körper wiederholt bestimmte Bewegungsmuster. Diese Bewegungsmuster können Aufschluss geben über das Können und den Trainingszustand einzelner Spieler. Mit moderner Computer Vision Software, auf AI (artificial intelligence)-basierend, können diese Bewegungen über den Verlauf eines Spieles aufgezeichnet und ausgewertet werden. Mit Computer Vision steht dem Trainer eine unschätzbare Informationsquelle zur Verfügung.

Wie funktioniert Computer Vision Software?

Computer Vision Software teilt die Geometrie eines bewegten Objektes, wie den Körper eines Fußballspielers, virtuell in eine Reihe von Sektionen auf. Diese Sektionen können Arme, Beine, Rumpf, Kopf, Hände und Füße sein. Jeder Sektion werden Keypoints zugeteilt, zum Beispiel Schultergelenk und Handgelenk als Keypoints eines Armes. Die Bewegung der Keypoints im Raum wird verfolgt und in einer Datenbank aufgezeichnet. Anschließend können diese Bewegung und ihr Zusammenspiel mit den anderen Körperteilen von Computer Vision Software ausgewertet werden. Es können mehrere bewegte Objekte gleichzeitig verfolgt und aufgezeichnet werden. Im Falle eines Fußballspiels wären das alle auf dem Platz befindlichen Spieler und der Ball.

Der oben beschriebene Ablauf wird in einer Computer Vision Anwendung in zwei Schritte aufgeteilt. Der erste Schritt dient dazu, die ruhenden oder bewegten Objekte zu erkennen (Object Detection). Im zweiten Schritt werden die erkannten Objekte verfolgt (Object Tracking).

ie Bilder (Frames) eines Sportvideos stehen als Pixel-Sammlungen zur Verfügung. Spezielle Algorithmen sind in der Lage, in diesen Pixel-Sammlungen Objekte zu erkennen. Um jedes erkannte Objekt im ersten Bild einer Serie von Bildern, eines Videos, wird von der Computer Vision Software eine virtuelle Box (Bounding Box) gelegt. Im nächsten Bild wird ein etwas größerer Rahmen (Bounding Box) um das Gebiet der vorherigen Bounding Box gelegt. Das Objekt wird sich weiter bewegt haben und ist nun sehr wahrscheinlich innerhalb der neuen Bounding Box leicht und schnell zu identifizieren. Dieser rechnerische Vorgang nennt sich Tracking. Das Tracking der Computer Vision Anwendung verbessert sich automatisch mit jeder neu erkannten Objekt-Position (maschinelles Lernen). Die Perspektive der Kamera muss noch eingearbeitet werden, um die Position der Objekte auf dem Spielfeld zu bestimmen.

Computer Vision und künstliche Intelligenz

Die oben erläuterten Prinzipien einer Computer Vision Software für die Aufzeichnung von Fußballspielen lässt sich natürlich auch auf andere Sportarten übertragen. Die Computer Vision Technologie gibt allerdings viel mehr her. Für die folgenden Überlegungen soll der Blick deshalb erweitert werden auf das Fachgebiet der künstlichen Intelligenz (AI = Artificial Intelligence).

Künstliche Intelligenz ist ein Teilgebiet der Informatik. Von Anfang an lernen zu können ist eine der wichtigsten Eigenschaften, die Systeme zur künstlichen Intelligenz kennzeichnen. Maschinelles Lernen gehört als Teilgebiet zur künstlichen Intelligenz. Die Fähigkeit des maschinellen Lernens ist eine wichtige Voraussetzung für maschinelles Sehen.

Maschinelles Sehen (Computer Vision) ist ein weiteres Teilgebiet der künstlichen Intelligenz. Sie kommt im Erkennen von Formen und in ihrer Analyse zum Ausdruck. In der Mustervorhersage wird die künstliche Intelligenz genutzt, um vorherzusagen, wo sich ein Objekt im nächsten Bild einer Serie von Bildern eines zeitlichen Ablaufes befinden wird. Das maschinelle Sehen von Computer Vision Systemen lässt sich durch Training mit vorhandenen Datensätzen verbessern.

Für Artificial Intelligence, maschinelles Lernen und Computer Vision werden häufig große Datenmengen durchgearbeitet. Die Fähigkeit der Algorithmen, hier schnell zu den wesentlichen Informationen durchzudringen und Rechenabläufe abzukürzen, zum Beispiel durch Näherungsverfahren, die eine gute Abschätzung liefern, entscheidet über die Brauchbarkeit der KI-Anwendung. Die Schnelligkeit der Artificial Intelligence Algorithmen ist ein wesentliches Kriterium für die Anwenderakzeptanz.

Der Status von Künstlicher Intelligenz in 2019

In einer Studie eines deutschen IT-Unternehmens stiegen Künstliche Intelligenz (KI) und Maschinelles Lernen (ML) in der Prioritätenliste der befragten Unternehmen vom vierten auf den dritten Platz. Davor liegen laut der Studie nur noch Cloud Computing und IT Security. Diese Veränderung zeigt, wie wichtig das Thema für die Überlebensfähigkeit der Unternehmen in Zukunft sein wird.

Der Markt von Systemen für maschinelles Sehen wird für 2019 bereits auf einen zweistelligen Milliardenwert geschätzt. Entsprechend groß ist das Engagement der Akteure im Markt für Computer Vision. Es lässt auf schnelles Fortschreiten der Entwicklung hoffen.
Dabei ist maschinelles Sehen inzwischen etwas ganz Alltägliches für unzählige Menschen weltweit. Jeder, der sein Smartphone mit einem Blick in die Kamera per Gesichtserkennung entsperrt, nutzt Computer Vision. Meist ohne sich dessen wirklich bewusst zu sein. Der wachsende Bedarf an Industrie 4.0 Anwendungen treibt die Entwicklung von Computer VisionAnwendungen zusätzlich voran.

KI-Anwendungen sind häufig Echtzeit-basierte Systeme. Ihre Handhabbarkeit wächst mit der Leistungsfähigkeit der Hardware, auf der sie betrieben werden. Unternehmen wie Google, Intel, IBM und Tesla arbeiten deshalb an der Entwicklung spezieller KI-Chips. Es kann von einer weiteren Beschleunigung der Entwicklung in Artificial Intelligence und Computer Visionausgegangen werden.

Sicherheit für Entscheider

Die künstliche Intelligenz ist eine junge und zugleich komplexe Richtung innerhalb der Informationstechnologie. Die Fülle der neuen Möglichkeiten mit KI ist groß. Ihr Aufschwung entfaltet sich zeitgleich mit einer allgemeinen Tendenz hin zu überraschenden Entwicklungen in einzelnen Marktsegmenten (disruptive Technologien). Das macht es den Entscheidern schwer, zukünftige Szenarien sicher vorherzusagen und ihre Entscheidungen daran auszurichten. Diese Situation lässt es ratsam erscheinen, möglichst frühzeitig die Expertise spezialisierter Unternehmen wie Softarex in Anspruch zu nehmen. Im Rahmen eines Beratungsprojektes kann systematisch ausgelotet werden, welche Chancen und Risiken durch Künstliche Intelligenz entstehen.

Softarex als Partner für Computer Vision Projekte

Softarex ist ein amerikanischer Software-Hersteller mit Niederlassungen in Europa. Softarex ist auf die Entwicklung von Software für künstliche Intelligenz (artificial intelligence) spezialisiert.

Softarex hat mit künstlicher Intelligenz und Computer Vision ein System für einen Kunden entwickelt, dass das visuelle Monitoring der Zubereitung von Mahlzeiten in Restaurantketten mit Videokameras ermöglicht. Ein positives Ergebnis ist, dass eine überraschend hohe Menge an zubereiteten Mahlzeiten identifiziert wurde, die den Gast nicht erreichten (mehr als 30 %). Das ist ein enormes Potenzial, um mit Verbesserungsmaßnahmen anzusetzen. Es zeigt, dass der Nutzeffekt durch eine Computer Vision Software überraschend hoch und interessant für die eigenen Kunden sein kann.

Wann sollte Softarex als Partner ins Boot geholt werden?
Die Antwort ist einfach: am besten möglichst schnell. Denn die Chancen, eine kostbare Marktlücke für die Entwicklung einer eigenen Anwendung frühzeitig zu entdecken, sind gut und sollten nicht ungenutzt verstreichen. Mit der Expertise eines erfahrenen Softwareentwicklers für Artificial Intelligence kann das innovative Potenzial einer Computer Vision Anwendung erkannt und voll ausgeschöpft werden.