Die Idee für ein KI Projekt ist da. Wie erfolgreich und kostenbewusst umsetzen? - Digitalisierung mit Softarex

Die Idee für ein KI Projekt ist da. Wie erfolgreich und kostenbewusst umsetzen?

Auf Grund häufiger Fragen neuer Interessenten und Anwender aus der KI Community zu diesem Thema, hier die Sicht eines Software- und KI-Dienstleisters.

Wir bei Softarex realisieren für und mit unsere Kunden KI Projekte in 4 Phasen. Innerhalb dieser Phasen ermöglicht ein gut abgestuftes Risikomanagement, die Kosten im Rahmen zu halten. 

Discovery und Analyse Phase

In dieser Phase werden die Machbarkeitsstudien durchgeführt sowie Business- und Projektziele formuliert. Die Arbeit startet mit einer Analyse der Geschäftsprozesse des Kunden, seiner Daten Assets und der gegenwärtigen Performance Indikatoren bzw. Metriken des Geschäfts. Es werden Erfolgsfaktoren (z.B. gewünschte bzw. erwartbare Metrikverbesserungen), anwendbarer Tech Stack, Zeitplan und Budget definiert. Das alles wird sauber und strukturiert dokumentiert. Zusammen mit dem Kunden wird nun herausgefunden, ob ein KI Konzept möglich und sinnvoll ist. Außerdem werden Schätzungen für den Arbeitsumfang der nächsten Phase, der Entwicklung von Prototypen, abgegeben.

Prototypen-Implementierungs- und Evaluierungsphase

Ein Prototyp ist ein Stück Software oder Modell, das erstellt wird, um Machbarkeit und Proof of Concept zu testen. Es kann sich um ein limitiertes, text- oder zeichnungsbasiertes Mock-up oder andernfalls um einen komplexeren, codebasierten Prototypen handeln. Die Form hängt von der Komplexität des Projektes und den für die Entwicklung verwendeten Tools (Bildschirmgeneratoren, Anwendungssimulationsprogrammen oder Entwurfstools) ab. Prototypen werden dem Kunden gezeigt und mit ihm ausführlich durchgesprochen. Sie lassen sich schnell, kostengünstig herstellen und flexibel anpassen. Prototyping ist eine Technik, mit der Softwareentwickler und Mathematiker Anforderungen und Designentscheidungen validieren können. Die mit der Softwareimplementierung verbundenen Risiken und Kosten sind noch reduziert, da die Anforderungen frühzeitig vor Beginn der Entwicklung besprochen und verstanden werden können. Anschließend erfolgt die Kostenschätzung für die nächste Phase, das MVP.

Minimum Viable Product (MVP)

Ein MVP ist ein echtes, minimales Produkt mit den wichtigsten Funktionsmerkmalen, die auf der Grundlage der Prototypergebnisse entwickelt werden. Das MVP stützt sich auf die tatsächlichen Daten des Kunden und ist einer kleinen Gruppe von Endkunden als vereinfachte Version der finalen Produktlösung zugänglich. Die Rückmeldungen sind relevant, da die Modifikationen des Systems in diesem Stadium weitaus kostengünstiger sind, als vollständig entwickelt.

In Verlaufe dieser Phase kann ermittelt werden, ob das Projekt erfolgreich sein wird oder nicht. Bei Erreichung oder Nichterreichung bestimmter Meilensteine sollte nun vom Kunden und vom Entwicklerteam über die Fortsetzung, Beendigung oder grundlegende Überarbeitung des Konzepts entschieden werden. Um weiter Risiken zu reduzieren, ist es möglicherweise ratsam, mehrere Iterationen der Phasen 1-3 einzuplanen. Daneben werden die Kosten für Phase 4 geschätzt.

Produktentwicklung und Freigabe

In der letzten Phase wird das Produkt mit einem vollständigen Satz vordefinierter Funktionen entwickelt und auf den Markt gebracht. Die vorangegangenen Schritte legen großen Wert auf die Ermittlung und Validierung der Anforderungen. Die Kosten für diese Phase werden normalerweise in den vorherigen Phasen geschätzt.

Erfolgsfaktoren

Mögliche kostentreibende Einflüsse speziell bei KI Projekten (ich erwähne hier nicht die “normalen” Einflüsse bei der Softwareentwicklung):

Datenqualität und -verfügbarkeit

Die Entwicklung eines zuverlässigen ML-Systems hängt nicht nur ausschließlich von einer exzellenten Codierung ab – die Qualität, Quantität und Nutzung der Trainingsdaten spielen auch eine entscheidende Rolle.

  1. Zunächst sind große repräsentative Datensätze erforderlich, um die Beziehungen, die zwischen Eingabe und Ausgabe bestehen können, angemessen zu erfassen. Wenn nicht genügend Daten vorhanden sind, besteht manchmal die Möglichkeit, weitere Daten zu erfassen oder externe Datenquellen zu verwenden. Eine andere Lösung ist die Verwendung von Datenerweiterungsmethoden, um die Probengröße künstlich zu erhöhen.
  2. Eine weitere Anforderung ist, dass die Daten einfach zu verarbeiten sind – sie müssen gut organisiert und im richtigen Format, z.B. in einem Data Warehouse, gespeichert sein. Da dies oft nicht der Fall ist, sind einige vorbereitende Aktivitäten (z.B. sogenannte Extract-Transform-Load (ETL) Prozesse) erforderlich.
  3. Sind die die Daten strukturiert oder nicht? Es ist einfacher (folglich billiger), mit gut strukturierten Daten zu arbeiten. In einigen Fällen werden Daten gesäubert, aufgeräumt und konvertiert. Darüber hinaus ist es etwas schwieriger, mit fehlenden, extremen und unerwarteten Werten zu arbeiten oder mit Ausreißern, offensichtlichen Fehlern usw. umzugehen. In der Praxis verwalten die meisten Unternehmen unstrukturierte (z.B. Freiform-Texte) oder halbstrukturierte Daten (z.B. XML, E-Mails, Dokumente). Es gibt zum Glück inzwischen eine ganze Klasse von ML-Algorithmen, die verfügbar sind, um diese Art von Daten nutzbar zu machen.

Leistung und Geschwindigkeit des Algorithmus

Die angestrebte Algorithmus-Leistung ist ein weiterer kostenbeeinflussender Faktor, da für einen hochwertigen Algorithmus häufig viele Optimierungs- und Lernrunden erforderlich sind.

Die Leistung ist, je nach Geschäftsziel des Kunden und den Kosten falscher Vorhersagen oder Entscheidungen, von Kunde zu Kunde und Einsatzfall zu Einsatzfall sehr unterschiedlich. Beispiel: Eine Bank wird sicher schon mit einem KI System mit einer Leistung von 70%-Genauigkeit der Vorhersage des Firmenkreditausfalls wirtschaftlich erfolgreich arbeiten können. Denn mit 70% wird schon sehr viel besser vermieden, zu viele gute Kunden abzulehnen, die man als Bank haben will. Mit 70% werden zudem mehr Kreditausfälle vermieden, die durch die manuelle Prognose des Kreditausfalls herbeigeführt werden würde. Im weiteren Verlauf der normalen Nutzung im Teaming von Mensch und Maschine über die Jahre kann das System mit Hilfe von ML weiter verbessert werden und die Leistung verbessert werden.

Dagegen wäre für ein Krankenhaus eine Systemleistung von 92% korrekter Vorhersage für Komplikationen bei bestimmten Patienten und Operationen, bei dem die Folge 8% Mortalität wäre, nicht akzeptabel. Hier müsste weiter hoher Aufwand in die Verbesserung der Leistung investiert werden.

Neben der Qualität der Predictions als Leistungsmaß müssen wir uns um die Geschwindigkeit der Datenverarbeitung kümmern, um zu sicherzustellen, dass ein KI-Projekt erfolgreich wird. Denn Anwendungen der künstlichen Intelligenz basieren auf Daten, und verwenden diese für den Lernprozess und später für die Predictions bzw. Entscheidungen. Wenn die Daten langsam verarbeitet werden dauert das Einlernen des neuronalen Netzwerks länger. Das wiederum kann höhere Kosten verursachen und eventuell zu einem unnötigen vorzeitigen Projektabbruch führen.

Fazit

Es ist heute ein weit verbreitetes Missverständnis, dass die Nutzung der ML-Technologie ein Vermögen kosten würde. Während es sich vor einigen Jahren nur große, gut finanzierte IT-Unternehmen aus dem Silicon Valley leisten konnten, KI-gestützte Software zu entwickeln, können dies heutzutage auch viele mittelständige Unternehmen und Startups. Dabei können die Ziele sehr stark variieren. Von besserem Kundenservice, Robotik, Computervision, Sprache, Automatisierung bis hin zu neuen digitalen Produkten ist alles dabei. Dank der Entwicklung verschiedener Tools, Bibliotheken, KIaaS und Frameworks zum Erstellen von ML-basierter Software wird die ML-Technologie für Unternehmen immer leichter zugänglich, auch wenn das Bilden eigener Teams auf Grund des Fachkräftemangels schwierig erscheint.

Und nun noch der letzte Satz zur wachsenden Management-Komplexität durch KI: Man muss nicht immer alles selber machen. Wer sich die richtigen Partner sucht, Talente fördert, mit anderen Unternehmen Entwicklungsgemeinschaften oder Communities bildet, Englisch als Sprache der IT akzeptiert, schnelle Entscheidungen trifft, für gute, positive Stimmung sorgt und frühzeitig in vielversprechende Startups investiert, ist auch in Zeiten von KI als Mittelständler auf dem richtigen Wege.