Data Science Projekt? | Softarex Blog

Wie packt man ein Data Science Projekt richtig an?

Daten sind für ein Unternehmen wichtig, dessen sind sich die meisten Betriebe bewusst. Viele Unternehmen sitzen mittlerweile auf einem Berg von Daten, der sich über Jahre angesammelt hat. Teilweise werden diese Informationen verwertet, doch weit nicht in dem Umfang, in den es möglich wäre. Die Firmen sitzen oft auf einem “Schatz”, denn sie bisher nicht genutzt haben, der ihnen aber nicht nur höhere Gewinne bringen könnte, sondern auch einen deutlichen Vorteil gegenüber der Konkurrenz. Wie schwierig es ist Daten nutzbar zu machen und das, obwohl bereits künstliche Intelligenz eingesetzt wird, zeigt, wie wenig nutzbare Informationen sich bisher daraus generieren lassen. Data Science ist keine einfache Aufgabe und wer ein Projekt in seinem Unternehmen etablieren will, der muss auch hinter diesem Vorhaben stehen.

Was ist Data Science?

WieDataSciencegenutztwirdData Science bezeichnet die Tätigkeit auch Daten Wissen zu generieren. Vorhandene Daten bedeuten nicht automatisch, dass man aus ihnen irgendwelche Informationen ablesen kann, dazu müssen diese Daten erst nutzbar gemacht werden. Dazu werden unterschiedliche wissenschaftliche Methoden und Prozesse verwendet. Auch künstliche Intelligenz kann hilfreich sein, um Wissen aus Daten zu generieren. Allerdings sollte künstliche Intelligenz nur in bestimmten Bereichen eingesetzt werden. Vor allem bei unstrukturierten Daten stößt künstliche Intelligenz noch an ihre Grenzen, wesentlich einfacher können strukturierte Informationen verarbeitet werden. Der Vorteil ist allerdings, dass sich künstliche Intelligenz sehr gut zur Unterstützung von einem Data Science Projekt einsetzen lässt, allerdings kann die KI nicht alleine aus sämtlichen Daten Wissen generieren.

Experten in Datenwissenschaft sind Mangelware!

Da die künstliche Intelligenz nicht alleine mit einem Data Science Projekt betraut werden kann, benötigt es nach wie vor Experten, die aus Daten Wissen generieren können. Die Experten müssen nicht nur wissen, welche Methoden und Prozesse sie anwenden oder wie sie mit der künstlichen Intelligenz umgehen, die müssen auch fundiertes Wissen im Bereich Datenschutz und Datensicherheit haben. Nur weil Daten zur Verfügung stehen bedeutet dies noch lange nicht, dass sie auch genützt werden dürfen. Unter anderem beschränkt die Datenschutzgrundverordnung das Recht der uneingeschränkten Nutzung und gibt den Eigentümern der Daten wie Kunden deutlich mehr Rechte. Dieser Umstand muss ebenfalls bei einem Data Science Projekt berücksichtigt werden.

Hohe Datenqualität ist wichtig!

Daten sind nicht gleich Daten, denn nicht jede Information ist gleich gut. Vor allem wenn eine künstliche Intelligenz die Daten weiterverarbeiten soll, müssen diese in einer entsprechend guten Qualität vorhanden sein. Anderenfalls kann es sein, dass die künstliche Intelligenz die falschen Schlüsse zieht. Daher kann die künstliche Intelligenz niemals alleine für ein Data ScienceProjekt verantwortlich sein, sondern immer nur unterstützend verwendet werden. Tatsächlich ist der Aufwand die Rohdaten zu analysieren, damit sie etwa an eine künstliche Intelligenz weitergereicht werden können, sehr hoch. Zwischen 60 und 80 Prozent entfallen ausschließlich auf die Bearbeitung der Rohdaten, damit sie etwa von einer künstlichen Intelligenz für ein Data Science Projekt weiter verarbeitet werden können.

Wie können Daten nutzbar gemacht werden?

Statistiken bei Big DataEin Grund, warum es so wenige Experten im Bereich Data Science gibt, ist, dass die Methoden, die dazu verwendet werden, oft interdisziplinär sind. Unter anderem muss ein fundiertes Wissen in der Mathematik vorhanden sein. Unverzichtbar ist natürlich die Statistik und auch in der Informationstechnologie müssen die Spezialisten fit sein. Alle diese Bereiche sind notwendig um tatsächlich Wissen aus Daten zu extrahieren.

Braucht jedes Unternehmen ein Data Science Team?

Kaum jemand vereint alle diese Fachbereiche in einer Person, weshalb es meist mehrere Experten für ein Data Science Projekt benötigt. Wer ein Projekt starten möchte, sollte daher erst ein eigenes Team dafür einsetzen. Einige Bereiche die Programmieraufgaben für eine künstliche Intelligenz können ausgelagert werden. Allerdings benötigt es nach wie vor Experten, die die Daten nutzbar machen und parallel dazu auch eigene Schlüsse aus den Informationen ziehen. Es macht daher durchaus Sinn ein eigenes Data Science Team im Unternehmen zu haben. Zudem ist Data Science kein einmaliges Projekt, sondern ein konstanter Prozess, der immer wieder wiederholt wird. Der Vorteil ist, dass im Laufe der Projektzeit auch Teilbereiche wie die künstliche Intelligenz immer besser wird, da die Algorithmen konstant erweitert werden können. Zwar ist es nicht das Ziel die künstliche Intelligenz gänzlich alle Aufgaben übernehmen zu lassen, sie soll aber auch zukünftig bei der Analyse der Daten eine wichtige Rolle spielen. Künstliche Intelligenz ist jedoch keine Stangenware, sondern muss auf jedes Unternehmen maßgeschneidert sein. Nur so kann die künstliche Intelligenz nachhaltig zur Gewinnung von Wissen verwendet werden.

Wie wirkt sich ein Projekt zur Datenwissenschaft auf das Unternehmen aus?

Die künstliche Intelligenz ist mittlerweile weiter als viele glauben und kann eine Unterstützung im Unternehmen sein. Voraussetzung dafür ist allerdings, dass alle im Unternehmen hinter dem Data Science Projekt steht. Data Science ist nicht nur auf eine Abteilung begrenzt, sondern jeder Bereich kann Auswirkungen auf die Prozesse im Unternehmen haben. Dabei spielen oft Trivialitäten, wie der Papierverbrauch, ein Rolle, wo allerdings erhebliches Einsparungspotenzial wäre, wenn Informationen etwa digital archiviert werden. Ein Data Science Projekt ist daher ein unternehmensweites Projekt, das alle Abteilungen über alle Ebenen beeinflusst. Es reicht oft, dass nur eine kleine Information fehlt und die künstliche Intelligenz hat nicht alle Daten, wodurch falsche Schlüsse gezogen werden. Wer ein Data Science Projekt starten will, der muss sich im Klaren sein, dass wirklich alle Informationen im Unternehmen relevant sein können und natürlich zur Verfügung stehen müssen.

Wo liegen die technologischen Grenzen?

Obwohl die künstliche Intelligenz bereits weit entwickelt ist, gibt es Grenzen. Die Grenzen werden häufig durch die verwendeten Technologien gesetzt. Nicht immer ist die IT-Infrastruktur in einem Unternehmen auf dem aktuellsten Stand, was wiederum bedeutet, dass für die künstliche Intelligenz wichtige Rechnerleistung fehlt. Das führt dazu, dass Daten langsamer verarbeitet werden und oft mühevoll selbst eingegeben werden müssen. Das sollte nicht das Ziel von einem Data ScienceProjekt sein, denn durch das Ausräumen von technologischen Grenzen gibt es auch Synergieeffekte im Unternehmen. Die Mitarbeiter profitieren von leistungsstärkeren Geräten, es können Aufgabenbereiche digitalisiert werden. Dies führt wiederum dazu, dass weitere Informationen in einer geeigneten Form zur Verfügung stehen, damit sie direkt an eine künstliche Intelligenz weitergereicht werden kann. Der Vorteil ist, dass es für Big Data nicht nur zahlreiche Lösungen gibt, sondern auch angepasste Lösungen geschaffen werden können.