How to Machine Learning | Softarex Blog

Machine Learning: Wie man eine Maschine trainiert

Über maschinelles Lernen ist eine relativ neue Wissenschaft. Schauen Sie sich nur die enormen Fortschritte in kurzer Zeit an, die Amazon oder IBM Bluemix gemacht haben. Softarex nutzt diese neuen und innovativen Werkzeuge für Forschungen und Entwicklungen in vielen Bereichen.

Machinelles Lernen mit KI

Computersysteme beherrschen immer mehr abstrakte Fähigkeiten und entwickeln sich auf neue Weise durch Training und Lehre. Sie lernen zu sehen, zu hören, zu sprechen, Sprachen zu übersetzen, Autos zu fahren, Bedürfnisse und Wünsche vorherzusehen und vieles mehr.

Machine Learning ist ein Untermenge der künstlichen Intelligenz, der rechnergestützte Methoden verwendet, um Informationen direkt aus Daten zu “lernen”, die sich sowohl auf ihr eigenes Modell als auch auf vorgegebene Algorithmen als Modell stützen. Je mehr Beispiele zum Lernen zur Verfügung stehen – desto besser ist die Leistung der Algorithmen. Es kann aus vier Techniken bestehen: Beaufsichtigtes, unbeaufsichtigtes, teilüberwachtes und verstärktes Lernen.

Künstliche Intelligenz wird schlauer

Überwachtes Lernen

Überwachtes Lernen findet Muster und entwickelt prädiktive Modelle, indem es sowohl Input- als auch Outputdaten verwendet. Das formt Regressionen und Klassifizierungen.
Ziel der Regression ist es, die Ausgabewerte anhand einer Stichprobe von Objekten mit unterschiedlichen Eigenschaften zu reproduzieren. Es empfiehlt sich dann, wenn es sich z.B. um die Vorhersage des Niveaus der Genexpression, der Preise aus ihrer Beschreibung, des Umsatzes, der Lufttemperatur usw. geht.
Die Klassifizierung repliziert Klassenzuordnungen basierend auf einer Menge von Attribute. Es wird genutzt, um z.B. den Zustand des Chromatins, die Löslichkeit einer Chemikalie, Geschlecht, Spam oder Non-Spam, die Möglichkeit des Austritts eines Mitarbeiters oder Kunden und vieles mehr vorherzusagen.

Unüberwachtes Lernen

Diese Technik findet Muster, die nur auf Eingabedaten basieren. Es kann genutzt werden, wenn man nicht ganz sicher ist, wonach gesucht werden soll. Unüberwachtes Lernen kann als ein erster Schritt vor der Anwendung des überwachten Lernens verwendet werden. Es besteht aus Clusteranalyse und Reduzierung der Zahl der Dimensionen.
Clustering sortiert Daten in Cluster und findet Anomalien anhand von Merkmalswerten. Es ist sehr nützlich z.B. für die Geschlechtervorhersage, die Klassifizierung von Zellen aus Bildern, die Identifizierung eines Objekts in einem Foto, die Erstellung von Clustern ähnlicher Tweets basierend auf ihrem Inhalt und so weiter.
Die Reduzierung der Dimensionen wird verwendet, um die Daten auf einfachere Weise darzustellen. Die endgültige Klassifizierung erfolgt oft auf der Grundlage von zu vielen Merkmalen. Je höher die Anzahl der Funktionen, desto schwieriger wird es, den Trainingssatz zu visualisieren und daran zu arbeiten. Hier kommen Algorithmen zur Dimensionsreduktion ins Spiel.

Machine learning' width=

Teilüberwachtes Lernen

Teilüberwacht ist ein Trainingsdatensatz mit sowohl markierten als auch unmarkierten Daten. Diese Methode ist nützlich, wenn es schwierig wird, relevante Merkmale aus den Daten zu extrahieren, oder wenn z.B. Beschriftungsbeispiele zu lange dauern.
Medizinische Bilder wie CT-Scans oder MRTs sind häufige Situationen für diese Lerntechnik. Ein ausgebildeter Radiologe kann eine kleine Teilmenge von Scans auf Tumore oder Krankheiten markieren. Es würde viel Zeit in Anspruch nehmen, alle Scans manuell zu beschriften – aber das Deep-Learning-Netzwerk kann von der geringen Zahl an beschrifteten Daten profitieren und seine Genauigkeit im Vergleich zu einer unbeaufsichtigten Technik verbessern.

Verstärktes Lernen

In dieser Art des maschinellen Lernens sind die KI-Agenten bestrebt, den besten Weg zu finden, um ein bestimmtes Ziel zu erreichen oder die Leistung bei einer bestimmten Aufgabe zu steigern. Der Agent erhält eine Belohnung, wenn er auf das Ziel hinarbeitet. Das allgemeine Ziel: die besten nächsten Schritte vorherzusagen, um die größte Endbelohnung zu erhalten.

Ein Agent stützt sich sowohl auf frühere Erfahrungen als auch auf die Analyse neuer Taktiken, die einen größeren Gewinn bringen können. Dies funktioniert in einer langfristigen Strategie – je mehr Feedback-Zyklen, desto besser wird der Spielplan des Agenten. Diese Technik ist besonders fruchtbar für Trainingsroboter, die eine Reihe von Entscheidungen treffen, z.B. beim Umgang mit einem autonomen Fahrzeug oder bei der Bestandsführung in einem Lager.

Algorithmen und Technologien
Softarex nutzt bestehende Algorithmen in der Forschung und schafft daneben eigene Algorithmen, wenn es darum geht, einige einzigartige Herausforderungen zu lösen. Außerdem arbeiten die Data Science Entwickler von Softarex mit Amazon Machine Learning – einem Service zur Vereinfachung der maschinellen Lerntechniken für Entwickler aller Ebenen. Und sie arbeiten auch u.a. mit  IBM Watson – ein kognitives System mit der Fähigkeit, in natürlicher Sprache zu interagieren, große Mengen an disparaten Formen großer Datenmengen zu verarbeiten und aus jeder Interaktion zu lernen

Ansätze, die wir verwenden:

●      Lern-Entscheidungsbäume und Regeln der Lern-Assoziation;

●      Künstliche Neuronale Netze und Tiefenlernen;

●      Unterstützt Vector Machine und Ensembles;

●      Clustering, Bayes’sche Netzwerke und mehr.

 

Algorithmen, die wir verwenden:

●  Entscheidungsbaum, Naiver Bayes-Klassifikator, Lineare Regression;

●  Logistische Regression, Support Vector Machine, Random Forrests;

●  Gradient verstärkte Bäume, K-Mittel, C-Mittel;

●  DBSCAN, EM-Algorithmus, Kohonen Neural Network;

●  Wertzerlegung, unabhängige Komponentenanalyse und andere

 

Technologien, Frameworks und Bibliotheken, die von Softarex genutzt werden:

●   Java – Hadoop, Datumbox, ELKI;

●   Python – TensorFlow, BioPy, Auto_ml, Keras, Scikit-Lernen, Pandas;

●   C++ – Dlib, openCV, Darknet, YOLO;

●   JavaScript – Clustering.js, Clusterfck, Machine Learning;

●   IBM Bluemix, AWS;

●    Und andere.

 

Dieser Artikel ist nur eine kleiner Teil unserer Erfahrungen. Um mehr zu erfahren, sollten Sie sich unbedingt unser Portfolio ansehen. Bleiben Sie auch auf dem Laufenden, um über alle kommenden Artikel informiert zu sein! Wir tauschen uns gern mit anderen Entwicklern aus und sind offen dafür, etwas Neues zu lernen. Wenn Sie also Fragen oder Ideen haben, schreiben Sie uns bitte