Machine Learning - Das maschinelle Lernen

Machine Learning – Wie maschinelles Lernen durch Algorithmen Ihre Maschinen zu intelligenten Helfern machen kann

Machine Learning – zu Deutsch maschinelles Lernen - ist ein Segment der Künstlichen Intelligenz die auf Englisch als Artificial Intelligence (AI) bezeichnet wird. Innerhalb der AI reiht sich Machine Learning ein mit Schwesterdisziplinen der Artificial Intelligence wie Robotik, Kybernetik, Expertensystemen, Verarbeitung natürlicher Sprache, industrieller Bildverarbeitung und Spracherkennung. Eng verwandt ist es auch mit Data Mining, Deep Learning und Neuronalen Netzwerken.

Einfach formuliert beschreibt Machine Learning die Fähigkeit einen Computer dazu zu bringen, dass er etwas tut ohne explizit dafür programmiert worden zu sein. Der Computer oder das künstliche System eignet sich dabei eigenständig Wissen durch Erfahrungen an. Ziel ist es den Computer dazu bringen, dass er Probleme selbstständig löst. Ein großer Nutzer und Entwickler von Systemen und Methoden von maschinellem Lernen ist Google. Google nutzt zahlreiche Systeme und Software des maschinellen Lernens beispielsweise bei seinen Suchmaschinen. 2014 übernahm Google zudem mit Deep Mind ein Unternehmen, das sich auf die Entwicklung von Systemen, Methoden und Software der KI spezialisiert.

Durch Machine Learning löst der Computer nicht nur Probleme, sondern kann auch zeitintensive Arbeiten oder Routineaufgaben übernehmen. Die Möglichkeiten und Einsatzgebiete sind dabei ziemlich vielfältig. Doch welche Methode des Machine Learnings passt für Ihr Unternehmen und wie lässt sie nutzen?

Arnold IT Systems hat bereits erfolgreiche Projekte des Maschinellen Lernens in der Industrie umgesetzt. Gerne zeigen wir auch für Ihr Unternehmen auf, ob und wie Machine Learning bei Ihnen eingesetzt werden kann. Profitieren Sie von unserem Erfahrungsschatz an Wissen und zapfen Sie unsere KI knowledge base an.

Das Prinzip des Machine Learning:

Wie zuvor beschrieben ist Machine Learning ein Teilbereich der Künstlichen Intelligenz. Dabei wird der Computer dazu erzogen, durch iteratives Lernen selbstständig Entscheidungen zu treffen. Prinzipiell funktioniert das Lernen etwa wie beim Menschen.  Junge Menschen lernen beispielsweise Bilder, Menschen oder Dinge zu erkennen. Ähnlich kann der Computer und sein Algorithmus durch systematisches Data Mining lernen. Wichtig dabei ist, dass dem Computer und seinen Algorithmen beigebracht wird was „richtig“ und „falsch“ ist. „Richtig“ beschreibt dabei das gewünschte Ergebnis und „falsch“ die Abweichung. Ob das Verfahren dabei online oder offline stattfindet ist unerheblich.

Ein industrielles Einsatzgebiet für das Lernen findet sich in der Qualitätskontrolle in der Produktion. Die Algorithmen lernen dabei eine saubere von einer unsauberen Bohrung zu unterscheiden. Damit der Computer die Unterscheidung treffen kann, braucht der eingesetzte Algorithmus oder die Algorithmen eine große Menge an Daten, quasi Big Data Feeds. Diese Daten können Bilder, Zeichnungen oder sonstige Darstellungen sein. Typischerweise erhält der Computer zu jedem Satz an Daten auch die Information, ob diese Daten die richtigen oder falschen Zustände beinhaltet oder zeigt. Machine Learning umfasst mehrere Arten des Lernens. Diese sind nachfolgend beschrieben. 

Vier gewinnt – Das Quartett der Maschine Learning Systeme

Es gibt nicht das ‚Machine Learning‘ an sich. Es umfasst vielmehr vier Arten des Machinellen Lernens. Diese sind Überwachtes Lernen (englisch: supervised machine learning), Unüberwachtes Lernen (englisch: unsupervised machine learning), Teilüberwachtes Lernen (englisch: semi-supervised learning) und Verstärkendes Lernen (englisch: reinforcement learning). Jede der Arten hat ihre Besonderheiten. Im Detail lassen sich die Arten wie folgt beschreiben:

Machine Learning: Übersicht der einzelnen Unterarten des maschinellen Lernens
Machine Learning im Detail: Die vier Arten des maschinelle Lernens in einer Übersicht

Vier gewinnt – Das Quartett der Maschine Learning Systeme

Es gibt nicht das ‚Machine Learning‘ an sich. Es umfasst vielmehr vier Arten des Machinellen Lernens. Diese sind Überwachtes Lernen (englisch: supervised machine learning), Unüberwachtes Lernen (englisch: unsupervised machine learning), Teilüberwachtes Lernen (englisch: semi-supervised learning) und Verstärkendes Lernen (englisch: reinforcement learning). Jede der Arten hat ihre Besonderheiten. Im Detail lassen sich die Arten wie folgt beschreiben:

Überwachtes maschinelles Lernen (englisch: supervised machine learning):

Beim überwachten maschinellen Lernen verwendet das lernende System bekannte Daten, um darin Muster oder Strukturen und deren Beziehung zueinander zu identifizieren. Der Algorithmus (englisch: algorithm) lernt dabei aus Vorlage oder Präsentation von Beispieldaten. Er benötigt dazu jeweils einen Datensatz zum Training. Dieser beinhaltet die Information über den korrekten Zustand der Daten.

Soll ein Algorithmus zum Beispiel erkennen, ob auf einem Bild ein Schiff abgebildet ist. Dann muss ihm vom Trainer für das jeweils vorgelegte Bild die Information über den korrekten Zustand „Schiff“ mitgeteilt werden. Damit sich das System eigenständig trainiert, sind viele Iterationen und große Datenmengen notwendig. Diese Mengen an Daten müssen umso größer sein, je komplexer das zu erkennende Muster oder die zu identifizierende Struktur sind.

Praxisbeispiele für überwachtes Lernen ist das Vorhersagen von Verbräuchen in einem bestimmten Zeitraum, die Ermittlung der Wahrscheinlichkeit von Ausfällen von Maschinen oder Prognosen über Wertentwicklungen für einen festgelegten Zeitraum.

Unüberwachtes maschinelles Lernen (englisch: unsupervised machine learning):

Anders als beim überwachten maschinellen Lernen erhält der Algorithmus beim unüberwachten maschinellen Lernen keine Beispieldaten, die einen korrekten Zustand beschreiben. Anstatt dessen muss der Algorithmus die Daten analysieren und darin verborgene Gruppen oder Muster erkennen.

Der essentielle Unterschied zum überwachten machine learning ist: unüberwachtes machine learning ist nicht dafür konzipiert, dass es für einen bekannten Zustand eine Vorhersage trifft. Seine Ergebnisse können somit auch nicht als richtig oder falsch klassifiziert werden. Vielmehr muss der Trainer des Algorithmus anhand von soften Kriterien ermessen wie passend die Ergebnisse letztlich sind.

Beispiele für das unüberwachte maschinelle Lernen aus der Praxis sind typischerweise Anwendungen der Dimensionsreduktion und des Clusterings. Dimensionsreduktion wird angewendet um E-Mails in Spam oder nicht Spam zu klassifizieren. Clustering findet Einsatz bei der Segmentierung von Kunden in Gruppen mit unterschiedlichen Eigenschaften wie Geschlecht, Kaufkraft, etc.

 

Teilüberwachtes maschinelles Lernen (englisch: semi-supervised machine learning):

Teilüberwachtes maschinelles Lernen ist eine Mischung aus überwachtem und unüberwachtem maschinellen Lernen. Es verwendet Beispieldaten mit Informationen zu korrekten Zuständen und ebenfalls unbekannte Daten. Einsetzen lässt sich für dieselben Zwecke wie überwachtes maschinelles Lernen.

Der Unterschied zum reinen überwachten maschinellen Lernen besteht darin, dass nur eine kleine Anzahl an Daten mit Informationen eines korrekten Zustands verwendet wird. Dem gegenüber steht eine große Datenmenge ohne Information über den Zustand. Der große Vorteil bei dieser Art des maschinellen Lernens: bereits mit einer kleinen Menge bekannter Daten kann das Training beginnen. Auch ohne aufwändige und kostenintensive Interaktion eines Menschen, der Daten klassifizierten müsste.

Beispiele für das teilüberwachte maschinelle Lernen sind die Verfahren zur Erkennung von Bildern oder sonstigen Objekten. Also auch die Erkennung von Gesichtern

Verstärkendes maschinelles Lernen (englisch: reinforced machine leaning):

Verstärkendes maschinelles Lernen ist eine spezielle Art des maschinellen Lernens. Der Algorithmus oder die eingesetzten Algorithmen lernen dabei nach dem Prinzip Lob und Tadel. Oder salopp formuliert nach dem Motto Zuckerbrot und Peitsche.  Dem System wird dabei nicht angezeigt, welche Handlung oder Operation in der jeweiligen Lage die richtige ist. Diese Bewertung erhält es durch eine bejahende oder verneinende Rückkopplung (feedback). Dadurch kann er einschätzen welche Handlung wann die richtige ist. Durch diese Trial-and-Error-Methode (Versuch und Irrtum) erkennt der Algorithmus welche Aktion das meiste Lob bzw. die höchste Belohnung einbringt.

Bei dieser Form des Lernens spielen drei Bestandteile eine Rolle.  Der Agent (der Lernende oder Entscheider), das Umfeld (alles, mit dem der Agent interagiert) und die Handlungen (das, was der Agent macht). Absicht des Agenten ist es, die Handlungen zu tätigen, die die höchstmögliche Belohnung innerhalb einer gegebenen Periode einbringen.  Der Agent erreicht das Ziel deutlich schneller, wenn er eine taugliche Strategie verfolgt. Bestärkendes maschinelles Lernen hat folglich das Ziel, die beste Strategie zu entwickeln. Die Überlegenheit des Computers und wie er lernt ist hier extrem. Der Mensch ist in der Lage pro Woche ein bis zwei passende Modelle zu entwerfen, der Computer mit seinen Algorithmen schafft tausende Modelle in derselben Zeit.

Zentraler Unterschied zu überwachtem und unüberwachten Lernen ist: das verstärkende Lernen braucht vorab keinerlei Beispieldaten. Durch unzählige Iterationen entwickelt der Algorithmus in einem Simulationsumfeld eine eigene Strategie.

Aufgrund des autonomen Handels von Computer und Algorithmus ist verstärkendes Lernen die große Hoffnung der Experten für Künstliche Intelligenz (KI). Vor allem deshalb, weil eine selbstständig lernende KI kein menschliches Vorwissen mehr benötigt, um komplexe Probleme zu lösen.

Einsatzgebiete für die das verstärkende Lernen in der Industrie sind alle Anwendungen, bei denen Computersysteme autark entscheiden sollen. Beispielsweise bei selbstfahrenden Fahrzeugen oder in der Robotik. Auch Chatbots und Übersetzungscomputer arbeiten nach dem Prinzip des Verstärkenden Lernens.

Eine häufig eingesetzte Programiersprache (englisch: programming language) zur Realisierung von Machine Learning Systemen ist Phyton. Für Phyton gibt es zahlreiche Bilbliotheken als open source aus denen sich Entwickler online bedienen können.

Künstliche Intelligenz, Maschine Learning, und Deep Learning – Eine Einordnung

Machine Learning wird teilweise als Künstliche Intelligenz bezeichnet. Es ist allerdings nur ein Teilgebiet davon. Zudem stimmt das Attribut Intelligenz nicht komplett. Denn bei Machine Learning handelt es sich vielmehr darum, Muster und Zusammengehörigkeit zu identifizieren. In der einfachen Form basierend auf vorgegebenen Beispieldaten. Ein Teilgebiet des Machine Learning ist wiederum das Deep Learning.

Tiefergehendes Lernen: Was versteht man unter Deep Learning?

Wie zuvor beschrieben ist Deep Learning ein Untersegment des Machine Learning und letztlich auch eine Form des Data Mining. Dabei kommen Künstliche Neuronale Netze (KNN) bzw. Netzwerke zum Einsatz. Diese Netzwerke sind es auch, die den zentralen Unterschied machen zum regulären Machine Learning. Diese KNN befähigen das Deep Learning dazu unstrukturierte Daten und Informationen wie Texte, Bilder, Töne und Videos in numerische Werte umzuwandeln und zu verarbeiten. Algorithmen des Deep Learning entwickeln dabei selbstständig Modelle und fügen diesen neue Ebenen hinzu. Algorithmen des Klassischen Machine Learnings brauchen hingegen feste vorgegebene Gruppen an Modellen.

Weitere Unterschiede finden sich bei der Datenstruktur. Klassisches Machine Learning benötigt strukturierte Daten. Deep Learning kann hingegen auch unstrukturierte Daten verwenden. Ebenso ist die Datenmenge beim Deep Learning groß bis sehr groß. Beim klassichen Machine Learning eher klein bis mittel. Auch die Hardware muss bei Deep Learning deutlich performanter sein. Denn Neuronale Netzwerke rechnen mit Matrizen wofür viel Rechenleistung erforderlich ist. Entsprechend sieht es auch bei der Laufzeit der Rechenoperationen aus. Was beim klassischen Machine Learning Minuten bis Stunden dauert, umfasst beim Deep Learning Zeiträume von zu Wochen oder sogar Monaten.

Der Motor für komplexes Machine Learning: Das Künstliche Neuronale Netzwerk (KNN):

Künstliche Neuronale Netzwerke (englisch: neural networks), auch als Neuronale Netze bezeichnet, sind Algorithmengruppen, die ähnlich einem menschlichen Gehirn konstruiert sind. Sie dienen dazu wiederholende Muster zu identifizieren. Anschließend ordnen sie diese nach Eigenschaften oder versehen die Muster mit bestimmten Etiketten (labels). Was die KNN als Muster erkennen, transponieren sie dann in mathematische Vektoren. Sämtliche Informationen aus der Wirklichkeit werden dabei berücksichtigt. Seien es Bilder, Klänge, Text oder Zeitdaten.

Ein KNN besteht aus mehreren Ebenen zur Verarbeitung von Daten. Diese Ebenen sind über Knoten miteinander verbunden. Prinzipiell besitzt jedes KNN eine Eingabeebene (input layer), eine oder mehrere versteckte Ebenen (hidden layer), die die internen Informationsmuster abbilden, und eine Ausgabeebene (output layer).

Innerhalb der Ebenen gibt es mehrere Knoten. Jede Ebene nutzt die Ausgabeinformation der vorherigen Ebene als Eingabe. Die Verbindung zwischen den Knoten der einzelnen Ebenen nennt sich Kante. Jede dieser Kanten hat ein Gewicht, das bestimmt, wie der Wert des ursprünglichen Knotens auf den folgenden Knoten umgerechnet wird. Es gibt dabei positive und negative Gewichte. Während des Trainings eines Neuronalen Netzwerks bauen sich diese positiven und negativen Gewichte auf.

Die Künstliche Intelligenz des Neuronalen Netzwerks liegt dann in den Verbindungen der Knoten und deren Gewicht zueinander. Je größer die Anzahl der Ebenen und Knoten, desto komplexer und tiefer ist das KNN. Je komplexer das KNN, um so anspruchsvollere Problemstellungen kann es lösen. Allerdings steigt mit der Komplexität des Neuronalen Netzwerks auch die benötigte Rechenleistung für Training und Einsatz.

Der Machine Learning Prozess – Ein Fahrplan für den Einsatz der KI-Disziplin:

  1. Beschreiben Sie die Problemstellung, das Ziel und was durch Maschine Learning optimiert werden soll. Eine smarte Zielformulierung ist hierbei hilfreich.
  2. Beschaffen oder sammeln oder Sie die relevanten Daten, bereiten Sie diese auf und stellen Sie die später zu begutachtenden Merkmale frei. Dieser Schritt ist typischerweise der mit dem höchsten Aufwand. Denn es ist wichtig, dass die eingesetzten Daten eine hohe Qualität aufweisen, da sie direkten Einfluss auf die Güte der Endergebnisse haben. Entsprechend müssen die Daten bereinigt werden.
  3. Trainieren Sie den Algorithmus des Machine Learning durch die Vorlage der Daten.  Lassen Sie den Computer Muster erkennen und seine Aussagen treffen.
  4. Analysieren, interpretieren und kontrollieren Sie die Ergebnisse des Algorithmus. Damit der Computer seinen genutzten Algorithmus optimieren kann, bedarf es entsprechender Rückmeldung zu den von ihm getroffenen Aussagen. Es muss also validiert werden, ob dessen Einschätzung mit dem erwarteten korrekten Wert übereinstimmt oder nicht.
  5. Wenden Sie das entwickelte Modell auf unbekannte Daten an und analysieren Sie die Ergebnisse
     

Dieser Prozess bedarf mehrerer Iterationen oder Schleifen bis das gewünschte Ergebnis vom Computer mit einer hohen Wahrscheinlichkeit selbst getroffen werden kann.

Machen Sie den ersten Schritt zum Einsatz von Machine Learning in Ihrem Unternehmen und kontaktieren Sie Arnold IT Systems noch heute. Gerne zeigen wir Ihnen welche Potenziale Sie durch den Einsatz der Algorithmen in Entwicklung, Produktion und Service erschließen können.

Jetzt Kontakt aufnehmen und unverbindlich zum Machine Learning beraten lassen!

Wir beraten Sie gerne.

Tel. +49 - (0)761 - 503637-0
info(at)arnold-it.com