Was ist Machine Learning? Definition, Beispiele, Algorithmen und Einsatzgebiete mit visueller Erklärung

0

Machine Learning (ML) ist ein Teilbereich der künstlichen Intelligenz (KI), eine akademische Disziplin, die in den 50er Jahren gegründet wurde. IT-Systeme erkennen ohne explizite Programmierung Muster und Zusammenhänge in Datenmengen und kommen auf der Basis zu Lösungen. Der angewandte Algorithmus verbessert sich dabei stetig. ML ist eine wertvolle Unterstützung in Forschung, Wirtschaft und Entwicklung. Im Folgenden erklären wir die Bedeutung von Machine Learning, geben Beispiele was es kann und wo es eingesetzt wird und geben Ihnen einen Überblick über die wichtigsten Kategorien bzw. Algorithmen.

Machine Learning: Definition

Machine Learning ist eine Form der KI und bedeutet auf Deutsch maschinelles Lernen. Es kann als Oberbegriff für die künstliche Schöpfung von Wissen aus Erfahrung verstanden werden. Entgegen der traditionellen Softwareentwicklung lernt ein System selbstständig aus Mustern in Daten und nicht durch explizite Programmierung. Der Algorithmus passt auf der Basis seinen Programmcode permanent alleine an.

Mittlerweile gibt es eine Vielzahl an Machine Learning Algorithmen. Diese lassen sich in Kategorien einteilen. Man unterscheidet vor allem Supervised Learning, Unsupervised Learning, Reinforcement Learning sowie Ensemble Learning. Deep Learning ist eine spezielle Form des Machine Learnings, dessen Algorithmen auf dem Prinzip neuronaler Netze aufbauen. Dieser Teilbereich gehört zu den neueren Methoden.

Machine Learning auf einen Blick

  • Deutsch: Maschinelles Lernen
  • Form der künstlichen Intelligenz
  • IT-Systeme lernen selbstständig aus Mustern in Datenmengen. > Der Algorithmus passt seinen Programmcode alleine an.
  • Es gibt eine Vielzahl an ML-Algorithmen. Grob unterteilt man in folgende Kategorien: Supervised Learning, Unsupervised Learning, Reinforcement Learning sowie Ensemble Learning
  • Deep Learning ist ein neuer Teilbereich und als spezielle Form des ML zu sehen. Es wird das Prinzip neuronaler Netze
Infografik "Was ist Machine Learning?"

Infografik „Was ist Machine Learning?“

Beispiele für Machine Learning: Was kann ML?

Beim Machine Learning werden große Datenmengen genutzt, um Zusammenhänge und Muster zu erkennen. Der Algorithmus wird so trainiert. Auf der Basis des erlernten Musters bzw. Modells lassen sich aus einem neuen, unbekannten Datensatz Erkenntnisse gewinnen. Es kann z.B. eine Vorhersage getroffen werden und Prozesse optimiert werden.

ML kann hier helfen:

  • Beispiel „Next Best Offer“:
    Optimierung des Angebots durch die Berechnung von Produktaffinitäten
  • Beispiel Umsatzforecast:
    Die Vorhersage von Werten treffen
  • Beispiel Produktempfehlungen:
    Erkenntnis über Zusammenhänge in Sequenzen
  • Beispiel Kundensegmentierung:
    Erkenntnis über Cluster bzw. Gruppen in Datensätzen
  • Beispiel Kaufwahrscheinlichkeit:
    Berechnung von Wahrscheinlichkeiten für Ereignisse

Beispiele für konkrete Einsatzgebiete zeigen wir Ihnen im Text weiter unten auf.

Wie funktioniert Machine Learning?

Damit Machine Learning funktioniert, muss zunächst ein Mensch den Algorithmus trainieren. Dieser Prozess beginnt mit einem Trainingsdatensatz. Der ML Algorithmus sucht und findet Zusammenhänge in den vorbereiteten Daten und lernt. Man nennt dieses Vorgehen auch Modelltraining.

Ist der Lernprozess erfolgreich abgeschlossen, wird das trainierte Modell dazu genutzt, unbekannte Daten auszuwerten. Anhand der Prognosen können bessere Entscheidungen getroffen werden.

Hauptziel: automatisches Lernen ohne menschliche Eingriffe mit entsprechender Anpassung der Aktionen.

Die Entwicklung eines Modells gestaltet sich interaktiv und wird in mehreren Stufen durchlaufen bis die Qualität des Ergebnisses stimmt. Demnach finden in der Praxis immer wieder Entwicklungsschleifen statt, in denen ein Mensch die Ergebnisse aus dem Algorithmus bewertet.

Infografik "Wie funktioniert Machine Learning?": Damit ML funktioniert, muss der entsprechende Algorithmus zunächst durch den Mensch trainiert werden.

Infografik „Wie funktioniert Machine Learning?“: Damit ML funktioniert, muss der entsprechende Algorithmus zunächst durch den Mensch trainiert werden.

Kategorien von Machine Learning

Algorithmen sind der Kern des maschinellen Lernens. Sie sind für das Erkennen von Mustern verantwortlich und generieren die Lösung. Im Laufe der Zeit haben sich diverse Algorithmen bei der praktischen Umsetzung im Machine Learning bewährt. Diese lassen sich grob in folgende Kategorien unterteilen:

  • Klassisches Lernen
    • Supervised Learning (überwachtes Lernen):
      Das Lernen der Algorithmen erfolgt anhand von Beispielen.
    • Unsupervised Learning (unüberwachtes Lernen):
      Datenmuster werden von den Algorithmen ohne Anleitung gesucht.
    • Semi-Supervised Learning (teilüberwachtes Lernen):
      Mischung aus überwachtem und unüberwachtem Lernen
  • Reinforcement Learning (be-/verstärkendes Lernen):
    Die Algorithmen lernen durch ein Belohnungssystem, sich zu verbessern, wobei die Maximierung angestrebt wird.
  • EnsembleLearning:
    Die Algorithmen erstellen mehrere schwächere Modelle und kombinieren sie zu einem starken Modell.
  • Deep Learning:
    Besondere Form des Machine Learning, deren Algorithmen Prinzipien neuronaler Netzwerke für die Datenverarbeitung nutzen.
Infografik Kategorien von Machine Learning: Die Algorithmen lassen sich grob in vier Kategorien einteilen.

Infografik Kategorien von Machine Learning: Die Algorithmen lassen sich grob in vier Kategorien einteilen.

Wichtig: Data Mining und Predictive Analytics werden häufig mit Maschine Learning in Verbindung gebracht. Letztendlich werden in beiden Bereichen Verfahren des maschinellen Lernens genutzt.

  • Supervised Learning (überwachtes Lernen)

    Supervised Learning ist überwachtes Lernen. Es werden bekannte Daten genutzt, um daraus Muster zu identifizieren. Die Algorithmen lernen die Muster über den Trainingsdatensatz. Es wird beim überwachten Lernen stets der Zusammenhang zu einer Zielvariable erlernt und versucht diese richtig vorherzusagen.

    Infografik Supervised Learning (überwachtes Lernen): Beim Supervised Learning lernen die Algorithmen die Muster über einen Trainingsdatensatz (Beispieldaten).

    Infografik Supervised Learning (überwachtes Lernen): Beim Supervised Learning lernen die Algorithmen die Muster über einen Trainingsdatensatz (Beispieldaten).

  • Unsupervised Learning (unüberwachtes Lernen)

    Unsupervised Learning ist unüberwachtes Lernen. Die Algorithmen bekommen keine Beispieldaten. Aus einem Datensatz sollen sie selbstständig versteckte, interessante Gruppen und Muster erkennen. Unsupervised Machine Learning ist also nicht dafür ausgelegt eine Annahme für eine bekannte Zielvariable zu treffen bzw. zu berechnen. Der Data Scientist muss die Ergebnisse an relativ „weichen“ Faktoren bewerten und einschätzen wie gut sie zur Anwendung passen.

    Infografik Unsupervised Learning (unüberwachtes Lernen): Beim Unsupervised Learning bekommen die Algorithmen keine Beispieldaten, sondern sollen selbstständig Muster in Daten erkennen.

    Infografik Unsupervised Learning (unüberwachtes Lernen): Beim Unsupervised Learning bekommen die Algorithmen keine Beispieldaten, sondern sollen selbstständig Muster in Daten erkennen.

  • Reinforcement Learning (verstärktes Lernen)

    Reinforcement Learning ist verstärktes Lernen. Die Algorithmen interagieren mit der Umgebung und werden über ein Belohnungssystem oder eine Kostenfunktion bewertet. Die Strategie zur Lösung des Problems soll eigenständig erlernt werden. Dies erfolgt iterativ.

    Diese Art des Lernens benötigt keine Beispieldaten, und es wird den Algorithmen nicht gezeigt welche Aktion die richtige ist. Durch eine negative oder positive Rückmeldung lernt das System wann was passend ist. D.h. die Algorithmen lernen durch die Verstärkung die Belohnungsfunktion zu maximieren und damit zum Ziel zu kommen.

    Infografik Reinforcement Learning (verstärktes Lernen): Beim Reinforcement Learning verbessern sich die Algorithmen in dem Bestreben, eine Belohnung zu maximieren. Dies erfolgt in Lernzyklen.

    Infografik Reinforcement Learning (verstärktes Lernen): Beim Reinforcement Learning verbessern sich die Algorithmen in dem Bestreben, eine Belohnung zu maximieren. Dies erfolgt in Lernzyklen.

    Im Reinforcement Learning liegt die große Hoffnung vieler KI-Forscher. Wenn die KI eigenständig lernt, können komplexe Probleme ohne menschliches Vorwissen gelöst werden.

  • Ensemble Learning

    Ensemble Learning ist die Kombination verschiedene Einzelmodelle zu einer starken Einheit. Es wird eine endliche Menge verschiedener Lernalgorithmen verwendet. So werden bessere Ergebnisse erzielt als mit nur einem Algorithmus. Diese Art des Lernens wird auch in der Statistik eingesetzt.

  • Deep Learning

    Deep Learning ist eine vergleichsweise neue Kategorie des Machine Learning, die künstliche, neuronale Netze nutzt. Sie unterscheidet sich in einigen Punkten vom „herkömmlichen“ Machine Learning.

Machine Learning vs. Deep Learning: der Unterschied

Das Deep Learning macht sich die Prinzipen mehrschichtiger Neuronen zu Nutze. Es ist als Teilmenge des Machine Learning zu verstehen, jedoch unterscheiden sich die Fähigkeiten. Deep Learning nutzt künstliche neuronale Netzwerke (KNN), um unstrukturierte Daten zu verarbeiten. So können „wirre“ Informationen wie Bilder, Texte oder auch Videos in numerische Werte umgewandelt werden. Die extrahierte Information dient im weiteren als Basis für z.B. Vorhersagen oder die Erkennung von Mustern. Sie kann auch zum weiteren Lernen verwendet werden.

Infografik "Machine Learning vs. Deep Learning": Der Unterschied liegt in der Feature Extraktion, die beim ML von einer Arbeitskraft ausgeführt werden muss.

Infografik „Machine Learning vs. Deep Learning“: Der Unterschied liegt in der Feature Extraktion, die beim ML von einer Arbeitskraft ausgeführt werden muss.

„Klassisches“ Machine Learning ist nicht in der Lage, solche unstrukturierten Daten sinnvoll zu verarbeiten. Bilder können z.B. nicht einfach als Eingabedaten genutzt werden, um den Algorithmus auf die Erkennung von Objekten zu trainieren. Es müsste zunächst eine aufwendige Feature Extraktion durch einen Menschen erfolgen.

Vergleich: „Deep Learning“ vs. „Machine Learning“
Hauptsächliche Unterschiede zwischen Deep Learning und Machine Learning. Hier sehen Sie den Vergleich auf einen Blick.
KPI Deep Learning Machine Learning
Datenstruktur Strukturierte und unstrukturierte Daten Strukturierte Daten
Datensatzgröße Groß Klein bis mittel
Hardware Leistungsstarke Computer mit GPUs sind nötig, da neuronale Netze Matrizen multiplizieren, die viel Rechenzeit beanspruchen. Funktioniert mit einfacher Hardware.
Feature Extraktion Sie müssen die Merkmale nicht verstehen. In der Regel müssen Sie die Merkmale verstehen.
Laufzeit Kann Wochen bis Monate dauern. Ein paar Minuten bis Stunden
Interpretierbarkeit Schwer zu interpretieren und häufig unmöglich. Hängt vom Algorithmus ab. Einige Algorithmen, wie z.B. logistische Regression, sind leicht zu interpretieren, andere hingegen, wie z.B. SVM, nahezu unmöglich.

Algorithmen im Machine Learning

Wie bereits erläutert, erfolgt die praktische Umsetzung des Machine Learnings mittels Algorithmen. Die Wahl des Algorithmus richtet sich nach Ziel bzw. Problem und Ausgangsmaterial. Im Folgenden geben wir Ihnen eine Übersicht über einige der genutzten Algorithmen im Machine Learning:

Algorithmen und Lernkategorien von Machine Learning
Kategorie Algorithmus-Form Algorithmus-Name
Supervised Learning Regression Linear Regression
Classification Logistic Regression, Decision Trees, Support Vector Machine (SVM)
Unsupervised Learning Clustering K-Means, DB-Scan
Dimension Reduction t-SNE, PCA
Reinforcement Learning X Genetic Algorithm, Q-Learning
Ensemble Learning Bagging Random Forest
Boosting XGBoost, LightGBM, CatBoost
Deep Learning/Neuronale Netzwerke Recurrent Neural Networks (RNN) LSM
Convolutional Neural Networks (CNN) DCNN

Einsatzgebiete für Machine Learning – Beispiele

Die Welt wird immer komplexer und ist mit menschlichem Verstand immer schwerer zu durchdringen. Zudem ist Zeit ein knappes Gut. Um Wissen aus großen Datenmengen zu generieren und zu Ergebnissen zu kommen, auf deren Basis Entscheidungen getroffen werden können, wird KI daher immer unerlässlicher. Die Technik schreitet voran und Machine Learning ist somit in den letzten zwei Jahrzehnten ein wesentlicher Bestandteil von Wirtschaft, Technologie und Forschung geworden. Im Folgenden geben wir Ihnen einen Überblick über Einsatzgebiete des Machine Learning:

Infografik Einsatzgebiete für Machine Learning: Machine Learning wird mittlerweile für viele Belange eingesetzt. So wird z.B. überwachtes Lernen für die Wetterprognose herangezogen.

Infografik Einsatzgebiete für Machine Learning: Machine Learning wird mittlerweile für viele Belange eingesetzt. So wird z.B. überwachtes Lernen für die Wetterprognose herangezogen.

  • Predictive Policing

    Predictive Policing ist zu Deutsch „Vorhersagende Polizeiarbeit“. Gemeint ist die Analyse von Falldaten zur Berechnung einer Wahrscheinlichkeit von künftigen Straftaten. Der Einsatz der Polizeikräfte kann so effizienter gesteuert und Patrouillen entsprechend geplant werden. Auf diese Weise können z.B. Einbrüche verhindert werden.

    Infografik Ablauf von Predictive Policing. Der Erfolg von Predictive Policing kann sich sehen lassen: Rückgang der Einbrüche von 16,3 % auf 97.504 Fälle im Jahr 2019 (116.540 Fälle in 2018).

    Infografik Ablauf von Predictive Policing. Der Erfolg von Predictive Policing kann sich sehen lassen: Rückgang der Einbrüche von 16,3 % auf 97.504 Fälle im Jahr 2019 (116.540 Fälle in 2018).

  • Robot Firefighting

    Robot Firefighting ist der Einsatz autonomer Löschfahrzeuge wie z.B. Drohnen bei der Feuerwehr. Diese können mit Hilfe von Machine Learning Menschen und Objekte auch bei dichtem Rauch erkennen. In Gebieten oder Räumen, die für Menschen lebensgefährlich sind, stellen diese Fahrzeuge ein wertvolles Tool für die Einsatzkräfte dar.

  • Mobilität

    Im Verkehr und der Mobilität wird Machine Learning immer häufiger eingesetzt. Im Bereich des autonomen Fahrens ermöglichen z.B. neuronale Netze eine sichere Navigation im Straßenverkehr und reagieren in Echtzeit auf kritische Situationen. ML-Modelle können auch angewendet werden, um z.B. die Ampelschaltung an großen Kreuzungen zu verbessern und Staus zu verhindern.

  • Security

    Kritische IT-Systeme werden üblicherweise mithilfe von Security Information and Event Management (SIEM) abgesichert. Der große Aufwand inklusive Personaleinsatz ist hier problematisch. Es wird schwierig, auf die immer ausgefeilteren Methoden der Hacker zu reagieren. Machine Learning Modelle können viel größere Datenmengen in einer höheren Geschwindigkeit verarbeiten und bieten eine wertvolle Unterstützung bei der Überwachung von IT-Systemen.

    Infografik Delikte in Unternehmen: die Wirtschaft ist von einer Vielzahl von kriminellen Attacken betroffen. In vielen Fällen kann Machine Learning zur Erkennung von Angriffen genutzt werden.

    Infografik Delikte in Unternehmen: die Wirtschaft ist von einer Vielzahl von kriminellen Attacken betroffen. In vielen Fällen kann Machine Learning zur Erkennung von Angriffen genutzt werden.

  • Digitale Assistenten

    Zu den prominentesten Anwendungen von Machine Learning im Alltag gehören Digitale Assistenten. Beispiele für beliebte Anwendungen:

    • Bedienung eines Geräts mithilfe von Sprachsteuerung
    • Generierung von Suchergebnissen durch Google
    • Abspielen von Musik
    • Abrufen der Wettervorhersage

    Auch in anderen Bereichen halten die Digitalen Assistenten vermehrt Einzug. Zum Beispiel werden moderne Kamerasysteme durch Module künstlicher Intelligenz unterstützt.

  • Personalisierung im Marketing

    Die Personalisierung ist ein wichtiges Einsatzfeld von Machine Learning im Marketing. Muster in Verhalten sowie Vorlieben der Kunden können erkannt bzw. erlernt und mit anderen Kunden verglichen werden. Ergebnis: Individuelle Handlungs- oder Produktempfehlungen für jeden Kunden zum passenden Zeitpunkt.

  • Predictive Maintenance

    Bei der vorausschauenden Wartung von Industrieanlagen (Predictive Maintenance) spielt Machine Learning ebenfalls eine Rolle. Es geht Hand in Hand mit dem Condition Monitoring (Zustandsüberwachung). Dies ist ein Konzept, mit dem Ziel das Ausfallrisiko einer Maschine auf ein Minimum zu drücken. Es basiert auf einer kontinuierlichen Erfassung des Maschinenzustandes durch Messung und Analyse physikalischer Größen. Im Ergebnis kann die Wartung besser koordiniert werden. Bisher gibt es hier noch keine Standardsoftware. Daher ist das Interesse an Optimierung und Herstellung intelligenter Systeme groß. In intelligenten IoT-Lösungen liegt hier die Zukunft.

    Eine kabellose Lösung für Wireless Condition Monitoring kommt aus Finnland. Das Unternehmen Treon entwickelt kabellose Geräte für das Monitoring und Wirepas stellt mit seinem skalierbaren Mesh Netzwerk die passende Connectivity Software zur Übermittlung der Daten vom Sensor auf der Maschine zum Gateway bereit.

  • Supply Chain Monitoring

    Lieferketten können ebenfalls von den Möglichkeiten des Machine Learning profitieren. Verdorbene, verlorene oder zu spät gelieferte Ware kann die geschäftliche Grundlage bis hin zum Ruin untergraben. Unabhängig von dem unternehmerischen Einzelschicksal ist die zuverlässige Versorgung mit essentiellen Produkten wie Arznei oder Nahrungsmitteln auch gesellschaftlich bedeutend.

    Die IoT-Vernetzung ist daher im Bereich der Logistik von größtem Interesse. Zusätzlich zu der Information über Ort und Zeit kann mit Hilfe von Sensoren auch eine Aussage über den Zustand des Lieferobjekts sowie den Zustand der Ware übermittelt bzw. abgefragt werden. MECOMO, ein führender Anbieter für Ortungslösungen, bietet hier in Zusammenarbeit mit dem finnischen Unternehmen Wirepas eine Lösung. Die neueste Generation von Solartelematik-Einheiten zur Ortung von z.B. Wechselaufbaubrücken wurden um eine integrierte IoT Gateway-Funktion erweitert. In Verknüpfung mit der Wirepas Massive-Technologie ergibt sich neuer Freiraum und es können mehr Use Cases bedient werden. Die eingesetzten Sensoren benötigen lediglich Wirepas-Konnektivität und sind an keinen Hersteller gebunden.

Machine Learning Produkte

Ein Nicht-Techniker wird auf die Frage nach der Bedeutung von Machine Learning in der Regel keine befriedigende Antwort zur Hand haben. Dabei gibt es prominente ML Anwendungen, die im Alltag fast jeder Haushalt regelmäßig nutzt. Dazu gehören vor allem digitale Assistenten wie Alexa, Siri oder Google. Nach einer Umfrage von Splendid Research (2019) haben unter 1.000 Befragten 60 % schon einmal ein Gerät unter Nutzung von Sprachsteuerung bedient. Zwei Jahre vorher waren es noch 23 % weniger, also 37 % der rund 1.000 Befragten. Wir geben Ihnen eine kleine Übersicht über Machine Learning Produkte aus Ihrem Alltag:

AutoML: Die Zukunft von Machine Learning?

AutoML ist die Automatisierung der einzelnen Prozessschritte im Machine Learning. Bereits die aufwendige Datenvorbereitung (laut Forbes bis zu 80 % der Zeit eines ML-Projekts) wird von einigen der AutoML Frameworks abgenommen. Mussten sich bisher Data Science Teams um Architektur und Modellauswahl bemühen, wird der Prozess nun automatisiert und die menschliche Arbeitszeit insgesamt reduziert.

Gerade große Unternehmen stecken viel Geld in die Automatisierung von Machine Learning Prozessen. Auch Google hat bereits eine AutoML Plattform herausgebracht. Es ist davon auszugehen, dass künftig noch deutlich mehr Prozesse automatisiert sein werden und der Mensch immer stärker daraus verschwindet.

Verschwindet der Mensch ganz aus dem Machine Learning? Sicher nicht ganz. Das Datensatzdesign zur Lösung der Problemstellung sowie die fachliche Expertise eines Menschen können nach aktuellem Stand weiterhin als wichtige Aufgaben gesehen werden.

FAQs

Was ist Machine Learning?

Machine Learning ist ein Teilbereich der Künstlichen Intelligenz. Es bedient sich Algorithmen und statistischer Methoden und kann als Oberbegriff für die künstliche Schöpfung von Wissen aus Erfahrung verstanden werden. Ein IT-System lernt selbstständig aus Mustern in Daten und nicht durch explizite Programmierung. Algorithmen kreieren dazu beim Maschinellen Lernen ein statistisches Modell.

Welche Kategorien von Machine Learning gibt es?

Es gibt grob unterteilt folgende Kategorien von Machine Learning, denen sich die genutzten Algorithmen zuordnen lassen:

  • Supervised Learning (überwachtes Lernen)
    Das Lernen der Algorithmen erfolgt anhand von Beispielen.
  • Unsupervised Learning (unüberwachtes Lernen)
    Datenmuster werden von den Algorithmen ohne Anleitung gesucht.
  • ReinforcementLearning (be-/verstärkendes Lernen)
    Die Algorithmen lernen durch ein Belohnungssystem, sich zu verbessern, wobei die Maximierung angestrebt wird.
  • EnsembleLearningDie Algorithmen erstellen mehrere schwächere Modelle und kombinieren sie zu einem starken Modell.
  • Deep LearningBesondere Form des Machine Learning, deren Algorithmen Prinzipien neuronaler Netzwerke für die Datenverarbeitung nutzen.

Was ist der größte Unterschied von Deep Learning und Machine Learning

Der größte Unterschied von Deep Learning und Machine Learning ist vor allem darin zu finden, dass beim DL auch unstrukturierte Daten wie z.B. ein Bild sinnvoll verarbeitet werden können. Klassisches ML kann das nicht. Hier müsste zunächst eine Feature Extraktion durch einen Fachmann erfolgen.

Was ist AutoML?

AutoML ist die Automatisierung der einzelnen Prozessschritte im Machine Learning. Die menschliche Arbeitszeit wird reduziert und Data Science Teams müssen sich nicht mehr um Architektur und Modellauswahl bemühen.

Was sind Machine Learning Produkte?

Machine Learning Produkte sind z.B. unter digitalen Assistenten zu finden. Dazu gehören Alexa, Siri, Google oder auch Shazam.

Lassen Sie eine Antwort hier