Was ist Maschinenlernen (machine learning): Definition, Bedeutung
Maschinenlernen bzw. maschinelles Lernen ist ein allgemein verwendeter Begriff, um zu beschreiben – wie Wissen aus Erfahrung künstlich hergestellt werden kann.
Inhalt
Was ist maschinelles Lernen?
Das Lernen aus Erfahrung stellt einen wesentlichen Aspekt in der Robotik und künstlichen Intelligenz (KI) dar. Das Maschinenlernen ist hierbei ein bedeutsamer Teilbereich. Das Entscheidende der Forschung setzt das Lernen anhand von vorliegenden Daten voraus. Der Fortschritt sollte deswegen nicht vorab programmiert worden sein. Das nicht natürlich System – z. B. ein Algorithmus – ist auf diese Art lernfähig. Was ist ein Algorithmus?
Algorithmen tauchen in der modernen Computerwelt unweigerlich auf. Sie sind ein fester Bestandteil solcher Computersysteme. Dabei tragen sie als Berechnungsverfahren wesentlich zur Lösung einer Problemstellung bei. Sie nutzen zu diesem Zweck eine gewisse Menge an einzelnen Schritten. Für die Robotik und den Forschungsbereich der künstlichen Intelligenz sind derartige Rechenverfahren wichtige Bausteine zum maschinellen Lernen.
Welche Bedeutung hat das Maschinenlernen, wo wird es benötigt
Die Anwendungsbereiche für das maschinelle Lernen sind vielfältig. Eine hohe Zahl an alltäglichen Programme basiert auf diesen künstlich erzeugten Kenntnisstand. Kreditkartenbetrug lässt sich z. B. durch das »machine Learning« erkennen. Zugleich ist es möglich, autonome Computersysteme (Bsp.: selbstfahrende Fahrzeuge) auf die individuellen Anforderungen im Verkehr abzustimmen.
Anreize beim Onlineshopping oder bei Streamingdiensten legen ebenfalls das Maschinenlernen zugrunde. Es nutzt das Verhalten der Nutzer bzw. Besucher und leitet daraus passende Empfehlungen und Produkte ab. Für die Zukunft ist ein solches selbstständiges Lernen innerhalb von Computersystemen durchaus wünschenswert. Denn es ermöglicht, die weitreichende Nutzung von Robotertechnologie in dem privaten Alltag, der Industrie und Wirtschaft.
Die Aufgaben, die das Maschinenlernen erfüllen kann, umfassen die folgenden Beispiele:
- Geschäftsvorgänge können verbessert werden
- Zusammenhänge von Sequenzen (z. B. in der Medizin und Biologie) lassen sich einfacher erkennen
- Wahrscheinlichkeiten können zuverlässig ermittelt werden (z. B. im Kauf- oder Nutzungsverhalten)
- bestimmte Werte können vorhergesagt werden (z. B. beim Verbrauch von Strom oder um künftige Unternehmensumsätze vorherzusagen)
Wer verwendet Maschinenlernen?
Die Verwendung enormer Datenmengen ist längst zu einem festen Bestandteil der modernen Welt geworden. Manche Branchen der Wirtschaft profitieren stärker vom maschinellen Lernen. Wer greift vor allem darauf zurück?
Für den kommerziellen Handel ist diese Form der Vorhersage auf etlichen Ebenen relevant. Dazu zählen in erster Linie der Vertrieb und das Marketing. Denn viele Shops, insbesondere im Internet, greifen auf die Art des Lernens zurück. Das ermöglicht personalisierte Werbeanzeigen und Produktempfehlungen. Auch die Marketingkampagnen von Unternehmen können vom Maschinenlernen profitieren.
Daneben gelten Finanzdienstleister und Banken als Nutzer dieser fortschrittlichen Technologie. Hierbei kommt sie vorrangig zum Gebrauch, um Betrug zu verhindern. Es sind Vorhersagen machbar, um Börsengeschäfte optimal zu planen. Im Vergleich dazu kann die Gesundheitsbranche solche Mechanismen verwenden, um bspw. Gesundheitsdaten von Patienten in Echtzeit erfassen zu können. Dabei ermöglicht Maschinenlernen zudem eine Verbesserung in diagnostischen Behandlungsmethoden.
Weitere Nutzer des maschinellen Lernens in der Wirtschaft können folgende Betriebsbranchen sein:
- Gasindustrie, Ölindustrie (Bsp.: in Raffinerien ausfallende Sensoren vorhersagen)
- Transport und Logistik (Bsp.: Routenplanung)
- Regierungsebene (Bsp.: Identitätsdiebstahl und Betrug)
- Energieversorger (Bsp.: Sensordaten analysieren, um Sparpotenziale festzustellen)
Methoden des maschinellen Lernens
Der selbstständige Wissenserwerb anhand von vorliegenden Daten ist ein Kernelement des Maschinenlernens. Es stellt ein übergeordnetes Gebiet der Forschung dar, bei der Wissen und Gesetzmäßigkeiten mithilfe von Erfahrungswerten bzw. Trainingsdaten aufgebaut wird. Um »Machine Learning« nutzbar zu machen, ist vorrangig ein vorliegendes Muster notwendig. Menschen sind daher beim Maschinenlernen unerlässlich. Denn sie sind es, die die benötigten Messwerte (Trainingsdaten) eingeben.
Diese Daten beinhalten insbesondere jene Informationen, die das jeweilige System zum Maschinenlernen braucht. Beispiele können ebenfalls in den Fakten enthalten sein. Das erlaubt dem Algorithmus schließlich, Zusammenhänge festzustellen und Muster aus den vorliegenden Angaben abzuleiten. Sobald diese Trainingsphase abgeschlossen ist, kommt maschinelles Lernen zum Einsatz, um fremde, d. h. unbekannte, Informationen zu bewerten. Im optimalen Fall ist das System in der Lage, Vorhersagen zu treffen, selbstständig Wissen anzueignen und zuletzt Entscheidungen zu verbessern.
Eine gewisse Anpassungsfähigkeit und Interaktivität sind beim Maschinenlernen notwendig, um erfolgreich zu korrekten Ergebnissen zu führen. Eine menschliche Person ist in diesen Lernphasen unabdingbar. Denn der Mensch ist es, der die Resultate letzten Endes bewertet und den Algorithmus der Maschine ggf. anpasst. Im Umgang mit »machine Learning« existieren vier mögliche Arten, wie ein Computersystem lernen kann:
- verstärkendes Lernen
- unüberwachtes Lernen
- überwachtes Lernen
- teilüberwachtes Lernen
1. Reinforcement Learning – lernen durch Feedback
Das verstärkende bzw. bestärkende Lernen funktioniert auf Grundlage von Belohnungen. So wie eine Katze nur Fisch erhält, wenn sie sich bewegt, kann ein Computersystem anhand von Rückmeldungen Aktionen erlernen. Das erfordert generell ein Wechselspiel mit der Umgebung.
Normalerweise verwenden die Algorithmen ein Belohnungssystem oder eine sog. Kostenfunktion. Diese verhilft ihm zur strategischen Weiterentwicklung, um ein Problem mit möglichst gutem Ausgang (sog. Belohnungsfunktion) zu lösen. Trainingsdaten sind beim verstärkenden Lernen nicht erforderlich. Denn das System nutzt das direkte Feedback, d. h. die Rückmeldung, um das Verhalten zu optimieren. Solche Reaktionen können sowohl negativ als auch positiv ausfallen.
2. Unsupervised Machine Learning – eigenständig Zusammenhänge erkennen
Unüberwachtes Lernen verzichtet ebenfalls auf vorab eingegebene Trainingsdaten, um die Ergebnisse anzupassen. Der Algorithmus erhält Daten, um Muster darin auszumachen. Es existiert daher keine feste Zielvariable (d. h. kein vorgegebener Platzhalter für ein Ziel). Deswegen vermeidet Vorhersagen bei dieser Variante des Maschinenlernens.
Stattdessen erkennt sie Zusammenhänge und zieht daraus Schlüsse – bspw. beim Einkaufsverhalten von Verbrauchern. In diesem Beispiel werden Regeln erlernt, die auf die eingehenden Daten basieren. Dazu gehören bspw. Produktempfehlungen für Kunden. Die zugrunde liegende Logik dahinter besagt, wer die Ware X erwirbt, wählt ebenfalls die Ware Y.
3. Supervised Machine Learning – lernen mit Zielsetzung
Die Beispieldaten beim überwachten Lernen ermöglichen dem Algorithmus, entsprechende Muster auszumachen. Hierbei ist die Zielvorgabe immer entscheidend. Denn das Maschinenlernen erfolgt ausschließlich zusammen mit solch einer Orientierung.
Der Algorithmus ist in diesem Fall darauf trainiert, die entsprechende Zielvariable korrekt zu prognostizieren (d. h. vorherzusagen). Für das überwachte Lernen ist es ebenfalls wesentlich, dass es sich bei dem anvisierten Ergebnis entweder um einen Zahlenwert oder um eine Klasse handelt. Was bedeutet das?
Ein numerischer Wert kann z. B. spezifische Umsatzzahlen bei einer Firma umfassen. Im Gegensatz dazu bezeichnet eine Klasse bspw. einfache Antworten mit »Ja« oder »Nein« zu einem Thema. Auf diese Weise kann das maschinelle Lernen in überwachter Form genutzt werden, um Prognosen für die Zukunft zu erstellen.
Das verwenden insbesondere Unternehmen für ihr Marketing oder um eine Risikobewertung vorzunehmen, ehe eine Investition getätigt wird. Zusätzlich kommt die Berechnung für Ausfallwahrscheinlichkeiten (z. B. in der Produktion) als Anwendungsmöglichkeit infrage.
4. Semi-supervised Machine Learning – gemischtes Lernen
Während das überwachte Lernen sowohl mit Trainingsdaten als auch einer Zielvariable arbeitet, nutzt das teilüberwachte Lernen diese Optionen ebenso wie gänzlich unbekannte Datensätze. Hierbei vermischt das Maschinenlernen die Möglichkeiten des unüberwachten Lernens mit dem des überwachten Lernens.
Der Hauptanwendungszweck vom teilüberwachten Lernen liegt in der Erkennung von Bildern und Objekten begründet. In dem breit gefächerten Gebiet geht es vor allem darum, innerhalb einer kleinen, bekannten Datenmenge ein sog. künstliches neuronales Netzwerk auszubilden. Das hilft, die sich anschließenden Daten einzuordnen. Am Beispiel der Bilderkennung lässt sich das Prinzip nachvollziehen.
Ein Mensch benennt eine gewisse und relativ kleine Zahl von Bildern und gibt die Fakten in das System ein. Der Algorithmus lernt dadurch, welche Zusammenhänge zwischen den Bezeichnungen und dem dargestellten Objekt vorherrschen. Auf diese Art ist es möglich, zukünftig eingegebene Bilddateien vom Computersystem bestimmen zu lassen. Bspw. ist ein derart trainierter Algorithmus in der Lage, Gesichter auf Kameraaufzeichnungen (z. B. im Rahmen der Videoüberwachung) zu erkennen. Doch was bedeuten »künstliche neuronale Netzwerke« in diesem Kontext?
Künstliche neuronale Netzwerke – der Unterschied vom Maschinenlernen zum Deep Learning
Deep Learning, d. h. das tiefe Lernen, bezeichnet einen Teilbereich des maschinellen Lernens. Worin unterscheidet es sich vom übergeordneten maschinellen Lernen?
Beim Deep Learning kommen sog. KNN zum Einsatz. Dabei handelt es sich um künstliche neuronale Netzwerke. Die Nervenzellen, die in der Natur der Säugetiere vorkommen, gelten als Vorbilder für die künstlichen Neuronen. Solche Zellen sind dafür zuständig, Signale weiterzuleiten. Sie sorgen für korrekte Zuordnungen der einzelnen Verbindungen zu entsprechenden Knotenpunkten. Aufgrund dieser Netze ist es möglich, auch jene Art von Daten zu bewältigen, die ohne jede Struktur und zusammenhanglos erscheinen.
Während beim Maschinenlernen ein Mensch nötig ist, um die Ausgangsdaten korrekt zu klassifizieren, kann ein System mit Deep Learning und einem künstlichen neuronalen Netzwerk auch unsortierte Informationen zum Lernen nutzen. Hierfür werden bspw. Töne oder Videos in numerische Werte verwandelt. Diese können anschließend vom Algorithmus im Sinne des Maschinenlernens verwendet werden, um zusammenhänge und Muster zu identifizieren.
Im Gegensatz zum herkömmlichen »machine Learning« erfordert Deep Learning eine große Datenmenge (sog. Big Data) und dadurch ebenfalls leistungsstarke Computersysteme. Gleichzeitig ist es beim tiefen Lernen nicht unbedingt nötig, dass das System bzw. der zugrunde liegende Algorithmus die einzelnen Merkmale der Daten versteht.
Ausblick – maschinelles Lernen für die Zukunft
Maschinenlernen ist von der Natur, d. h. von der tierischen und menschlichen Intelligenz inspiriert. Für die Zukunft spielt es eine wichtige Rolle. Denn die Robotik und insbesondere die Entwicklung von künstlicher Intelligenz schreiten immer weiter voran, mit dem Ziel, den Alltag der Menschheit zu erleichtern.
Dabei existieren auch bei derartigen Algorithmen Nachteile. Demnach können unvollständige und fehlerbesetzte Datensätze zu problematischen und unkorrekten Ergebnissen führen. Für die Behebung solch produzierter Fehler kommt die Roboterethik zum Einsatz. Diese Disziplin schaut gezielt auf Risiken und Zukunftschancen im Forschungsbereich des maschinellen Lernens.
Mensch vs. Maschine – automatisiertes Maschinenlernen (Auto-ML)
Die Automatisierung des maschinellen Lernens schreitet ebenso voran wie die generelle Entwicklung der künstlichen Intelligenz. Dabei übernehmen beim Auto-ML die Algorithmen einen Großteil des Vorgangs. Heutzutage sind vor allem sog. Data Science Teams dafür verantwortlich, Modelle und Architekturen für die Verfahren zu bestimmen. Dieser Aufwand fällt in der Zukunft u. U. weg. Der Mensch übernimmt bloß die Betrachtung der Ergebnisse. Denn das Auto-ML ist schon heute – zumindest teilweise – fähig, die Verarbeitung der Daten im Vorfeld übernehmen.
Deswegen besteht eine hohe Wahrscheinlichkeit, dass der Mensch als notwendige Lehrkraft zukünftig deutlich weniger gebraucht wird. Statt einen großen Teil der Arbeit zum Maschinenlernen zu übernehmen, werden Menschen vorrangig für das Datensatzdesign und Fachwissen gefordert sein. Die übrige Ausführung kann ein Algorithmus vornehmen. Die Automatisierung ist somit in der Zukunft ein relevanter Bestandteil der Alltagswelt. Das zeigen bereits die derzeitigen Internetriesen (bspw. Google), die enorme Summen in solche Auto-ML-Vorgänge investieren.
Zusammenfassung
Maschinelles Lernen stellt ein enormes Potenzial in der Entwicklung künstlicher Intelligenz dar. Es erlaubt den Erwerb von Wissen basierend auf Erfahrungswerten, wobei ein bestehendes System stetig weiterentwickelt und verbessert wird. Damit ähnelt es stark der menschlichen und tierischen Intelligenz.
Maschinenlernen ist schon lange ein bedeutender Teil der Wirtschaft und Forschung. Es nutzt vor allem vier verschiedene Arten des Lernens: überwachtes, unüberwachtes, teilüberwachtes und bestärkendes Lernen. Für die Zukunft werden die Prozesse weiter automatisiert werden, sodass der Arbeitsanteil des Menschen am Maschinenlernen langfristig geringer ausfällt.