fbpx

Was ist überwachtes Lernen?

Was ist überwachtes Lernen?
Lass dir den Text vorlesen
Subscribe

Benötigte Lesezeit: 3 Minuten

Überwachtes Lernen ist eine Variante des maschinellen Lernens, bei der ein Algorithmus anhand von Beispielen lernt und anschließend neue, weitere Objekte definiert. Diese Fähigkeit, mit Hilfe von Vorbildern zu begreifen, hat das maschinelle Lernen so beliebt und allgegenwärtig gemacht.

Überwachtes Lernen kann zum Einsatz kommen, wenn ein Algorithmus erkennen soll, ob ein Bild eine Katze oder einen Hund zeigt, oder wie hoch die Wahrscheinlichkeit ist, dass ein Nutzer den neuen Netflix-Film mag. Solche Fragen lassen sich am besten basierend auf Erfahrungen oder Beispielen für korrektes Verhalten beantworten.

Wie funktioniert überwachtes Lernen?

Bleiben wir beim Fall der Tierbilder: Jedem Bild kann eine Kategorie zugeordnet werden. Bild 1 zeigt z.B. einen Hund, Bild 2 zeigt eine Katze, Bild 3 zeigt einen Pilz usw. Durch diese Zuordnung kann eine große Kollektion an kategorisierten Bildern entstehen. Die Aufgabe ist simpel und wird schnell klar: Bestimme das Objekt auf einem Foto. Die Kraft des maschinellen Lernens besteht darin, den Prozess der Lösungsfindung für eine Aufgabe zu automatisieren, die anhand eines Beispiels veranschaulicht wird. Wir müssen die Herausforderung nicht spezifizieren.

Wir nehmen also eine Reihe möglicher Zuordnungen an, die ein Bild aufnimmt und eine Kategorie als Antwort erzeugt. Diese Zuordnung wird durch Parameter angegeben. Das Ziel ist, den bestmöglichen Parameter herausfinden, der mit den Beispielen übereinstimmt.

Technisch gesehen, wird eine Sammlung von Funktionen (Zuordnung von Beispiel und Kategorie/Ziel) mit einem Parameter versehen. Ein Algorithmus für maschinelles Lernen automatisiert dann den Prozess des Findens des Parameters der Funktion, der am besten zu den Beispiel-Ziel-Paaren passt.


Der Prozess des überwachten Lernens anhand eines Beispiels

  1. Die Aufgabe für den Lernalgorithmus wird durch kategorisierte Beispiele definiert

Beispielsweise bewerte ich Filme auf Netflix, die ich bereits gesehen habe, mit +1 für “gefällt mir” und -1 für “gefällt mir nicht”. 

  1. Ein Feature-Vektor wird definiert, um diese Filme in ein Format zu übersetzen, dass ein Computer versteht. 

In diesem Fall wird der Feature Vektor durch Fragen zum Film bestimmt, auf die ich eine binäre Antwort (0 oder 1) gebe. Handelt es sich um einen romantischen Film? Ja – also gebe ich eine 1. Ist es eine Komödie? Nein – also gebe ich eine 0. Mehrere solcher Fragen die systematisch auf einen Film angewendete werden, ergeben einen binären Vektor [0,1,0,1…], der dem Film zugeordnet ist.

Diese Prozedur wird nun für alle Filme wiederholt.

  1. Der Computer nutzt den so entstandenen Trainings-Datensatz (Vektoren mit den zugehörigen Bezeichnungen), um die korrekte Zuordnung zu erlernen.
  2. Ziel ist es nun, das Erlernte zu verallgemeinern und auf einen (neuen) Test-Datensatz anzuwenden. In diesem Fall, wäre das eine sogenannte Klassifizierungs-Aufgabe. Wir benötigen also den passenden Klassifizierer.

Klassifizierer sind Zuordnungen, die Merkmalsvektoren als Eingabe verwenden und Beschriftungen (Kategorien) als Ausgabe erzeugen. 

Eine übliche Art von Klassifikator ist (z.B.) der lineare Klassifikator, der den Raum (die (Hyper-) Ebene, in der die Trainingsdaten liegen) linear in zwei Teile teilt. Bei einem Punkt 𝑥 im Raum gibt der Klassifikator ℎ ℎ (𝑥) = 1 oder ℎ (𝑥) = – 1 aus, je nachdem, wo der Punkt 𝑥 zwischen den beiden linear geteilten Räumen existiert.

MITx 6.86x

  1. Zunächst wird getestet, wie richtig oder falsch der gewählte Klassifizierer in Bezug auf die Trainingsbeispiele liegt. Dabei wird der tatsächliche Wert (+1 oder -1) mit der Ausgabe des Klassifizierers verglichen. Aus diesem Vergleich für den gesamten Trainingsdatensatz ergibt sich eine Trainings-Fehlerrate. Das Finden der optimalen Fehlerrate, erfordert oft das Testen verschiedener Klassifizierer.
  2. Wurde der passende Klassifizierer identifiziert, kann er auf den Test-Datensatz angewendet werden. 

Wo wird überwachtes Lernen angewendet?

Überwachtes Lernen kann in verschiedenen Bereichen angewendet werden, z.B. bei der maschinellen Übersetzung. Die entsprechende Aufgabe wird einfach definiert, indem etwa ein deutscher Satz und dessen Übersetzung ins Französische angegeben werden. Eine große Menge solcher Beispiele veranschaulicht die Mission. 

Eine komplexe Funktion verwendet einen Satz als Eingabe und enthält Parameter, die unterschiedliche mögliche Zuordnungen angeben. Jeder Parameterwert liefert eine mögliche Antwort, die übereinstimmt oder auch nicht. Ein Algorithmus sucht dann automatisiert nach diesen Parameterwerten, um die beste Zuordnung für diese Aufgabe zu finden. Google Translate arbeitet bereits in diesem Modus.

Bild: Unsplash

Tina

Tina Nord ist Marketing-Expertin, Autorin und Sprecherin. Die Kommunikationswirtin beschäftigt sich seit mehr als zehn Jahren mit Content Marketing. Seit 2016 erforscht Tina den Einfluss maschinellen Lernens auf Content und repräsentiert die internationale NGO & Community Women in AI (WAI) als Botschafterin in Deutschland.

Empfohlene Artikel

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.