Machine Learning

Günther Jena

https://semiversus.com/wdic/maschinelles_lernen/ml.html

Anwendungsgebiete

  • EMail Spam Filter
  • Virtuelle Assistenten (Siri, Alexa, Google Assistant, ...)
  • Schrifterkennung
  • Produktempfehlungen
  • Betrugserkennung
  • Medizinische Diagnose
  • Dynamische Preisgestaltung
  • ...

Arthur Samuel prägt 1959 den Begriff Machine Learning

... without explicitly programmed to do so Referenz

Tom Mitchell definiert 1998

Ein Programm lernt aus seiner Erfahrung E bezüglich einer Aufgabe A und eines Performance-Maßes P, wenn seine Leistung bei A, gemessen durch P, sich mit der Erfahrung E verbessert.

Übersicht

KI Übersicht

Supervised Learning

  • Datensatz mit bekannten Ergebnissen existiert
  • Regression/Klassifikation

Beispiel: Regression - Position/Zeit

$$s = s_0 + v \cdot t$$

Vorhersage der Position basierend auf Anfangsposition \(s_0\), Geschwindigkeit \(v\) und Zeit \(t\).

Beispiel: Klassifikation - E-Mail Spam Filter

Eingabe-Features:

  • Anzahl bestimmter Wörter ("Gewinn", "kostenlos", "dringend")
  • Anzahl Großbuchstaben
  • Anzahl Ausrufezeichen
  • Absender-Domain bekannt/unbekannt

Ausgabe: Spam (🚫) oder Kein Spam (✓)

Das Modell lernt aus tausenden gelabelten E-Mails die Muster von Spam.

Beispiel: Lineare Regression

Siehe Beispiel "Anscombe's Quartet" in Jupyter Notebook lineare_regression.ipynb

Supervised Learning

Daten haben beschreibende Eigenschaften und Labels sind bekannt.

Regression:

  • Vorhersage kontinuierlicher Werte
  • Beispiele: Hauspreise, Temperatur, Aktienkurse

Klassifikation:

  • Zuordnung zu diskreten Kategorien
  • Beispiele: Spam-Erkennung, Bilderkennung, Sentiment-Analyse

Unsupervised Learning

  • Datensatz hat beschreibende Eigenschaften, aber keine Labels
  • Aufgaben: Finde Gruppen, finde Anomalien

k-means Clustering

Visualisierung

DBSCAN

Visualisierung

Neuronale Netze