Machine Learning: 10 Fakten, die jeder kennen sollte

Machine Learning hört sich schon vom Wort her futuristisch an. Machinen sollen lernen. Doch wie bringt man einer Machine Lernen bei? Etwas was Mensch und Tier überlebensfähig gemacht hat, soll jetzt in eine Blechbüchse rein. Damit ihr Machine Learning besser versteht, zeige ich 10 Punkte auf die es ankommt. Eine wunderbare Zusammenstellung von Machine Learning Artikeln ist auf Medium zu finden: Clickt hier, um zu den Artikeln zu gelangen, Medium.

1. „Lernen aus Daten“

Künstliche Intelligenz kommt dann zum Einsatz, wenn wir mit Hilfe von Machine Learning Vorhersagen machen oder komplexe Aufgaben lösen lassen. Voraussetzung hierfür ist das richtige Datenset für das Training und der passende Lernalgorithmus.

2. Es dreht sich um Daten und Algorithmen, aber primär um Daten.

Ständig werden Fortschritte im Bereich der Machine Learning Algorithmen erzielt. Insbesondere Deep Learning ist ein spannendes Feld. Daten sind aber dennoch die Hauptzutat für Machine Learning, denn selbst perfekte Algorithmen können schlechte Daten nicht aufwiegen.

3. Wenn du nicht genug Daten hast, bleib beim einfachen Model.

Machine Learning trainiert dein Model anhand der Muster in deinen Daten. Es erkundet mögliche Modelle, die du mit Parametern zuvor eingegrenzt hast. Ist die Eingrenzung zu stark, hast du einen so genannten „Overfit“. Das heißt, dein Model wird nicht generell genug sein. Deshalb solltest du dein Model so simpel wie möglich halten.

4. Machine Learning ist nur so gut wie die Daten, die du zum Trainieren benutzt.

„Müll rein, Müll raus“. Das passiert, wenn du unbereinigte und unvollständige Daten benutzt. Deshalb benötigst du vollständige, einheitliche und detaillierte Daten damit dein Algorithmus Muster in deinen Daten erkennen und daran lernen kann.

5. Dein Trainingsdatenset muss repräsentativ sein.

Machine Learning wird nur Aussagen für das Datenset treffen können mit dem es trainiert worden ist. Trainings- und Produktionsdatensets sollten demnach ähnlich verteilt sein.

6. Daten Transformation ist am aufwendigsten.

Der große Hype um Machine Learning beschreibt oft neue Algorithmen, oder wie man diese tunen kann. In Wahrheit geht die meiste Arbeit in die Datenaufbereitung und das so genannte „feature engineering“, das Bestimmen von wichtigen Charakteristika im Datenset.

7. Deep Learning ist ein weiterer Fortschritt, aber nicht die ultimative Antwort.

Deep Learning automatisiert viele Schritte, die sonst mittels „feature engineering“ für Bild und Video-Daten erfolgen. Dem geht dennoch aufwendige Datenaufbereitung vor. Lies hier mehr zu Deep Learning: Statistik auf Steroiden: Aus dem Deep Learning Trainingslager.

8. Anfälligkeit für Fehler im Vorgang.

Oft passiert es, dass das Trainingsdatenset einen systematischen Fehler enthält oder sich ein Fehler einschleicht und zu falschen Aussagen oder Vorhersagen führt. Deshalb ist es wichtig Datensets zu vergleichen und bei der Datenaufbereitung Kontrollen einzubauen.

9. Machine Learning kann sich selbst täuschen.

Wenn dein Machine Learning System fehlerhaft ist und dir bei dem Generieren vom Trainingsdaten hilft, können ursprüngliche Fehler nach und nach verstärkt werden.

10. Künstliche Intelligenz oder A.I. hat gute und schlechte Eigenschaften.

Wie jede Technologie, kann künstliche Intelligenz für gute Zwecke oder weniger gute Zwecke eingesetzt werden. Sich über die Möglichkeiten und Einschränkungen zu informieren wird uns helfen, diese Technologie bewusst und richtig einzusetzen.

Foto von Joseph Chan auf Unsplash