Big Data

Auf eine Tasse Java mit Laura Fink … Thema: Machine Learning

: Künstliche Intelligenz ist ein wichtiger Fortschrittstreiber. Laura erklärt im Interview, welche Rolle Machine Learning dabei spielt.

Laura Fink erklärt Machine Learning

Künstliche Intelligenz, Machine Learning, Data Mining. Laura, bringst du als Expertin mal Ordnung in diese Begriffe?

Im Kern beschreiben alle Begriffe das gleiche Ziel – nämlich Wissen aus Daten zu extrahieren und für uns Menschen nutzbar zu machen. Der Begriff Data Mining wird dann verwendet, wenn aus großen Datenmengen mithilfe statistischer Methoden Muster ausgelesen und Zusammenhänge erkannt werden sollen. Von Machine Learning sprechen wir dann, wenn intelligente Algorithmen im Einsatz sind, die solche Muster automatisch aufspüren und dieses Wissen zum Lösen von Aufgaben selbstständig nutzen können. Um solche Algorithmen erfolgreich einzusetzen, ist es allerdings oft nötig, die Daten mithilfe statistischer Methoden vorab zu analysieren und für den Algorithmus aufzubereiten.

Von Künstlicher Intelligenz sprechen wir erst dann, wenn Algorithmen auch Aufgaben bewältigen, die vorher nur durch menschliche Fähigkeiten gelöst werden konnten – wie etwa dem Sehen, der Sprache oder dem Lernen aus Erfahrung. Diese Algorithmen stammen oft aus dem Fachbereich des Machine Learning, welches somit einen wichtigen Teilbereich der Künstlichen Intelligenz darstellt.

Machine Learning klingt vollautomatisch. Wie viel menschliches Zutun steckt dahinter?

Lernende Algorithmen sind keine Wundermittel, die ganz von allein alle Muster und Zusammenhänge in unseren Daten aufdecken und uns zur Verfügung stellen können. Nur durch das Zusammenspiel von Mensch und Maschine lässt sich ihr Potential wirklich entfalten: Wir Menschen stellen Daten zur Verfügung und müssen sicherstellen, dass sie von hoher Qualität sind und sich zum Lösen einer konkreten Aufgabe eignen. Wir wählen dazu passende Algorithmen aus, bereiten alle Merkmale in den Daten entsprechend auf und gestalten den gesamten Weg von der Quelle der Daten bis hin zum Ergebnis der Analyse. Wenn Machine Learning erfolgreich eingesetzt werden soll, ist sowohl menschliche Kreativität als auch kritisches menschliches Mitdenken gefragt.

Du hast für unser Quelltext-Magazin einen Machine-Learning-Showcase anhand von E-Commerce-Daten bearbeitet. Inwiefern sind deine Ergebnisse auch für andere Branchen und Business Cases relevant?

Die meisten Abschnitte, die der Showcase beschreibt, sind generell für Machine-Learning-Projekte von Bedeutung, also auf viele Anwendungsfälle übertragbar. Methoden, die Gradient Boosting einsetzen, sind ebenso wie Künstliche Neuronale Netze sehr flexibel einsetzbar und äußerst performant. Der verwendete Algorithmus Catboost eignet sich nicht nur für die Vorhersage von Verkaufszahlen oder zu erwartenden Gewinnen. Er kann auch eingesetzt werden, wenn wir z. B. erkennen wollen, ob Kunden auf Marketing-Strategien wie gewünscht reagieren, oder ob und wann Produktionsmaschinen ausfallen. Der Showcase bietet außerdem viele Anknüpfungspunkte für weitere Anwendungsfälle. Die extremen Ausreißer in den Verkaufs – zahlen und Preisen der Produkte machen deutlich, dass z. B. Algorithmen für Anomaly Detection helfen könnten, irrtümlich hohe Bestellungen zu erkennen. Durch ein Kundenfeedback könnten ferner Stornierungen reduziert und Aufwand verringert werden.

Des Weiteren ließe sich mit Clustering Verfahren und Natural Language Processing herausfinden, welche Produkte ähnlich sind und zeitgleich im Trend liegen bzw. vielfach verkauft werden. Auch das Kaufverhalten der Kunden kann für Customer Segmentation unter die Lupe genommen werden.

Welche Anwendungsfälle von Machine Learning kannst du dir vorstellen, die einen Fortschritt für das Gemeinwesen erzielen können?

Insbesondere im medizinischen Bereich sind sehr viele nützliche Anwendungsfälle vorstellbar. Deep Learning kann nicht nur dafür eingesetzt werden, um z. B. Krebsarten frühzeitig in medizinischen Bilddaten zu erkennen. So könnte ich mir auch vor – stellen, dass Künstliche Neuronale Netze dabei helfen können, das EKG-Monitoring zu unterstützen. Wird jemand gleich ein Herzversagen erleiden? Möglicherweise zeigen sich in den Signalen bereits kleine Veränderungen, die lernende Algorithmen erkennen können, obwohl das menschliche Auge sie nicht wahrnimmt.

Liebe Laura, wir danken dir für das Gespräch!

Interesse am Thema Machine Learning? Dann lesen Sie auch den Blogbeitrag von Laura Fink zur Sache oder das Anwendungsbeispiel VAMINAP. Hier zudem ein Interview mit Laura Fink in der Sonderbeilage „Künstliche Intelligenz“ des Handelsblatts, Seite 7.

Laura Fink

Data Scientistin