Was bedeutet Supervised Learning?

Supervised Learning ist eine der drei Hauptkategorien im Bereich des Maschinellen Lernens: Supervised Learning bzw. Überwachtes Lernen, Unsupervised Learning bzw. Unüberwachtes Lernen und Reinforcement Lerarning bzw. Bestärkendes Lernen.

Im Supervised Learning arbeitet der Algorithmus mit gelabelten Trainingsdaten, das bedeutet, dass die Eingabedaten (Merkmale) mit den entsprechenden Ausgabedaten (Labels oder Zielvariablen) gepaart sind. Das Ziel besteht darin, eine Funktion oder Regel zu erlernen, die die Beziehung zwischen den Eingabedaten und den Ausgabedaten erfasst.

Ihre Ansprechpartnerin.

Agnes Tholen Porträt

Agnes Tholen

Director Sales & Marketing (ppa.)

Was ist Supervised Learning?

Stellen wir uns vor, wir möchten ein Supervised Learning Modell in der Lebensmittelbranche einsetzen, um die Reife von Früchten zu erkennen. Hierzu sammeln wir eine große Menge an Bildern von Früchten in verschiedenen Reifegraden. Die Bilder sind bereits mit den entsprechenden Labels versehen, die den Reifegrad der Früchte angeben, zum Beispiel “unreif”, “reif” oder “überreif”.

Die Trainingsdaten werden dem Algorithmus zur Verfügung gestellt, damit er aus den Beispielen lernen kann. Während des Trainingsprozesses analysiert der Algorithmus die Bilder und lernt, charakteristische Merkmale und Muster zu erkennen, die mit den unterschiedlichen Reifegraden der Früchte korrelieren.

Das Modell lernt beispielsweise, dass unreife Früchte eine grüne Farbe und eine feste Textur haben, während reife Früchte eine leuchtende Farbe und eine weichere Textur aufweisen. Überreife Früchte hingegen könnten braune Flecken oder eine schrumpelige Haut haben.

Nachdem das Modell ausreichend trainiert wurde, kann es auf neue Bilder von Früchten angewendet werden, die es noch nie zuvor gesehen hat. Das Modell kann dann anhand der erlernten Merkmale den Reifegrad der Früchte vorhersagen.

In der Welt des Supervised Learning gibt es viele weitere spannende Anwendungen, wie zum Beispiel die Erkennung von Handgeschriebenem, die Klassifizierung von E-Mails als Spam oder nicht Spam, die Vorhersage von Verkaufszahlen und vieles mehr. Es ist eine leistungsstarke Methode, um intelligente Lösungen zu entwickeln:

Opengraph

Anwendungsbereiche für Supervised Learning sind:

  • Bilderkennung: Klassifizierung von Bildern in verschiedene Objekte oder Kategorien.

  • Sprachverarbeitung: Klassifizierung von Texten, Sprachübersetzung oder Spracherkennung.

  • Medizinische Diagnose: Vorhersage von Krankheiten basierend auf medizinischen Bildern oder Patientendaten.

  • Finanzwesen: Vorhersage von Finanzmärkten oder Kreditrisiken.

  • Autonome Fahrzeuge: Klassifizierung von Verkehrsschildern oder Hindernissen.

Zurück zur Übersicht

Die Haupttypen von Aufgaben im Supervised Learning

Klassifikation

Hier wird der Algorithmus darauf trainiert, Eingabedaten in verschiedene vordefinierte Klassen oder Kategorien einzuordnen. Ein Beispiel ist die Klassifizierung von E-Mails in “Spam” oder “Nicht-Spam”.

Regression

Bei der Regression geht es darum, kontinuierliche Ausgabewerte vorherzusagen. Der Algorithmus lernt, eine Funktion zu erstellen, die die Eingabedaten auf eine kontinuierliche Zielvariable abbildet. Ein Beispiel ist die Vorhersage des Verkaufspreises einer Immobilie basierend auf ihren Eigenschaften.

Anwendungsbeispiele in der Lebensmittelbranche

Ein Anwendungsbeispiel für die Funktionsweise des Supervised Learning in der Lebensmittelbranche ist die Klassifizierung von Lebensmitteln basierend auf ihren Inhaltsstoffen oder Eigenschaften.

Stellen Sie sich vor, ein Lebensmittelhersteller möchte ein automatisches System entwickeln, das Lebensmittelprodukte anhand ihrer Inhaltsstoffe in verschiedene Kategorien einteilt, wie z.B. “vegetarisch”, “vegan”, “glutenfrei” oder “laktosefrei”. Das Ziel ist es, den Verbrauchern eine schnelle und genaue Information über die Produkte zu geben, ohne dass sie jedes Etikett manuell lesen müssen.

Um dieses System zu erstellen, sammelt der Hersteller eine umfangreiche Datenbank von Lebensmittelprodukten, die bereits entsprechend gekennzeichnet sind. Jeder Datensatz enthält die Liste der Inhaltsstoffe und die entsprechenden Kategorien (z.B. vegetarisch oder vegan).

Diese Daten dienen als Trainingsdaten für den Supervised Learning Algorithmus. Das Modell analysiert die Daten und lernt, welche Kombinationen von Inhaltsstoffen typischerweise zu bestimmten Kategorien führen. Es kann erkennen, dass Produkte mit Fleisch als Zutat nicht vegetarisch oder vegan sind und dass Produkte mit Milchbestandteilen nicht laktosefrei sind.

Nach dem Training kann das Modell verwendet werden, um neue Lebensmittelprodukte automatisch zu klassifizieren. Wenn ein neues Produkt auf den Markt kommt, kann das System anhand seiner Inhaltsstoffe feststellen, zu welcher Kategorie es gehört, und diese Informationen auf dem Etikett anzeigen oder online zugänglich machen.

Durch den Einsatz von Supervised Learning können Lebensmittelhersteller schnell und zuverlässig Informationen über ihre Produkte bereitstellen und so Verbrauchern helfen, fundierte Entscheidungen über ihre Ernährung zu treffen. Es ist ein Beispiel dafür, wie Maschinelles Lernen in der Lebensmittelbranche zur Verbesserung der Transparenz und Verbraucherfreundlichkeit beitragen kann.

Auch die Vorhersage von Verkaufsvolumen für Lebensmittelprodukte in Supermärkten ist dank Supervised Learning realisierbar: Angenommen, ein Lebensmittelhersteller oder Einzelhändler möchte das Verkaufsvolumen für ein bestimmtes Produkt, wie z.B. Frühstücksflocken, in seinen Filialen vorhersagen. Dazu sammelt er historische Verkaufsdaten dieses Produkts über einen bestimmten Zeitraum, einschließlich der Verkaufszahlen und der jeweiligen Merkmale wie Werbeaktionen, Sonderangebote, Wochentage, Feiertage, Wetterbedingungen usw. Diese Daten dienen als Trainingsdaten für den Supervised Learning Algorithmus.

Das Ziel ist es, ein Modell zu erstellen, das die Beziehung zwischen den Eingabeattributen (Werbeaktionen, Wetter usw.) und den Ausgaben (Verkaufszahlen) erlernt, um zukünftige Verkaufszahlen vorherzusagen.

Während des Trainingsprozesses analysiert der Algorithmus die Daten und sucht nach Mustern und Zusammenhängen zwischen den Eingabeattributen und den Verkaufszahlen. Es kann zum Beispiel feststellen, dass die Verkaufszahlen an sonnigen Tagen höher sind, wenn Werbeaktionen laufen oder wenn das Produkt zu einem Sonderpreis angeboten wird.

Nachdem das Modell gut trainiert wurde, kann es verwendet werden, um Verkaufsvorhersagen für neue Eingabeattribute zu treffen. Angenommen, der Einzelhändler plant eine Werbeaktion für das Produkt und möchte wissen, wie sich die Verkaufszahlen voraussichtlich verändern werden. Das Modell kann basierend auf den Eingabeattributen eine Schätzung des erwarteten Verkaufsvolumens liefern.

Durch den Einsatz von Supervised Learning können Unternehmen in der Lebensmittelbranche ihre Geschäftsentscheidungen besser informieren und effizienter gestalten. In diesem Fall ermöglicht die Vorhersage des Verkaufsvolumens, die Lagerbestände und Produktionsmengen besser zu planen, um Engpässe oder Überbestände zu vermeiden.

Zurück zur Übersicht

Was ist Unsupervised Learning (Unüberwachtes Lernen)?

Unsupervised Learning ist eine weitere wichtige Kategorie im Bereich des Maschinellen Lernens. Im Gegensatz zum Supervised Learning, bei dem der Algorithmus mit gelabelten Trainingsdaten arbeitet und die richtigen Antworten vorgegeben sind, verwendet Unsupervised Learning ungelabelte Daten, bei denen die Kategorien oder Klassen nicht bekannt sind. Das Hauptziel von Unsupervised Learning ist es, Muster und Strukturen in den Daten zu erkennen, um sie zu gruppieren, zu segmentieren oder zu reduzieren. Es geht also darum, versteckte oder intrinsische Informationen aus den Daten zu extrahieren.

Die zwei Haupttypen von Aufgaben im Unsupervised Learning

1 – Clustering

Clustering-Algorithmen gruppieren ähnliche Datenpunkte in Cluster, wobei die Mitglieder eines Clusters ähnlichere Merkmale aufweisen als die von anderen Clustern. Diese Algorithmen ermöglichen es, natürliche Gruppierungen in den Daten zu erkennen. Ein Beispiel ist der k-Means-Algorithmus, der Daten in k Cluster aufteilt, wobei k zuvor festgelegt wird.

2 – Dimensionality Reduction (Dimensionsreduktion)

Hierbei werden Techniken angewendet, um die Anzahl der Merkmale oder Dimensionen in den Daten zu reduzieren, während die relevanten Informationen beibehalten werden. Dies kann hilfreich sein, um die Datenvisualisierung zu verbessern oder den Trainingsprozess zu beschleunigen. Ein Beispiel ist die Hauptkomponentenanalyse (PCA).

Ihre Ansprechpartnerin.

Agnes Tholen Porträt

Agnes Tholen

Director Sales & Marketing (ppa.)

Opengraph

Anwendungsbereiche für Unsupervised Learning:

  • Bilderkennung: Klassifizierung von Bildern in verschiedene Objekte oder Kategorien.

  • Sprachverarbeitung: Klassifizierung von Texten, Sprachübersetzung oder Spracherkennung.

  • Medizinische Diagnose: Vorhersage von Krankheiten basierend auf medizinischen Bildern oder Patientendaten.

  • Finanzwesen: Vorhersage von Finanzmärkten oder Kreditrisiken.

  • Autonome Fahrzeuge: Klassifizierung von Verkehrsschildern oder Hindernissen.

Zurück zur Übersicht

Was ist Reinforcement Learning (Bestärkendes Lernen)?

Für eine gelungene Abgrenzung der drei Hauptkategorien fehlt nun noch das Bestärkende Lernen (Reinforcement Learning):

Das Bestärkende Lernen ist ein Lernansatz, bei dem ein Agent durch Interaktion mit einer Umgebung lernt, wie er Aktionen ausführen kann, um ein bestimmtes Ziel zu erreichen. Der Agent wird mit Belohnungen oder Bestrafungen für seine Handlungen konfrontiert, was ihn dazu motiviert, optimale Strategien zu entwickeln, um langfristige Ziele zu erreichen.

Optimierung der Lebensmittelproduktion mit Bestärkendem Lernen

Stellen Sie sich vor, Sie haben eine Fabrik, die Snack-Chips produziert. In dieser Fabrik werden verschiedene Schritte durchgeführt, wie das Schneiden, Frittieren, Würzen und Verpacken der Chips. Das Ziel ist es, die Produktionsleistung zu maximieren, die Produktqualität zu gewährleisten und gleichzeitig den Energieverbrauch zu minimieren. Hier kommt Bestärkendes Lernen ins Spiel:

Agent

Der “Agent” in diesem Fall wäre ein Softwareprogramm oder eine KI, die die Kontrolle über die Produktionsprozesse hat und Entscheidungen treffen kann, um die gewünschten Ziele zu erreichen.

Aktionen

Der Agent kann verschiedene Aktionen durchführen, wie die Anpassung der Frittiertemperatur, die Änderung der Schnittgeschwindigkeit oder die Anpassung der Würzungsmenge.

Umgebung

Die Umgebung ist die Lebensmittelfabrik selbst, in der die Produktion stattfindet. Sie liefert dem Agent Informationen über den aktuellen Zustand der Prozesse, die Produktionsleistung, die Qualität der Chips und den Energieverbrauch.

Belohnung

Der Agent erhält nach jeder Aktion eine Belohnung basierend auf der Leistung der Fabrik. Positive Belohnungen können für höhere Produktionsleistung und -qualität gegeben werden, während negative Belohnungen für Energieverschwendung oder minderwertige Produkte vergeben werden.

In der Lebensmittelproduktion und -verteilung ist die effiziente Lagerhaltung und Logistik von entscheidender Bedeutung, um sicherzustellen, dass frische und verderbliche Lebensmittel rechtzeitig an ihre Bestimmungsorte gelangen.

Lieferkettenoptimierung mit Reinforcement Learning

Reiforcement Learning ermöglicht eine automatisierte und intelligente Optimierung der Lieferkette, um Effizienz, Ressourcennutzung und Liefergenauigkeit zu verbessern.

Agent

In diesem Fall kann der Agent ein System sein, das die Entscheidungen für die Lagerbestände und den Transport trifft.

Aktionen

Der Agent kann Aktionen wie die Bestellung von Lebensmitteln, die Zuweisung von Lagerplätzen, die Planung von Transportrouten und die Steuerung von Lieferfahrzeugen durchführen.

Umgebung

Die Umgebung umfasst die gesamte Lieferkette, von der Lebensmittelproduktion über Lagerhäuser bis hin zu den Verkaufsstellen. Informationen wie Lagerbestände, Nachfrageprognosen, Lieferzeitpläne, Verkehrsbedingungen und Wetterbedingungen sind Teil der Umgebung.

Belohnung

Die Belohnungen können auf der Basis von Faktoren wie termingerechter Lieferung, Minimierung von Verderb, Optimierung von Transportkosten und Vermeidung von Überbeständen oder Engpässen vergeben werden.

Der bestärkende Lernalgorithmus analysiert die Umgebung und trifft Entscheidungen, um die Lagerbestände und den Transport so zu optimieren, dass die gewünschten Ziele erreicht werden. Das System lernt im Laufe der Zeit, welche Entscheidungen zu den besten Ergebnissen führen und passt seine Strategien entsprechend an. Dies kann dazu beitragen, Lebensmittelverschwendung zu reduzieren, die Lieferzeit zu verkürzen, Lagerkosten zu senken und die Gesamteffizienz der Lebensmittelversorgungskette zu steigern.