KI - mehr als LLMs: Neue Wege in der Last-Mile-Zustellung

Erfahren Sie, wie KI-gestützte Zeitreihenprognosen die Last-Mile-Zustellung revolutionieren und welche KI-Modelle die besten Ergebnisse liefern.


KI - mehr als LLMs: Neue Wege in der Last-Mile-Zustellung

Künstliche Intelligenz (KI) macht nicht nur Schlagzeilen, sondern verändert auch nachhaltig die Art und Weise, wie Unternehmen agieren. Während ChatGPT und andere Large Language Models (LLMs) die Aufmerksamkeit der Öffentlichkeit auf sich ziehen, vollzieht sich in der Zeitreihenprognose eine stille Revolution. Insbesondere in der Last-Mile-Zustellung bietet die KI-gestützte Vorhersage von Paketzahlen ein immenses Potenzial für Effizienzsteigerungen und Kostensenkungen. Durch präzise Vorhersagen können Unternehmen ihre Personal- und Fahrzeugplanung optimieren, was zu reibungsloseren Abläufen und zufriedeneren Kunden führt.

In diesem Blogbeitrag beleuchten wir, wie verschiedene KI-Modelle die Prognose des Paketvolumens transformieren und welche Vorteile sich daraus für die Logistikbranche ergeben. Wir werfen einen Blick auf innovative Ansätze in der Zeitreihenanalyse und zeigen, warum es sich lohnt, über den Tellerrand aktueller Trends hinauszuschauen, um das volle Potenzial von künstlicher Intelligenz auszuschöpfen.
 

KI jenseits von LLMs: Die Vielfalt neuronaler Netzwerke

Künstliche Intelligenz (KI) basiert in all ihren Anwendungsfällen auf einem zentralen Prinzip: dem selbstständigen Erkennen und Anwenden von Mustern. Um dies zu ermöglichen, kommen verschiedene Algorithmen zum Einsatz, von denen neuronale Netze die bekanntesten sind.

Mit neuronalen Netzen, dem sogenannten Deep Learning, lassen sich drei große Bereiche realisieren:

  • Natural Language Processing (NLP)
    Dieser Bereich erhält derzeit die meiste Aufmerksamkeit. Das Verstehen und Generieren von Texten hat seit der Veröffentlichung von ChatGPT 3.5 eine neue Welle des Interesses an KI ausgelöst, die bis heute anhält.
  • Computervision
    Schon vor dem aktuellen Hype hat dieses Gebiet Einzug in viele Lebensbereiche gehalten. Computervision umfasst die Objekterkennung und Bilderzeugung durch Modelle wie DALL-E oder Midjourney. Auch alltägliche Anwendungen wie virtuelle Hintergründe in Microsoft Teams oder Instagram-Filter nutzen diese Technologie meist unbemerkt im Hintergrund.
  • Zeitreihenanalyse
    Der dritte Bereich von Deep Learning ist die Zeitreihenanalyse. Auf Anwenderebene kommt sie unter anderem im musikalischen Kontext zum Einsatz, beispielsweise basiert das Tool Suno.ai zur Erstellung von Musikstücken darauf. Weitere Anwendungsfälle sind die Vorhersage von Wetterveränderungen oder Wartungsintervallen (Predictive Maintenance). Obwohl diese Anwendungen etablierter sind als die derzeit noch in den Kinderschuhen steckende generative KI, sind sie in der öffentlichen Diskussion weniger präsent.

Bei einem Blick über die aktuellen Trends hinaus zeigt sich, dass die Zeitreihenanalyse ein wesentlicher, aber oft unterschätzter Bestandteil der KI ist. Sie bietet praktische Lösungen für reale Probleme und hat das Potenzial, einen großen Einfluss auf verschiedene Branchen zu haben.
 

Zeitreihenanalyse in der Logistik: Vergleich von drei KI-Modellen zur Paketprognose in der Last-Mile-Zustellung

Nachfolgend wird ein im Hintergrund laufendes Modell zur Prognose der Paketanzahl vorgestellt. Es verwendet reale Daten aus den Jahren 2013 bis 2016, um die ersten fünf Wochen des Jahres 2017 vorherzusagen. Da der Prognosezeitraum in der Vergangenheit liegt, kann die Genauigkeit des Modells direkt mit den realen Daten verglichen werden. Für die Prognose wurden insgesamt drei Ansätze verwendet: Ein selbst implementiertes Modell, ein vortrainiertes Zeitreihenanalyse-Modell namens TimeGPT und die auf den ersten Blick unkonventionelle Methode, Zeitreihenvorhersagen über einen Prompt von ChatGPT durchzuführen.

Die Daten stammen von zwei Touren aus der sogenannten „Last Mile“-Zustellung. Konkret fahren die Mitarbeitenden zu Beginn ihres Arbeitstages ein zentrales Depot an, laden dort alle Pakete ein und liefern diese im Laufe des Tages an die Endkunden aus. Die genaue Vorhersage des täglichen Paketaufkommens ermöglicht eine effektive Personal- und Fahrzeugplanung und führt zu erheblichen Zeit- und Kosteneinsparungen.

Die Idee der Zeitreihenprognose besteht darin, die vorhandenen Werte einer Reihe zu nutzen, um die nächsten Werte vorherzusagen. Wenn beispielsweise die Reihe [10, 20, 30, 40, 50, 60] gegeben ist und ein Zeitreihenfenster von 3 gewählt wird, würden die Zahlen [10, 20, 30] die Zahl 40 vorhersagen, die Zahlen [20, 30, 40] die Zahl 50 und so weiter. Das Modell ist in der Lage, den Verlauf der Zeitreihe zu erkennen und das zugrundeliegende Muster zu erfassen, wenn genügend Datenpunkte und ein geeignetes Zeitreihenfenster verwendet werden.
 

Zeitreihenanalyse mit Custom CNN-Modell für Last-Mile-Zustellungen

Das von uns entwickelte Modell basiert auf einem „Convolutional Neural Network“ (CNN), das den Vorteil hat, die Eigenschaften von Zeitreihen zu verstärken. Dies wird durch den namensgebenden Mechanismus der Faltung (Convolution) erreicht, bei dem nahe beieinander liegende Datenpunkte aggregiert werden, um die Merkmale dieser Datenregion hervorzuheben.

Ein Convolutional Neural Network ist vor allem aus der Bildverarbeitung bekannt, wo es Muster und Strukturen in visuellen Daten erkennt. Die Anwendung von CNNs auf Zeitreihendaten ist innovativ und bietet erhebliche Vorteile. Durch die Fähigkeit, lokale Muster und zeitliche Abhängigkeiten zu erkennen, eignen sich CNNs hervorragend für die Analyse von Daten mit wiederkehrenden Mustern, wie z.B. das tägliche Paketaufkommen in der Last-Mile-Zustellung.

Das Modell wurde mit Hilfe der Keras API der Tensorflow Library implementiert. Keras dient als benutzerfreundliche Abstraktionsschicht der Tensorflow Library und ermöglicht schnelles Prototyping und Experimentieren, was die Entwicklungszeit erheblich verkürzt. Im Rahmen unserer Forschung haben wir verschiedene Arten von neuronalen Netzwerken getestet. Neben dem CNN wurden auch Long Short-Term Memory (LTSM)-Netzwerke und klassische Feed Forward Netzwerke. Unsere Entscheidung, neben CNNs auch LSTM-Netzwerke zu testen, basiert auf ihrer Stärke im Umgang mit sequenziellen Daten und ihrer Fähigkeit, langfristige Abhängigkeiten zu modellieren. In unserem Anwendungsfall zeigte sich jedoch, dass CNNs bessere Ergebnisse liefern (Abbildung 1), da die Daten stark von lokalen Mustern und kurzfristigen Trends geprägt sind.

Unser Modell erkannte erfolgreich den Wochenrhythmus der Daten und konnte den Verlauf der ersten, vierten und fünften Woche genau nachbilden. Innerhalb von nur vier Entwicklungstagen konnten wir ein weitgehend passendes Ergebnis erzielen, was der 80/20 Regel entspricht: 80% des Ergebnisses werden mit 20% des Aufwands erreicht. Die weitere Anpassung des Modells, um den genauen Verlauf des Datensatzes im Detail abzubilden, erfordert jedoch weitere Entwicklungszeit.

Der Einsatz dieses maßgeschneiderten Modells hat es uns ermöglicht, die spezifischen Muster und Schwankungen in unserem Datensatz besser zu verstehen. Für die Verbesserung der Effizienz, Verlässlichkeit und Planungssicherheit der Paketprognose ist dieser Schritt entscheidend. Die Implementierung solcher maßgeschneiderter KI-Lösungen kann einen erheblichen Wettbewerbsvorteil in der Logistikbranche darstellen.
 

TimeGPT im Praxistest: Vortrainierter Transformer für die Paketprognose

Das nächste Modell, das für die Vorhersage eingesetzt wurde, ist TimeGPT, ein vortrainierter Transformer aus der Time Series Library von Nixtla (https://docs.nixtla.io/). Mit diesem Tool können Vorhersagen für unbekannte Datensätze mit nur wenigen Zeilen Code generiert werden. Die Ergebnisse dieses Modells sind in Abbildung 2 dargestellt.

Die Transformer-Architektur wurde ursprünglich für Anwendungen im Bereich Natural Language Processing (NLP) entwickelt und hat dort bahnbrechende Fortschritte ermöglicht. Ihre Stärke liegt in der Fähigkeit, langfristige Abhängigkeiten in sequenziellen Daten zu erfassen. TimeGPT adaptiert diese Technologie für die Zeitreihenanalyse, was theoretisch eine hohe Flexibilität und Leistungsfähigkeit verspricht.

Interessanterweise verwendet TimeGPT die Transfomer-Architektur, die derzeit in vielen Bereichen der künstlichen Intelligenz den aktuellen Stand der Technik repräsentiert. Trotz dieser modernen Technologie schnitt TimeGPT schlechter ab als das von uns implementierte CNN-Modell. Während TimeGPT in der Lage war, die Periodizität der Daten zu erkennen, war es nicht in der Lage, die Details innerhalb der einzelnen Wochen genau zu erfassen.

Das könnte darauf zurückzuführen sein, dass unser zugrunde liegender Datensatz komplexe Muster aufweist, deren Feinheiten schwer zu modellieren sind. Transformationsmodelle wie TimeGPT benötigen oft große und vielfältige Datensätze, um ihre Stärken voll ausspielen zu können. Bei einem Datensatz mit einfacheren Mustern, wie dem weit verbreiteten „Airline Passengers“-Datensatz, erzielt TimeGPT jedoch deutlich bessere Ergebnisse, wie in Abbildung 3 zu sehen ist.

Die Anwendung von TimeGPT zeigt: Mit vortrainierten Modellen lassen sich schnell und unkompliziert erste Prognosen erstellen. In spezialisierten Bereichen können sie jedoch individuell entwickelten Modellen unterlegen sein. Für komplexe Aufgabenstellungen, wie z.B. die genaue Vorhersage des Paketaufkommens in der Logistik, ist eine maßgeschneiderte Lösung oft effektiver.
 

ChatGPT und Zeitreihen: Kann ein Sprachmodell Paketdaten vorhersagen?

Die letzte Variante zur Vorhersage der Anzahl der Pakete ist die Verwendung eines LLM, in unserem Fall ChatGPT. Hier wurde die Zahlenfolge als Prompt eingegeben mit der Anweisung, diese fortzusetzen. Da LLMs durch Training an großen Textmengen Muster in Texten erkennen und generieren, erscheint die Anwendung auf reine Zahlenreihen zunächst kontraintuitiv.

Obwohl LLMs nicht speziell für die Verarbeitung numerischer Daten entwickelt wurden, haben sie eine beeindruckende Fähigkeit zur Mustererkennung. Dies liegt an der enormen Menge an Trainingsdaten und der komplexen Architektur, die es ihnen ermöglicht, Zusammenhänge und Sequenzen zu erkennen.

Tatsächlich konnte ChatGPT 3.5-turbo jedoch zumindest die Periodizität der Paketdaten erkennen (siehe Abbildung 4). Obwohl das Ergebnis in einer realen Anwendung unbrauchbar ist, zeigt es eine faszinierende Schnittmenge zwischen den verschiedenen Bereichen des Deep Learning. Es zeigt, dass LLMs in der Lage sind, grundlegende Muster auch in numerischen Daten zu erkennen, obwohl sie primär für die Verarbeitung natürlicher Sprache konzipiert sind. Auffällig ist, dass ChatGPT 3.5-turbo die Periodizität besser erkannte als ChatGPT 4o, dessen Vorhersagen vollständig linear waren.

Wir haben den LLM-basierten Prognoseansatz auf den bereits erwähnten Datensatz „Airline Passengers“ angewendet, um diesen Gedanken weiter zu verfolgen. Hier schnitt ChatGPT deutlich besser ab als bei den Paketdaten. Das LLM konnte eine sehr genaue Fortführung des Datensatzes generieren. Ein möglicher Grund dafür könnte sein, dass dieser Datensatz in den Trainingsdaten von ChatGPT enthalten ist. Da es auf umfangreichen Daten aus dem Internet trainiert wurde, ist es wahrscheinlich, dass der Datensatz „Airline Passengers“ in den Traningsdaten von ChatGPT enthalten ist.

Für praktische Anwendungen in der Logistik und anderen Branchen bedeutet dies, dass LLMs zwar interessante experimentelle Ergebnisse liefern können, für präzise und zuverlässige Vorhersagen jedoch weiterhin spezialisierte Modelle erforderlich sind.

 

Das Potenzial maßgeschneiderter KI-Lösungen in der Last-Mile-Zustellung

Zur Lösung des hier diskutierten Problems der Prognose der Paketzahlen haben wir verschiedene Ansätze untersucht. Die besten Ergebnisse lieferte das von uns entwickelte und trainierte Convolutional Neural Network Modell. Obwohl die vorgestellten Modelle noch nicht serienreif sind, konnte in kurzer Entwicklungszeit ein solides Entwicklungsergebnis erzielt werden, das die Potenziale maßgeschneiderter KI-Lösungen in der Logistikbranche unterstreicht.

Der aktuelle Trend der Large Language Models (LLMs) eröffnet neue Formen der Benutzerinteraktion, bei denen der Anwender direkt mit einem KI-System interagieren und dessen Input steuern kann. Aber auch in der Vergangenheit wurden Algorithmen des maschinellen Lernens im Hintergrund zur Verbesserung des Alltags der Nutzer eingesetzt – häufig ohne dass diese sich dieser Systeme bewusst waren.

Diese Hintergrundsysteme, wie das hier vorgestellte Modell zur Vorhersage der Paketanzahl, können die Effizienz und die Kosten eines Prozesses mindestens so stark beeinflussen, wie es derzeit von LLMs erwartet wird. Wir empfehlen daher, über die aktuellen Trends hinauszublicken, um Anwendungsfälle für KI-basierte Systeme zu finden. So können Unternehmen spannende Bereiche der KI entdecken und das volle Potenzial dieser Technologien für sich nutzen. 

Die Ergebnisse unserer Untersuchungen zeigen, dass individuell angepasste KI-Modelle, die speziell auf die Anforderungen eines Unternehmens zugeschnitten sind, häufig besser abschneiden als vortrainierte, generische Modelle. Dies unterstreicht die Bedeutung maßgeschneiderter KI-Lösungen für den Erfolg in einem wettbewerbsintensiven Markt.

Ihr Partner für maßgeschneiderte KI-Lösungen.
Kontaktieren Sie uns!

Als erfahrenes IT-Beratungs- und Dienstleistungsunternehmen unterstützen wir Sie dabei, die Potenziale der Künstlichen Intelligenz in Ihrem Unternehmen voll auszuschöpfen. Ob bei der Entwicklung individueller KI-Modelle, der Optimierung Ihrer Logistikprozesse oder der Integration neuer Technologien in Ihre bestehenden Systeme - wir stehen Ihnen mit unserer Expertise zur Seite. Kontaktieren Sie uns noch heute, um gemeinsam innovative Lösungen zu entwickeln und Ihr Unternehmen fit für die Zukunft zu machen.

 

Weitere Themen für Sie