Herausforderungen bei der Nutzung von Zeitreihenprognose erfolgreich lösen

Wir schauen uns an, wie man Mehrwert im Business-Kontext durch Zeitreihenprognoseverfahren mit realen Daten erzielen kann, anstatt es auf akademischem Forschungsniveau zu belassen.

We're hiring!
5
OFFENE
STELLEN
September 28, 2023
3
 
Minuten Lesezeit
Tags
Data Science
KI
Technologie

Wenn es darum geht, die Zukunft basierend auf historischen Ereignissen oder verfügbaren Informationen in der Zukunft selbst vorherzusagen, hat sich die Prognose von Zeitreihen als eine bevorzugte Strategie etabliert. Ob mit einfachen statistischen Ansätzen oder modernsten Deep-Learning-Modellen, sie erfordert ein umfassendes Verständnis von zeitabhängigen Faktoren, sowohl aus der Vergangenheit als auch möglicherweise aus der Zukunft. Diese Methoden haben in der akademischen Forschung große Erfolge erzielt. Aber wie gehen wir über den Komfort dieser Datensätze hinaus, die ich als "Spielzeug-Datensätze" bezeichne? Echte Geschäftsdaten weisen eine viel größere Komplexität und Heterogenität auf, die wir überwinden müssen, um Mehrwert zu schaffen.

Den Rhythmus der Daten erkennen

Der Schlüssel zur Beherrschung der Zeitreihenprognose liegt darin, den Rhythmus zu lernen, der die Daten antreibt. Benchmark-Datensätze bieten oft eine Vereinfachung dieses Rhythmus und zeigen klare saisonale Muster und Trends ohne starke Einflüsse von externen Faktoren. Von Fluggastzahlen bis zu den Hauspreisen in Boston vereinen typische Benchmark-Datensätze in der Wissenschaft einfache zugrundeliegende Problem-Dynamiken.

Wenn jedoch der Betrieb von dieser kontrollierten Umgebung in das Chaos der realen Daten übergeht, können herkömmliche Methoden ins Straucheln geraten und eine Vielzahl von Herausforderungen hervorrufen.

Die Welt der Spitzen, Kaltstarts und intermittierenden Perioden

In der Geschäftswelt sind Datenspitzen ein häufiges Phänomen. Sonderaktionen und Verkaufstage können drastische Ereignisse verursachen, die ein Prognosemodell leicht durcheinanderbringen können, was zu schlechten Konsequenzen für die Geschäftsplanung führt. Unternehmen müssen sich außerdem mit dem sogenannten Kaltstartproblem auseinandersetzen, bei dem die Einführung neuer Produkte offensichtlich noch keine historischen Daten liefern kann, aber dennoch genaue Prognosen für das betreffende Produkt benötigt werden, um das Geschäft effektiv zu steuern.

Intermittierende Zeitreihen, die hauptsächlich durch viele 0-Werte in den Daten selbst gekennzeichnet sind, sind im Bereich des E-Commerce und bei Bekleidungshändlern üblich. Sie destabilisieren weitere gängige Prognosemodellansätze. Kreative Anwendungen statistischer Methoden wie die Croston-Methode oder ADIDA (Aggregated-Disaggregated Intermittent Demand Approach) können jedoch in solchen Perioden für Stabilität sorgen.

Es gibt noch kein Vorhersagemodell, das allen dient!

Da wir mit Datensätzen arbeiten, die Millionen von vorhergesagten Artikeln umfassen können, einschließlich der oben beschriebenen Datenkomplexitäten, müssen wir passende Modellansätze finden. Daher gibt es nicht ein Modell, das alle diese Komplexitäten von sich aus am besten abdeckt. Für Zeitreihen in einem Sektor mit geringem Volumen, wenig Varianz und ohne externe Einflüsse, schneiden statistische Modelle empirisch gut ab. Für Produkte mit hohem Volumen und hoher Varianz durch externe Faktoren sind Deep-Learning- oder Machine-Learning-Modelle die beste Praxis.

Unser Technologie-Stack bei paretos bietet uns die Möglichkeit, effektiv aus diesen Ansätzen ein Modell zu erstellen und daher optimale Ergebnisse für verschiedene Problemcharakteristiken zu liefern.

Ein Leuchtturm im Chaos: Laufende Baselines

Aber wie wissen wir, ob ein Prognosemodell tatsächlich gut, schlecht, hervorragend oder nur durchschnittlich abschneidet?

Der erste und entscheidende Schritt bei der Zeitreihenprognose ist die Durchführung von Baselines. Dies liefert viel Kontext für die Leistung des endgültigen Vorhersagemodells und ist essenziell, um die Iterationen des maschinellen Lernens zu steuern.

Die Analyse der Modellleistung basierend auf Datenclustern (z.B. gruppiert nach Volumen, Varianz, Prognosefehler usw.) hilft weiterhin, die Vorhersagen zu verfeinern. Dies wird besonders wichtig in Datensätzen mit mehr als ~100k vorhergesagten Artikeln, bei denen der Entscheidungsträger sofort auf die wichtigsten Artikel hingewiesen werden muss, um sie schnell und effektiv zu überprüfen.

In der Welt der Zeitreihenprognose bietet paretos dateninformierte Einblicke und optimierte Prognosen, die sicherstellen, dass Ihr Unternehmen immer einen Schritt voraus ist. Navigieren Sie durch die Komplexität der realen Daten und verwandeln Sie jede Herausforderung in eine Gelegenheit. Beginnen Sie noch heute mit der Prognose bei paretos.

paretos
We are the leading AI-based decision intelligence platform for effective, data-driven decision-making processes in companies. No more bad decisions!
Robert Haase
AI Scientist
Als Physiker suche ich immer nach geeigneten Erklärungen und Modellierungsansätzen für komplexe Mechanismen. Die aktive Zusammenarbeit mit verschiedenen KMUs und internationalen Unternehmen im Bereich der Prognose und Bedarfsplanung ermöglichte es mir, mit Hilfe modernster Machine-Learning-Ansätze einen maximalen Geschäftswert zu generieren.
Share

Verwandte Artikel

Potentialfelder
Kundenbeispiele
Software-Demo

Jetzt Demo buchen

Möchten Sie wissen, ob paretos die richtige Lösung für sie ist? Vereinbaren Sie gern einen unverbindlichen Beratungstermin.