Predictive Analytics mit BOARD am Beispiel einer Absatzprognose
Neben klassischen Aufgabenstellungen wie Reporting, Analyse und Planung zeichnet sich BOARD auch dadurch aus, dass fortgeschrittene Analysemethoden zur Verfügung stehen, z.B. Analytische Funktionen, Clustering und Predictive Analytics. In unserem Fachbeitrag werfen wir einen Blick auf das Berechnen einer Prognose für Stückzahlen, also einer Funktion aus dem Bereich der Predictive Analytics.
Grundsätzliche Funktionsweise der Predictive Analytics Engine
BOARD unterstützt den Forecast (Prognose), indem verschiedene mathematische Modelle auf historische Daten angewendet werden und daraus eine Prognose für die zukünftige Entwicklung berechnet wird. Durch das Beisteuern kovariater Werte, also Wertereihen, die mit der eigentlich zu prognostizierenden Wertereihe in einem Zusammenhang stehen, kann die Prognose verfeinert und zuverlässiger gestaltet werden.
Zunächst durchläuft BOARD eine Lernphase auf den historischen Daten, in der auf die zu prognostizierende Wertereihe inkl. Kovariate verschiedene mathematische Modelle angewendet werden. Dieser Prozess wird mehrmals mit verschiedenen Methoden durchlaufen und dann festgestellt, welche Methode einen Forecast in der Vergangenheit erzeugt hat, der sich am meisten mit der eigentlichen Wertereihe deckt. Nur eine Methode gewinnt diesen Wettbewerb und diese wird dann angewendet, um den eigentlichen Forecast zu berechnen.
Wertereihen und Modelle
Ein Forecast ist nur auf Werten möglich, die sich über eine Zeitachse mit gleichartigen Zeitentitäten (Tage, Wochen, Monate) erstrecken, z.B. Umsatz, Absatz, Reklamationen, etc. BOARD analysiert jede Wertereihe und teilt diese in verschiedene Typen ein. Davon abhängig werden verschiedene Prognosemodelle angewendet.
Discontinued (beendet)
Eine Zahlenreihe, deren Werte seit mind. 12 Monaten leer sind, wird als beendet eingestuft und für die Prognose nur mit Nullwerten berücksichtigt, da man davon ausgeht, dass hier keine Werte mehr entstehen werden.
Intermittend (intermittierend)
Eine Serie wird als intermittierend eingestuft, wenn diese oftmals 0 ist, aber dazwischen immer wieder Werte stehen. Hierfür wird das Croston-SBA Modell angewendet, welches einen konstanten Wert für die Prognose errechnet.
Smooth (glatt)
Eine Serie gilt als glatt, wenn diese in fast allen Zeitperioden einen Wert beinhaltet. Grundsätzlich werden alle Serien, die weder beendet noch intermittierend sind als glatt eingestuft. Hier wird dann ein Modell namens Idsi-ARX angewendet, welches den eingangs bereits erwähnten Wettbewerb verschiedener Methoden ausführt. Hierbei werden auch saisonale Aspekte berücksichtigt, die sich aus vergangenen Werten ableiten lassen. Ebenso werden Ausreißer ermittelt, damit diese den Forecast nicht verfälschen.
Kovariate
Kovariate sind Wertereihen, die in irgendeinem Zusammenhang mit der beobachteten Wertereihe stehen und damit deren Verlauf beeinflussen. Kovariate erstrecken sich nicht nur auf die Vergangenheit, sondern können auch zukünftige Werte enthalten. Eine kovariate Reihe wird von BOARD verworfen, wenn sich diese als nicht relevant für den Verlauf der beobachteten Wertereihe erweist.
Beispiel: Ein Händler von Ostereiern könnte eine kovariate Reihe hinzufügen, die für alle Tage der Ostersaison eine 1 beinhaltet und für die restlichen Tage des Jahres eine 0. BOARD evaluiert dann die Auswirkung der Ostersaison auf den vergangenen Umsatz und berücksichtigt dies beim Forecast, v.a. da die kovariate Serie auch zukünftige Ostersaisons enthält.
Vertrauen in die Vorhersage
Wir können BOARD auch einen „Vertrauensfaktor“ mitgeben, aus dem eine Ober- und Untergrenze ermittelt wird, in der sich die tatsächlichen Werte mit der angegebenen Wahrscheinlichkeit bewegen werden. Geben wir z.B. eine Konfidenz von 75% an, dann errechnet BOARD einen Forecast-Korridor, in dem sich die tatsächlichen Werte mit einer Wahrscheinlichkeit von 75% bewegen werden.
Konfiguration einer Absatzprognose in BOARD
Genug der Theorie. Jetzt gehen wir auf die Konfiguration einer Absatzprognose in BOARD ein, um das Thema etwas griffiger zu gestalten. Voraussetzung ist eine BEAM Predictive Lizenz. Dann können wir in der BOARD Datenbank auf BEAM / Predictive Analytics klicken, um den Szenario Editor zu öffnen.

Hier legen wir zuerst ein neues Szenario an und nennen es in unserem Beispiel „Simple Forecast“. Dann wählen wir den Ziel-Cube „Forecast“ aus, in den BOARD den Forecast speichern soll. Diesen haben wir vorher mit den gleichen Dimensionen und vom gleichen Typ angelegt, wie den Absatz-Cube, den wir forecasten möchten. Der Absatz-Cube enthält verkaufte Stückzahlen über die Zeitachse, aufgerissen nach Monat, Absatzkanal und Produktgruppe. Außerdem kann hier noch eine spezifische Selektion definiert werden und ob der Ziel-Cube vor dem Berechnungslauf geleert werden soll. Auf eine zusätzliche Selektion verzichten wir.
Wir erinnern uns, für beendete und intermittierende Wertereihen gibt es vorgegebene Methoden, die wir nicht verändern können. Lediglich für glatte Serien, auf die die Idsi-ARX Methode angewendet wird, haben wir Einfluss.

Zunächst definieren wir die zu berücksichtigenden Perioden, die entweder fest angegeben werden, oder einfach gemäß der Selektion in den Cube geladene Perioden. Die letzte Periode kann ignoriert werden, falls diese das Ergebnis zu stark verfälschen würde. Ein Prognosehorizont von 0 bedeutet, dass die Prognose bis zum Ende der Zeitachse berechnet wird. Alternativ kann eine Anzahl von Perioden angegeben werden. Wenn der Cube nach Monaten aufgerissen ist, dann würde eine 12 z.B. 12 Monaten in die Zukunft entsprechen.
Über die Globale Methode bestimmen wir, ob BOARD einen internen Wettbewerb zur Bestimmung der besten Methode ausführt, oder wir können die Methode einschränken. Es empfiehlt sich, diese Entscheidung BOARD als Wettbewerb zu überlassen. Dann kommt die bereits angesprochene Konfidenz, aus der eine Ober- und Untergrenze ermittelt wird, in der sich die tatsächlichen Werte mit der angegebenen Wahrscheinlichkeit bewegen werden.
Wenn wir im Ziel-Cube (Forecast) mehrere Versionen definieren, dann werden diese von BOARD als separate Szenarien betrachtet und separat berechnet. Daraus entstehen dann nicht ausgerichtete Cube-Versionen im Ziel-Cube. Über die Einstellung zum Abgleich steuern wir, wie BOARD damit umgeht. Darauf gehen wir aber hier nicht näher ein. Wenn wir die Checkbox „Positive Werte“ aktivieren, dann werden alle Modelle ausgefiltert, die im Forecast negative Werte in einer Periode erzeugen würden.
Interessant ist die Einstellung um die Beobachtungswerte zusammenzuführen. Wenn das aktiviert wird, dann werden alle Werte aus dem Quell-Cube (z.B. Absatzzahlen) in den Forecast-Cube kopiert und um die Forecastwerte ergänzt. Damit entsteht ein fortlaufender Cube, bei dem die aktuellen Werte nahtlos in den Forecast übergehen. Das nimmt uns allerdings die Möglichkeit, den Verlauf des Forecasts im Diagramm mit einer anderen Farbe darzustellen.
Und schließlich definieren wir noch den Quell-Cube (beobachteter Cube) mit unseren verkauften Stückzahlen, für den wir die Prognose berechnen möchten. Es kann nur ein beobachteter Cube definiert werden. An dieser Stelle können wir auch weitere kovariate Cubes einfügen. Kovariate Cubes können beliebig viele definiert werden. Das wirkt sich natürlich zusammen mit der Anzahl der Dimensionen im Quell- und Ziel-Cube auf die Laufzeit aus.
BOARD produziert während des Prognoselaufs nützliche Ausgaben, die in eigens dafür zu definierenden Cubes gespeichert werden können:

Auf alle Ausgaben gehen wir hier nicht ein, interessant sind z.B. die Ober- und Untergrenze und die Ausreißer (Outliers). Nach dem Lauf sehen wir im Diagramm rechts eine Visualisierung des Ergebnisses. Die Größe des Punktes gibt die Anzahl der analysierten Perioden an, z.B. Monate. Auf der x-Achse werden Fehler angetragen, d.h. wenn der Punkt nach rechts wandert, sind Fehler aufgetreten, die auch in den Ausgabecubes gespeichert werden können. Auf der y-Achse sehen wir die Ausdehnung der Ober- und Untergrenze.
Wenn alles definiert wurde, speichern wir das Szenario und Klicken auf den grünen Ausführen-Knopf oben. Beim ersten Ausführen müssen wir auch die Lernphase durchlaufen. Ab der 2. Ausführung können wir uns entscheiden, diese wegzulassen und die bereits in der 1. Lernphase ermittelte Methode einfach für den Forecast anzuwenden. Wenn es das Zeitfenster zulässt, sollte die Lernphase immer wieder durchlaufen werden, da ja täglich neue Ist-Werte dazukommen, die die Prognose-Methode beeinflussen.
Darstellung des Forecasts
Die Darstellung unseres Predictive Forecast ist dann sehr einfach. Wir erstellen ein Diagramm, in dem wir den Quell-Cube (Absatzzahlen) und den Forecast-Cube als Linien darstellen. Durch die unterschiedlichen Farben wird sofort deutlich, ab wo der Forecast beginnt. Zusätzlich können wir noch die Ober- und Untergrenze als Fläche darstellen und erreichen dadurch die Visualisierung des Forecast-Korridors.
