Zum Hauptinhalt springen

Customer Journey Analytics im E-Commerce mit Markov-Ketten

 

Abschlussarbeit wird vom Berufsverband Deutscher Markt- und Sozialforscher e. V. ausgezeichnet

Ein Großteil der deutschen Wohnbevölkerung nutzt das Internet, um sich über Produkte zu informieren und diese auch zu kaufen. So wurden 2014 allein in Deutschland ca. 42 Mrd. Euro im Onlinehandel umgesetzt. Kundengewinnung und -bindung durch das Internet werden daher zu strategischen Aspekten der Unternehmensführung. Ich befasste mich 2013/14 am Lehrstuhl für Statistik und Ökonometrie der Universität Erlangen-Nürnberg in Kooperation mit der GfK SE Marketing Science mit der Modellierung des Internetnutzungsverhaltens im Reisemarkt. Die daraus resultierende Abschlussarbeit wurde im Frühjahr vom Bundesverband der deutschen Marktforschung als beste Arbeit des Jahres ausgezeichnet. Demnach ermöglicht ein besseres Verständnis der Internetnutzer zum Beispiel eine tiefer gehende Personalisierung von Webseiten oder auch eine zielgerichtete Aussteuerung von Werbeinhalten. Im wissenschaftlichen Interesse stehen vor allem die eigentliche Struktur des Nutzerverhaltens und die dahinterliegenden Determinanten.

Bisher noch nicht explorativ genutzte Datengrundlage

Die Arbeit nutzt einen bisher in diesem Kontext noch nicht verwendeten Datenpool der GfK SE, der Webseitenkontakte innerhalb des Reisemarktes protokolliert und mit einer großen Menge an Zusatzinformationen (Buchungs- und Individualcharakteristika) anreichert. Hierbei kommen Daten aus Beobachtungs- (GfK Media Efficiency) und Befragungsquellen (GfK TravelScope) zum Einsatz. In das Modell gehen nicht nur die erwähnten Charakteristika mit ein, sondern auch Recherchen von Kunden, die schließlich ein Produkt offline gekauft haben.

Modellierung nach umfangreicher Variablenselektion

Nach einer umfassenden Datenvorbereitung wird eine Markov-Kette modelliert: Ansatzpunkt zur Modellierung von Heterogenität ist die Übergangswahrscheinlichkeit, die hier für jede Etappe der Journey pro User separat betrachtet wird. Durch den Einsatz von Variablenselektionsverfahren können Variablen mit einem hohen potenziellen Beitrag zur Erklärung der Heterogenität im Modell identifiziert werden und die große Menge an potentiell zu schätzenden Koeffizienten lässt sich reduzieren. Es werden Stepwise-Regression und Lasso-Schätzungen eingesetzt. Die Auswertung der Kreuzvalidierungsstudien zeigt jedoch, dass sich in diesem Kontext die Lasso-Schätzung besser zur Auswahl von signifikanten Kovariaten eignet.

 

modellierungsprozess

Erkenntnisse für die Praxis

Es lassen sich beispielsweise folgende Erkenntnisse festhalten:

  1. Die Customer Journey lässt sich anhand einer Markov-Kette erster Ordnung modellieren - die momentan besuchte Webseite hat also Einfluss auf die als Nächstes "angesurfte" Seite.
  2. Es lässt sich weiter schließen, dass es nicht die Nutzer an sich sind, die sich in ihrem Informationssuchverhalten von anderen Nutzern unterscheiden, sondern dass der Prozess der Web Journey vielmehr vom eigentlichen Ziel, dem gekauften Produkt, abhängt. So unterscheidet sich das Informationssuchverhalten für eine Flugreise signifikant von dem für eine Hotelbuchung oder eine Pauschalreise.
  3. Innerhalb der Journeys erkennt man häufig einen beständigen Wechsel zwischen meistens zwei Websitekategorien. Dies ist ein Indiz dafür, dass der Kunde oft ein Bündel von Reiseprodukten erwirbt (z. B. Flug und Hotel) und dazu auch parallel recherchiert.
  4. Die Unterscheidung eines Informationsprozesses nach der Tätigung des Kaufs online oder offline ist nicht so groß wie vielleicht vermutet; einzig die Länge der Journeys unterscheidet sich - deren Struktur ist jedoch ähnlich.

Die gewonnenen Erkenntnisse bringen wichtige Implikationen für die Praxis der Marktforschung und der Werbetreibenden mit sich. So werden Hinweise für den optimalen Einsatz von Webseiten-Personalisierungs- und Cross-Selling-Maßnahmen gegeben. Darüber hinaus werden Grundlagen für die weitere Forschung und vor allem die Datenaufbereitung sowie -vorverarbeitung im Umfeld der Customer Journey geschaffen.

Dr. Michael Allgöwer
Dr. Michael Allgöwer
Management Consultant
Machine Learning ist Michaels langjährige Spielwiese. Michael ist überzeugt, dass gutes Machine Learning eine Menge Branchenverständnis voraussetzt, und er liebt es, sich dieses Verständnis immer wieder zu erarbeiten. Sein neuestes Lieblingsthema ist Reinforcement Learning.
#MachineLearning #ReinforcementLearning #HumanIntelligence