26. Oktober 2022
Im Bereich der Marketing Technologien (MarTech) sprechen wir gerne metaphorisch von einem Dschungel, denn die Thematik erweist sich als vielseitige Landschaft mit unterschiedlichen Terrains und Disziplinen. Aufgrund der schieren Masse läuft man leicht Gefahr den Überblick zu verlieren. Im Rahmen dieser Metaphorik lässt sich Data Science als nützliches Werkzeug-Set verstehen, welches zur Erkundung des Marketing Technologie Dschungels nicht fehlen sollte. In unserem Blogbeitrag „Data Science – Das Werkzeug-Set für die erste Expedition in den MarTech Dschungel“ haben wir bereits erläutert, was Data Science ist und welche Vorteile es für Kund*innen und Unternehmen gleichermaßen birgt. Nun möchten wir uns den grundlegenden Rahmenbedingungen, die eine Organisation für die Nutzung von Data Science sicherstellen sollte, widmen.
Damit Machine Learning, also die maschinelle und intelligente Mustererkennung in unüberschaubaren Datenmengen, im Rahmen von Data Science funktionieren kann, müssen gewisse Rahmenbedingungen erfüllt sein. Im Folgenden stellen wir zwei Voraussetzungen für gängige Machine-Learning-Methoden vor: die Datengrundlage und die Evaluierung.
Die Datengrundlage setzt sich aus historischen Kundendaten zusammen. Dazu zählen meist demographische Daten wie Alter, Geschlecht und Familienstand und geographische Angaben wie Adresse und Postleitzahl. Diese Basisdaten werden auch als unabhängige Variablen bezeichnet.
Abhängige Variablen oder Zielvariablen hingegen sind jene Variablen, die mithilfe von Machine Learning vorausgesagt werden sollen. Zum Beispiel: Wird ein Kunde oder eine Kundin abspringen? Ja oder nein. Wie hoch ist der Customer Lifetime Value (CLV)? Je nach Kontext der Anwendung sind unterschiedliche Daten relevant, zum Beispiel:
Für Unternehmen im E-Commerce:
Entscheidend in Hinblick auf die Datengrundlage ist die Einheitlichkeit der Daten. Oft gibt es in großen Unternehmen sogenannte Datensilos. Das sind isolierte Datenbanken mit Daten aus unterschiedlichen Quellen, die pro Abteilung gesammelt werden und nicht in Bezug zueinander stehen. Diese Silos gilt es aufzulösen, indem die Daten vereinheitlicht und an einer zentralen Stelle allen Unternehmenseinheiten zugänglich gemacht werden. Customer Data Platforms (CDP) stellen hierfür eine gängige Lösung dar.
Tipp: Es ist generell ratsam, Datensätze vor ihrer Analyse auf menschliche Fehler zu überprüfen.
Ebenso wichtig wie die Datengrundlage ist die Evaluierung des verwendeten Analysemodells. Dazu muss die Qualität der Algorithmen regelmäßig überprüft werden. In einem konkreten Fall kann das etwa so aussehen:
Es wird untersucht, wie viele Kund*innen im Kaufprozess abgesprungen sind (Customer Churn). Die logische Frage zur Kontrolle lautet: Wie viele dieser Kund*innen haben das Analysemodell erkannt und wie viele nicht?
Eine weitere wichtige Fragestellung im Rahmen der Evaluierung: Auf welcher Basis hat das Modell Entscheidungen getroffen, und welche Variablen hatten den größten Einfluss auf die Vorhersage?
Tipp: Unabhängig vom Kontext ist der sogenannte Gini-Index (ein statistisches Maß zur Messung der Ungleichheit einer Verteilung) ein geeignetes Tool zur Evaluation des maschinellen Lernens. Allerdings nur bei binären Zielvariablen: Kauf: Ja (0) – Nein (1)
Data Science kann vielseitig als Werkzeug-Set für die erste Expedition in den MarTech Dschungel eingesetzt werden. Hierfür müssen allerdings erst gewisse Rahmenbedingungen erfüllt werden. Wir haben zwei Bedingungen für gängige Machine-Learning-Methoden vorgestellt: die Datengrundlage und die Evaluierung. Entscheidend in Hinblick auf die Datengrundlage ist deren Einheitlichkeit. Oft gibt es in großen Unternehmen sogenannte Datensilos. Das sind isolierte Datenbanken mit Daten aus unterschiedlichen Quellen, die pro Abteilung gesammelt werden und nicht in Bezug zueinander stehen. Diese Silos gilt es aufzulösen, indem die Daten vereinheitlicht und an einer zentralen Stelle allen Unternehmenseinheiten zugänglich gemacht werden.
Ebenso wichtig wie die Datengrundlage ist die Evaluierung des verwendeten Analysemodells. Dazu muss die Qualität der Algorithmen regelmäßig überprüft werden. Die logische Frage zur Kontrolle lautet: Wie viele davon hat das Analysemodell erkannt und wie viele nicht?
Eine weitere wichtige Fragestellung im Rahmen der Evaluierung: Auf welcher Basis hat das Modell Entscheidungen getroffen, und welche Variablen hatten den größten Einfluss auf die Vorhersage? Wenn die beschreibenden Rahmenbedingungen erfüllt sind, kann die Expedition in den MarTech Dschungel starten!
Neugierig geworden?
Tiefere Einblicke in das Thema MarTech gibt unser Guide „Surviving the MarTech Jungle“.
Nichts verpassen.
Blogartikel abonnieren.