Artikel

Machine Learning – Kundensegmentierung mit K-Means neu lernen

Beitrag von Christian Setzwein
27. Januar 2021

Kundensegmentierung – ein alter Hut?

Das Clustern von Kunden zu Segmenten, in denen sich jeweils ähnliche Kunden befinden, gehört zu den Standardwerkzeugen in allen Vertriebs- und Marketingabteilungen. Schließlich möchte man ähnlichen Kunden ähnliche Angebote machen, die bestenfalls auch noch den jeweiligen Kundeninteressen entsprechen. Häufig beruht die Segmentierung auf Erfahrungswissen, das über viele Jahre gewachsen ist. Sie basiert z.B. auf Unterscheidungen von Features wie Alter, Geschlecht und dem bisherigen Kaufverhalten. In der Vergangenheit beruhte die Berechnung oft auf sehr wenigen Features, damit der Berechnungsaufwand, den man bei der initialen Definition leisten konnte, nicht überhand nahm. Auch die Auswahl der Features selbst war viel der Erfahrung der jeweiligen Vertriebs- und Marketingkolleg*innen und der Datenlage, die damals noch dünner war, geschuldet.

Wissen, Datenlage und Machine Learning Möglichkeiten

Die Möglichkeiten einer besseren Segmentierung der Kunden hat sich in den letzten Jahren deutlich verbessert:

Das interne Know-how über die Kunden hat sich durch Kundenzentrierung deutlich erweitert (sowohl datengestützt als auch bezogen auf das „Bauchgefühl“).
Die Datenmenge hat sich radikal erweitert, es steht eine weitaus größere Auswahl an Features mit mehr Daten zur Verfügung.
Es stehen Algorithmen des Machine Learning bereit, die für den jeweiligen Anwendungszweck optimale Ergebnisse liefern können.

Durch den Einsatz von Machine Learning ist es außerdem möglich,

weitaus größere Datenmengen zu verarbeiten.
verschiedene Segmentierungen im Echtzeitbetrieb zu testen.
unterschiedliche Segmentierungen parallel für unterschiedliche Aktionen gegenüber dem Kunden zu betreiben.

k-Means – ein einfacher Algorithmus zur Kundensegmentierung

Am Beispiel des Algorithmus k-Means möchte ich Ihnen erläutern, mit wie wenig Aufwand und wie wirkungsvoll Kundensegmentierung auch in Ihrem Unternehmen verbessert werden kann. Dieser Algorithmus ist der einfachste Algorithmus, den man in diesem Bereich verwenden kann (es gibt für bestimmte Anwendungsszenarien sicherlich besser passende Methoden). Er verwendet jedoch Konzepte wie Ähnlichkeit und Entfernung, die das Grundprinzip allgemein gut verständlich machen.

k-Means gehört zur Familie der unsupervised-Learning Algorithmen. Es liegen also ausschließlich Datensätze vor, bei denen nicht bekannt ist, zu welchem Segment sie gehören. Aufgabe des unsupervised-Learning Algorithmus k-Means ist es, diese Struktur ohne Vorgaben von Außen (Musterdaten wie beim supervised-Learning) zu finden. (Um diesen Unterschied besser zu verstehen, eignet sich der Artikel Künstliche Intelligenz – ein Einstieg.)

Um das Vorgehen bei k-Means leichter zu verstehen, wechseln wir kurz das Beispiel: Wir stellen uns vor, dass wir für ein Logistikunternehmen arbeiten, das 5 Standorte für ein Verteilzentrum plant. Die x- und y-Koordinaten auf der Karte aller 5.000 Lieferorte sind bekannt (das sind unsere Datensätze). Ziel ist es jetzt, die 5 Verteilzentren so zu platzieren, dass die Entfernung zwischen den Lieferorten und den Verteilzentren möglichst gering ist. Das „k“ für k-Means ist 5 (Anzahl der Verteilzentren).

Der Algorithmus funktioniert nun wie folgt:

Wähle die Koordinaten der Zentren der k Cluster (Cluster=Verteilgebiete) zufällig. Diese werden in diesem Zusammenhang auch Zentroiden genannt.
Berechne für jeden Punkt p der Lieferorte die Abstände zu den Zentroiden und ordne den Lieferort dem Zentroiden zu, der am nächsten ist.
Berechne nun für alle k Cluster die Koordinaten des Mittelpunkts des Clusters neu. So erhalten wir die Koordinaten für neue Zentroiden.
Führe die Schritte 2. und 3. immer abwechselnd aus, solange bis sich die Clusterzuordnungen der Lieferorte nicht mehr ändern. Dann sind die k-Zentroiden und die Cluster gefunden, wir kennen die optimalen Koordinaten für unsere Verteilzentren und wissen, welcher Lieferort in welchem Verteilgebiet mit welchem Verteilzentrum liegt.

Übertragen wir nun unseren Algorithmus auf das Beispiel des Findens von neuen Kundensegmenten.

Die Koordinaten unserer Lieferorte sind nun die Eigenschaften eines Kunden wie z.B. Alter oder Geschlecht. Wir können nun viele Eigenschaften wählen (mehr als die Koordinaten x und y wie gerade eben) und können auch unterschiedliche Modelle rechnen (andere Eigenschaften für unterschiedliche Modelle).
Wir müssen k, die Anzahl der Segmente, die gefunden werden sollen, festlegen. Auch hier kann man unterschiedliche Werte für k wählen und unterschiedliche Modelle rechnen. Dabei gibt es Verfahren, mit denen man ein möglichst optimales k bestimmen kann.
Wir folgen dem oben vorgestellten Algorithmus und erhalten jeweils k Segmente für die unterschiedlichen Modelle.
Wir analysieren die neu gefundenen Segmentstrukturen:
- Warum ist der Kunde x jetzt gemeinsam mit Kunde y in einem Segment?
- Wie unterscheidet sich die Segmentierung von unserer bisherigen Clusterung der Kunden?
- Welche neu gefundene Segmentierung ist für unsere Praxis am Besten nutzbar?
- Oder wollen wir unterschiedliche Segmentierungen in unterschiedlichen Kontexten verwenden?

Vorteile und Nachteile von K-Means

Wie gesagt, K-Means ist der einfachste der Algorithmen, die sich für Segmentierung und Clustering eignen. Für bestimmte Anwendungsszenarien gibt es sicherlich bessere Lösungen, das grundlegende Prinzip des Lernens macht er aber meiner Ansicht nach sehr schön deutlich.

Der Algorithmus hat folgende Vorteile:

Er ist einfach erklärbar.
Er ist einfach zu implementieren.
die Ausführung ist sehr schnell, Ergebnisse stehen zügig zur Verfügung

Der Algorithmus hat folgende Nachteile:

Man muss k, die Anzahl der Cluster, vorgeben.
Bei bestimmten Verteilungen der Daten im n-dimensionalen Raum liefert er schlechte Ergebnisse (Dichte der Daten, Verschlungenheit der Daten).
Das Verfahren geht schlecht mit Ausreißern um. (Das Erkennen von Anomalien ist ein weiteres großes Kapitel beim Thema Maschine-Learning.)
Nimmt man zu viele unterschiedliche Kundeneigenschaften, sprich Dimensionen im n-dimensionalen Raum, so liefert er schlechte Ergebnisse („Fluch der Dimensionalität“) .

Haben Sie für sich ein Anwendungsfeld für Segmentierung/Clustering entdeckt? Gerne stehe ich für Fragen zur Verfügung.

Auch interessant:

| Keine Kommentare