Grup Dinosol: cóm segmentar una base de clients d'un supermercat

Problema

Identificar i quantificar els diferents grups de clients d‟un supermercat és el primer pas per definir una estratègia CRM diferenciada per a cada grup de client.

Solució

Desenvolupament de dos models de segmentació (RFM i Clustering) per identificar grups homogenis i classificar els clients en ells.

Resultats

Trobem grups de clients amb comportament diferent i els vam poder descriure en termes demogràfics, patró de compra, cicle de vida, recència, freqüència i valor de compra…

Context

No hi ha dos clients iguals. Cadascú té el seu perfil, preferències, hàbits de compra, cistella de productes. Com podríem agrupar els clients de comportament semblant? El gran nombre de variables i el volum de dades de l’històric de transaccions d’un supermercat fa que la segmentació no sigui un repte fàcil.

Quins són els meus objectius, quines dades necessito...

Definir els objectius ens condueix a preguntar quines dades necessito i tinc disponibles:

  • Definir l’estratègia principal per grup: reconeixement, up&cross selling, retenció i abandó.
  • Definir el volum d’inversió i proposta de valor.
  • Definir el pla de contactes.

Models de segmentació de clients...

Desenvolupar un model és un procés que passa per les fases següents:

Fase Exploratòria

  • Estadístiques de resum de les variables per tipus de dades
  • Distribucions de variables per tipus de dades
  • Correlacions i associacions importants entre les variables.
  • Identificació de les variables rellevants per a lestimació de la demanda.

Fase Preparació

  • Eliminació d’outliers
  • Transformació de les dades i creació de noves variables: normalització, categorització, índexs, variables indicadores, etc.
  • Selecció de la mostra: Train (75%) i Test (25%)

Fase Modelització

Model Clúster, en dues etapes. Eina d’exploració dissenyada per descobrir les agrupacions naturals d’un conjunt de dades. Permet analitzar grans bases de dades mitjançant la construcció dun arbre de característiques de conglomerats que resumeix els registres. Permet treballar conjuntament amb variables de tipus mixt (qualitatives i quantitatives).

Step1: Construcció de l’arbre Cluster Features (CF). Agregació de casos, dins un mateix node o formant un altre nodes fulles (nombre elevat de preclusters). Ens basem en la similaritat existent, usant les mesures de distància.
Step 2: Aplicació del mètode jeràrquic (Agrupació dels nodes fulles). Fem servir un algorisme aglomeratiu de clústers, produint un rang de solucions. Per determinar el nombre de clústers, cada solució és comparada usant els criteris Schwarz’s Bayesian Criterion (BIC) o Akaike Information Criterion (AIC).

Fase de Validació

Comparació dels resultats de les mostres aleatòries Train (75%) i la Test (25%). El model Clúster obtingut és correcte si els resultats entre les dues mostres són consistents respecte al nombre de clústers i el perfil de cadascun.

Com fer accionable el model...

Para hacer más comprensible los resultados del modelo, describimos y posicionamos cada grupo obtenido en una matriz de Lealtad / Valor. Este gráfico nos ayuda a realizamos una segunda agrupación para poder gestionar a nivel operativo la estrategias principal, el volumen de inversión y la propuesta de valor a cada grupo, así como el plan de contacto.