Grupo Dinosol: cómo segmentar una base de clientes de un supermercado

Problema

Identificar y cuantificar a los distintos grupos de clientes de un supermercado es el primer paso para definir una estrategia CRM diferenciada para cada grupo de cliente.

Solución

Desarrollo de dos modelos de segmentación (RFM y Clustering) para identificar grupos homogéneos y clasificar a los clientes en ellos.

Resultados

Encontramos grupos de clientes con comportamiento distinto y los pudimos describir en términos demográficos, patrón de compra, ciclo de vida, recencia, frecuencia y valor de compra…

Contexto

No hay dos clientes iguales. Cada uno tiene su perfil, preferencias, hábitos de compra, cesta de productos. ¿Cómo podríamos agrupar a los clientes de comportamiento parecido? El gran número de variables y volumen de datos del histórico de transacciones de un supermercado hace que segmentación no sea un reto fácil.

Cuáles son mis objetivos, qué datos necesito...

Definir los objetivos nos conduce preguntar qué datos necesito y tengo disponibles:

  • Definir la estrategia principal por grupo: reconocimiento, up&cross selling, retención y abandono.
  • Definir el volumen de inversión y propuesta de valor
  • Definir el plan de contactos

Modelos de segmentación de clientes...

Desarrollar un modelo es un proceso que pasa por las siguientes fases:

Fase Exploratoria

  • Estadísticas de resumen de las variables por tipo de datos
  • Distribuciones de variables por tipo de datos
  • Correlaciones y asociaciones importantes entre las variables.
  • Identificación de las variables relevantes para la estimación de la demanda.

Fase Preparación

  • Eliminación de outliers
  • Transformación de los datos y creación de nuevas variables: normalización, categorización, índices, variables indicadoras, etc.
  • Selección de la muestra: Train (75%) y Test (25%)

Fase Modelización

Modelo Cluster, en dos etapas. Herramienta de exploración diseñada para descubrir las agrupaciones naturales de un conjunto de datos. Permite analizar grandes bases de datos mediante la construcción de un árbol de características de conglomerados que resume los registros. Permite trabajar conjuntamente con variables de tipo mixto (cualitativas y cuantitativas). 

Step1: Construcción del árbol Cluster Features (CF). Agregación de casos, dentro de un mismo nodo o formando otro nodos hojas (número elevado de preclusters). Nos basamos en la similaridad existente, usando las medidas de distancia.
Step 2: Aplicación del método jerárquico (Agrupación de los nodos hojas). Usamos un algoritmo aglomerativo de clusters, produciendo un rango de soluciones.Para determinar el número de clusters, cada solución es comparada usando los criterios Schwarz’s Bayesian Criterion (BIC) o Akaike Information Criterion (AIC).

Fase de Validación

Comparación de los resultados de la muestras aleatorias Train (75%) y la Test (25%). El modelo Cluster obtenido es correcto si los resultados entre las dos muestras son consistentes respecto al número de clusters y el perfil de cada uno.

Cómo hacer accionable el modelo...

Para hacer más comprensible los resultados del modelo, describimos y posicionamos cada grupo obtenido en una matriz de Lealtad / Valor. Este gráfico nos ayuda a realizamos una segunda agrupación para poder gestionar a nivel operativo la estrategias principal, el volumen de inversión y la propuesta de valor a cada grupo, así como el plan de contacto.