Prédiction de Churn Client

Modèle ML production-ready pour identifier les clients à risque de churn

Projet de démonstration - Simulation de cas d'usage avec données synthétiques

Python 3.9+ XGBoost FastAPI Production-Ready

Problème Client

18%
Taux de churn annuel
€720K
Revenus perdus/an
0 jours
Détection proactive

Une plateforme e-commerce B2C perdait 18% de ses clients chaque année, soit environ €720K de revenus récurrents perdus. L'équipe marketing dépensait massivement en acquisition sans stratégie de rétention ciblée.

Question business : Comment identifier les clients à risque de churn 30 jours avant leur départ pour activer des actions de rétention ciblées ?

Solution Proposée

Modèle ML XGBoost

Gradient Boosting avec features engineering avancé : comportementales, transactionnelles, engagement, temporelles

API REST Temps Réel

FastAPI pour scoring en temps réel avec latence <100ms. Scoring quotidien de tous les clients actifs.

Intégration CRM

Webhook vers l'outil marketing pour actions automatiques. Campagnes email personnalisées selon le score de risque.

Impact Business

-25%
Taux de churn
18% → 13.5%
+€180K
Revenus sauvés/an
180 clients retenus
87%
F1-score
Précision du modèle
3.8x
ROI campagne
vs. 1.2x avant

Calcul du ROI

  • Clients sauvés : 4.5% de churn évité × 4000 clients = 180 clients/an
  • Valeur client moyenne : €1000/an
  • Revenus sauvés : 180 × €1000 = €180K/an
  • Coût projet : €25K
  • ROI : 620% sur 1 an

Approche Technique

Stack Technique

Python 3.9+
XGBoost
FastAPI
PostgreSQL
Docker
MLflow

Features Engineering

Comportementales

  • Fréquence d'achat (30j, 90j)
  • Délai depuis dernier achat
  • Panier moyen
  • Diversité catégories

Transactionnelles

  • Nombre total de commandes
  • Revenus totaux
  • Valeur moyenne par commande
  • Taux de remboursement

Engagement

  • Taux d'ouverture email
  • Visites site web
  • Taux d'abandon panier
  • Temps sur site

Résultats

F1-Score
0.87
Precision
0.82
Recall
0.91
AUC-ROC
0.89

"Le modèle nous a permis d'identifier 180 clients à risque que nous avons réussi à retenir. L'investissement a été rentabilisé en 2 mois."

— Directeur Marketing, E-commerce

Visualisations & Storytelling

Le Problème

Montre comment l’inactivité fait exploser le churn et où se situent les segments à risque. Permet d’identifier un seuil d’alerte opérationnel.

Voir la visualisation

La Solution ML

Détaille les métriques de performance et les variables réellement prédictives pour expliquer le churn aux équipes business.

Voir la visualisation

Impact Business

Quantifie la baisse du churn, les revenus sauvés et le ROI des campagnes de rétention déclenchées par le modèle.

Voir la visualisation

Dashboard Complet

Une vue d’ensemble du projet : churn, performance, segments et impact financier, pour une lecture rapide en entretien.

Voir le dashboard

Démonstration

Utilisation de l'API

# Scoring individuel
curl -X POST "http://localhost:8000/predict" \
  -H "Content-Type: application/json" \
  -d '{
    "days_since_last_purchase": 45,
    "purchase_frequency_30d": 2,
    "avg_basket_value": 120.0,
    ...
  }'

# Réponse
{
  "churn_proba": 0.72,
  "risk_level": "high"
}

Installation Rapide

  1. Cloner le repository
  2. Créer un environnement virtuel
  3. Installer les dépendances
  4. Entraîner le modèle
  5. Lancer l'API
Documentation

Prêt à démarrer ?

Explorez le code, testez le modèle, ou contactez-moi pour une collaboration