Comment choisir entre Markov et Shapley pour une attribution Data-Driven ?
Introduction
Dans un contexte où les parcours clients sont de plus en plus complexes, le choix du bon modèle d’attribution est essentiel pour piloter efficacement les investissements médias.
Deux approches dominent l’attribution multi-touch : l'algorithme de Markov et celui de Shapley.
Bien qu’ils visent le même objectif — quantifier la contribution réelle de chaque canal marketing à la conversion — leurs logiques, avantages et limites diffèrent profondément.
1. Le modèle de Markov : comprendre les transitions entre canaux
Le modèle de Markov repose sur une logique de chaînes de probabilité : il modélise les transitions d’un canal à un autre jusqu’à la conversion.
L’idée centrale est de mesurer l’impact de chaque canal en observant ce qu’il se passe lorsqu’on le retire du parcours (removal effect).
Avantages
- Capture l’ordre des interactions et leur enchaînement réel.
- Excellente lecture pour les parcours courts et répétitifs.
- Utile pour valoriser les canaux de retargeting ou de fin de funnel.
Limites
- Sensible à la sparsité des données : nécessite un volume suffisant de parcours homogènes.
- Moins pertinent pour les parcours longs ou très variés.
Quand utiliser Markov ?
Lorsque vos chemins de conversion sont structurés et fréquents :
- campagnes de remarketing,
- séquences Paid Social → Paid Search,
- tunnels basés sur du retargeting e-mail ou display.
2. Le modèle de Shapley : la contribution équitable de chaque canal
Inspiré de la théorie des jeux coopératifs, le modèle de Shapley cherche à mesurer la valeur marginale moyenne de chaque canal sur l’ensemble des combinaisons possibles.
Autrement dit, il attribue le crédit en fonction de toutes les combinaisons dans lesquelles le canal intervient.
Avantages
- Offre une vision équitable et robuste des contributions, indépendamment de l’ordre d'apparition dans le parcours.
- Idéal pour les environnements multi-canaux et hétérogènes.
- Plus résistant à la sparsité et aux séquences irrégulières.
Limites
- Calcul plus coûteux (combinatoire élevée, nécessite souvent des approximations Monte-Carlo).
- Ne reflète pas l’ordre réel des touches.
Quand utiliser Shapley ?
Lorsque vos parcours sont variés, longs, ou comportent des canaux d’amorçage :
- YouTube, TikTok, Influence, PR, ou Social organique.
- campagnes awareness et consideration,
- stratégies full-funnel avec overlap fort entre médias.
3. Comment choisir entre Markov et Shapley ?
Tableau comparatif
| Critère | Markov | Shapley |
|---|---|---|
| Logique | Chaîne de transitions | Théorie des jeux coopératifs |
| Sensibilité à l’ordre | Forte | Faible |
| Robustesse à la sparsité | Faible | Forte |
| Type de parcours | Courts, répétitifs | Longs, hétérogènes |
| Canaux typiques | Retargeting, Search | Social, Vidéo, PR |
| Complexité de calcul | Moyenne | Élevée |
| Vision stratégique | Opérationnelle (tactique) | Globale (stratégique) |
4. La meilleure approche : un modèle hybride Markov + Shapley
Dans la pratique, les entreprises les plus matures combinent les deux :
- Segmentez vos parcours :
- Cluster A : parcours courts / fin de funnel → Markov
- Cluster B : parcours longs / cross-canaux → Shapley
- Pondérez les résultats selon le poids de chaque cluster dans vos ventes.
- Mesurez la cohérence avec des tests d’incrémentalité (holdout, diff-in-diff, geo-split).
Cette approche permet de capitaliser sur la précision tactique de Markov tout en profitant de la robustesse stratégique de Shapley.
5. En résumé
| Situation | Recommandation |
|---|---|
| Parcours structurés, séquentiels | Markov |
| Parcours variés, multi-funnel | Shapley |
| Environnement mixte (Search + Social + Display)** | Hybride Markov + Shapley |
| Faible volume de données | Shapley (échantillonné) |
| Besoin de lecture business simple | Markov simplifié |