Passer au contenu principal

Attribution Science

Le secret pour réussir des tests A/B et d’incrémentalité

Taille d’échantillon et effet minimal détectable

La réussite d’un test A/B ou d’un test d’incrémentalité ne repose pas uniquement sur le design expérimental ou les KPIs suivis. Un élément fondamental détermine la fiabilité de tes conclusions : la taille d’échantillon (ou la durée du test). Et c’est souvent là que tout se joue.


Pourquoi la taille d’échantillon explose quand l’effet attendu diminue

Lorsque l'on cherche à détecter de plus petits uplifts, la taille d’échantillon nécessaire augmente de façon très important.
Concrètement, le nombre d’observations requis est proportionnel à :

💡
Cela signifie que viser un uplift détectable de 5 % au lieu de 10 % demande 4 fois plus de données ou de temps.

Pourquoi ?

Deux raisons principales :

  • La variance domine : plus l’effet est petit, plus il est noyé dans le bruit statistique. Il faut donc davantage de données pour le distinguer.
  • Les seuils de rigueur (alpha, puissance) : plus le test est strict (par ex. α=5 %, puissance=80 %), plus la taille d’échantillon doit être grande.

La règle d’or à retenir pour planifier un test A/B

💡
Si on divise par 2 l’uplift que l'on souhaite détecter, il faut multiplier par 4 le volume ou la durée nécessaire.

Cette règle simple reste vraie tant que l'on garde constants :

  • Le seuil de signification (α)
  • La puissance statistique (1−β)
  • La variance du KPI
  • Le ratio test/contrôle

La formule pratique pour estimer la taille d’échantillon

Pour un KPI binaire (par exemple un taux de conversion) avec :

  • un taux de base p
  • un uplift relatif u
  • une allocation 50/50
  • α = 5 % et puissance = 80 %

On obtient :

L’intuition est la même pour des métriques continues (on remplace p(1−p) par la variance σ²) : le dénominateur contient le carré de l’effet attendu.


Exemples concrets

Uplift viséMultiplicateur de n
10 % → 5 %×4
6 % → 3 %×4
4 % → 2 %×4

Autrement dit, réduire de moitié le MDE multiplie par quatre la taille d’échantillon.


Implications concrètes pour des campagnes et audits d’attribution

1. Plan média

Si le trafic est limité, choisir un MDE réaliste (8–12 %) pour obtenir des résultats exploitables en quelques semaines, pas en plusieurs mois.

2. Design du test

Augmenter la sensibilité :

  • Lancer en période de fort trafic
  • Cibler des audiences plus susceptibles de convertir
  • Simplifier les métriques pour stabiliser ton KPI

3. Trade-offs à prévoir

Si on souhaite mesurer un petit effet (3–5 %), préparer :

  • Plus de zones ou de segments
  • Des périodes d’observation plus longues
  • Une allocation test plus large