Le problème statistique des échelles 1-5
Les échelles 1-5 sont devenues le standard du web grand public. Elles sont visuellement intuitives (les étoiles) et faciles à compléter rapidement. Mais elles ont un inconvénient majeur : elles compriment l'information utile dans un intervalle trop étroit pour distinguer les bons acteurs des excellents.
Sur Google Business, regardez les fiches de débarrasseurs en Île-de-France : la grande majorité affichent des notes comprises entre 4,3 et 4,9. Concrètement, la fenêtre discriminante n'est pas 1 à 5, mais 4,3 à 4,9 — soit 0,6 point d'écart pour distinguer le bon du moyen, l'excellent du très bon. C'est trop peu.
Conséquence : deux entreprises avec des notes Google de 4,7/5 et 4,8/5 paraissent quasi-identiques au consommateur, alors que sur des dizaines de critères opérationnels (ancienneté, RC Pro, traçabilité, gestion des litiges), elles peuvent être très différentes. La compression statistique de l'échelle masque ces différences.
Pourquoi une échelle 0-10 résout ce problème
L'échelle 0-10 que nous appliquons multiplie l'amplitude discriminante. Sur nos évaluations de prestataires de débarras franciliens en 2026, les notes EDD s'échelonnent entre 5,3 et 8,4 — soit 3,1 points d'amplitude réelle. Cela permet de distinguer plusieurs niveaux qualitatifs :
- 9,0-10,0 : exceptionnel, conformité totale, transparence maximale (rare, aucun acteur de notre échantillon n'y atteint)
- 8,0-8,9 : excellent, structure professionnelle confirmée, ancienneté, conformité documentée
- 7,0-7,9 : très bon, prestataire fiable mais avec des points perfectibles
- 6,0-6,9 : moyen, à réserver à des dossiers simples
- 5,0-5,9 : limite, acteurs avec des marqueurs structurels préoccupants
- Moins de 5,0 : éliminés de notre sélection (aucun ne figure)
Cette granularité permet à un client de comprendre l'écart réel entre deux acteurs notés 7,8 et 8,2 — alors qu'avec une échelle 1-5 ces différences se compriment artificiellement.
Comment nous calculons la note
Notre note EDD est calculée sur 7 critères pondérés, chacun noté sur une échelle de 0 à 10 :
- Ancienneté de l'entreprise (pondération 15%) : moins d'1 an = 2/10, 1-3 ans = 5/10, 3-7 ans = 7/10, 7-15 ans = 9/10, +15 ans = 10/10
- Capital social (10%) : barème logarithmique de 1 € (0/10) à 50 000 €+ (10/10)
- Conformité documentaire (15%) : RC Pro à jour, comptes annuels publiés, mentions légales conformes
- Traçabilité opérationnelle (15%) : bordereaux de tri, partenariats éco-organismes documentés, transparence sur les filières
- Qualité commerciale (15%) : devis détaillé, transparence tarifaire, absence de pratiques de pression vente
- Réputation publique (15%) : analyse qualitative des avis (pas la note brute), gestion des avis négatifs, ancienneté de la présence en ligne
- Spécialisation et expertise (15%) : capacité à traiter des cas complexes (Diogène, succession à patrimoine ancien, indivisions)
Chaque critère est noté indépendamment, puis pondéré et agrégé. La note finale n'est jamais arrondie au demi-point — elle reste précise au dixième pour conserver l'information discriminante.
Pourquoi cette transparence importe
La méthodologie de notation est probablement le sujet le plus important pour évaluer la fiabilité d'un comparateur. Les éditeurs sérieux la publient ; les marketing déguisés la cachent. Nous publions intégralement la nôtre dans notre page méthodologie, avec :
- La liste complète des 7 critères et leurs pondérations
- Le barème de notation pour chaque critère
- Les sources de données utilisées (data.gouv.fr, BODACC, Pappers)
- Les filtres éliminatoires (un critère sur 7 noté à 3/10 ou moins entraîne exclusion automatique)
- Les conflits d'intérêts déclarés (statut partenaire vs non-partenaire)
- L'historique des révisions (toute modification de la note est tracée et datée)
Cela permet à un lecteur attentif de reconstituer notre raisonnement et, le cas échéant, de le contester sur des bases factuelles.
Comparaison avec d'autres échelles
Plusieurs comparateurs sectoriels ont fait des choix méthodologiques différents :
- UFC-Que Choisir : utilise plusieurs échelles selon les tests (1-5 pour les produits, 1-20 pour certains services). Le choix dépend du nombre de critères et de l'amplitude discriminante observée.
- 60 Millions de Consommateurs : échelles 1-20 ou pourcentages selon les enquêtes. Privilégie la précision quand les écarts entre acteurs sont fins.
- Wirecutter (USA) : pas d'échelle de notation chiffrée — uniquement une recommandation qualifiée ("notre choix", "alternative budget", "alternative premium"). C'est plus radical mais cela renforce la lisibilité.
- Forbes Advisor : échelle 1-5 avec décimales (4,3/5, par exemple). Compromis entre intuitivité et précision.
Notre échelle 0-10 est cohérente avec les pratiques académiques (notation universitaire française, échelles de qualité de vie en santé) et offre l'amplitude maximale tout en restant intuitive.
Conclusion
Le choix d'une échelle de notation n'est pas un détail cosmétique — c'est un choix méthodologique structurant qui affecte directement la valeur d'usage du comparateur. Une échelle trop comprimée (1-5) masque les différences réelles entre acteurs ; une échelle élargie (0-10) les rend visibles. Nous avons délibérément choisi la seconde option, et nous publions l'intégralité de notre méthodologie pour que ce choix soit auditable.
Pour aller plus loin, notre page méthodologie complète détaille les 7 critères et leurs barèmes, et notre page transparence documente notre relation aux partenaires commerciaux. Notre enquête sur les avis Google explique pourquoi nous ne nous appuyons pas sur les notes Google brutes pour notre propre évaluation.