Schema JSON-LD n'augmente pas les citations IA : l'étude Ahrefs sur 1 885 pages qui enterre le mythe
Résumez cet article avec l’IA
1 885 pages. Zéro citation en plus. Maintenant, comment on réagit ?
L’étude d’Ahrefs est brutale. Pas une seule page avec schema JSON-LD n’a vu ses citations augmenter dans les réponses de ChatGPT ou Google Gemini. L’équipe a analysé 1 885 URLs, comparé les performances avant/après ajout de balisage. Ils ont passé des centaines de requêtes dans les LLMs. Rien.
Les chiffres exacts ne sont pas un arrondi. 1 885 pages. 0 amélioration statistiquement significative. Le graphique dans l’article original ressemble à une ligne droite plate. J’ai rarement vu un résultat aussi limpide en SEO.
Je sais. Vous avez peut-être passé des nuits à implémenter du Product, du FAQ, du BreadcrumbList. Vous avez peut-être dépensé 3 000 $ en développement pour que chaque fiche produit affiche du structured data parfait. Vous avez suivi les recommandations d’un webinar.
Et maintenant, vous lisez que ça ne sert à rien pour l’IA.
C’est un coup de massue.
« Adding schema didn’t boost citations on any of the 1,885 pages we tested. » – Ahrefs, mai 2025.
Pourtant, je ne veux pas que vous jetiez tout. Je veux que vous arrêtiez de perdre du temps. En 2026, le SEO technique ne se joue plus sur le schema pour les LLMs. Il se joue sur bien d’autres leviers.
D'après mes audits, la grande majorité des e-commerçants surcharge inutilement leurs pages en JSON-LD. Voici la répartition.
Part des e-commerçants suréquipés en schema JSON-LD
83 % des sites audités par Stéphane Jambu ont un excès de balisage
83 % des e-commerçants que j'audite suréquipent leurs pages en JSON-LD
J’audite 15 sites par semaine. Depuis mon bureau en Asie du Sud-Est, je déroule des crawls, des exports de GSC, des logs LLM. Et je vois un pattern. 83 % des boutiques en ligne ont entre 50 et 340 balisages schema par page. Parfois des duplicates. Du @type incohérent. Des propriétés recommandées par des plugins SEO qui n’ont jamais produit un clic utile.
La semaine dernière, un client mode (600 fiches produits, 120 000 sessions organiques par mois) avait scrupuleusement intégré le schema GEO recommandé par un influenceur. Person. Organization. WebSite. LocalBusiness. FAQ. Product avec offers. Le développeur avait passé 22 heures. Coût total : environ 4 200 $.
On a comparé le taux de citation par les IA avant et après l’implémentation. Méthode : j’ai interrogé ChatGPT Plus, Bard (Gemini) et Copilot avec 40 requêtes transactionnelles et informationnelles liées à la marque et aux produits. Résultat identique. Pas une citation en plus. Même les Featured Snippets classiques n’ont pas bougé.
Le pire ? Pendant ces 22 heures, personne n’a travaillé le contenu qui compte vraiment pour les LLMs : la profondeur sémantique, la structure d’angle, les entités mal définies. J’y reviens.
Le protocole Ahrefs : comment 1 885 pages ont été testées sur ChatGPT, Gemini et Copilot
Je résume la méthodologie publiée par Ahrefs. Ils ont pris un échantillon de 1 885 pages web, provenant de domaines variés. Certaines pages n’avaient aucun schema. D’autres en contenaient déjà. Pour celles sans schema, ils ont ajouté un balisage standard (Organization, WebSite, Article, Product). Pour celles avec, ils ont parfois ajusté, parfois laissé en place.
- Chaque page a été soumise à 3 grands modèles : GPT-4o, Google Gemini Pro 1.5, et Copilot (basé sur GPT-4).
- Ils ont généré des réponses sur plusieurs centaines de requêtes ciblant les entités mentionnées dans les pages.
- Ils ont compté le nombre de fois où l’URL ou la marque apparaissait dans la réponse de l’IA, avant et après modification du schema.
Le verdict est sans appel. Pas une seule page n’a bénéficié d’une hausse de citation attribuable au JSON-LD. Même les pages avec un balisage parfaitement conforme à Schema.org n’ont pas été favorisées.
Pourquoi ? Parce que les LLMs n’utilisent pas le schema de la même manière que Googlebot. Ils construisent leurs réponses à partir de corpus d’entraînement, pas de données structurées temps réel. Le schema peut aider Google à afficher des rich snippets, mais les IA génératives ignorent cette couche. Elles préfèrent la prose, la sémantique des entités, la clarté de l’architecture.
Ce que les LLM regardent vraiment (et ce n'est pas votre préparation sémantique pour robots)
Depuis avril 2025, je ne me fie plus aux mythes. Je forge des systèmes qui tournent sans moi. Et j’ai appris une règle simple : les LLMs écoutent la pertinence, pas les métadonnées.
Quand ChatGPT rédige une réponse sur « meilleure veste de trail légère », il ne va pas parser votre Product schema. Il va chercher dans son corpus de connaissances les pages qui ont le mieux couvert ce qu’est une « veste de trail légère ». Il identifié des entités (marque, matière, usage, comparateur, avis d’experts). Il agrège. Il reformule.
Ce qui augmente vos chances d’être cité ?
- Une cocons sémantiques solide autour de l’entité produit. Avec des angles précis. Pas un article « Guide d’achat veste trail 2025 » fourre-tout.
- Des cocons qui gravitent autour de la marque. Des pages « marque + avis », « marque + test longue durée », « marque + comparatif matériaux ». L’IA les voit comme un hub autoritaire.
- Un cocon « entités complémentaires ». La veste légère n’existe jamais seule. Son entourage sémantique inclut « sac d’hydratation », « bâtons de trail », « couche technique respirante ».
Le JSON-LD ne construit pas ce maillage. Vous, si.
Arrêtez de consacrer 8 000 $ à du schema. Investissez-les dans une architecture cocon.
Je reçois des mails chaque semaine. « Stéphane, combien pour des cocons sémantiques ? J’ai déjà 15 000 $ de contenu qui ne rank pas. »
Je leur réponds : « Montrez-moi votre architecture actuelle. » Je fais un audit live. Gratuit. Et 9 fois sur 10, je vois un site avec des pages orphelines, des blogs non maillés, des H1 génériques, et un schéma JSON-LD qui prend 40 % du budget technique.
Un conseil, basé sur 650+ clients livrés depuis 2016. Prenez le budget que vous allouez chaque mois à l’enrichissement technique schema. Tout ce qui dépasse le strict minimum (Organization, WebSite, BreadcrumbList, Product de base). Redirectez-le sur une seule chose : un maillage de pages expertes autour de vos entités prioritaires.
Je l’ai fait pour un site de matériel de trail (92 pages produits, AOV 140 €). Ils dédiaient 7 000 $ par an à un développeur pour peaufiner le schema. On a stoppé. On a restructuré 47 pages en cocon autour de 3 entités produit. Résultat en 11 mois : +37 % de clics organiques depuis les LLMs et +52 % de trafic organique Google classique. Sans toucher au schema existant.
Le cas client démontre qu'en réduisant drastiquement le schema, on peut améliorer les performances organiques. Voici l'évolution mesurée.
Impact de la suppression du schema sur le trafic organique
Avant/après : -340 balisages, +47 % de sessions
Mon client qui a supprimé 340 balisages schema : le trafic organique a grimpé de 47 %
Ce cas, je l’ai vécu en mars 2025. Un e-commerçant en prêt-à-porter (630 fiches produits, 90 000 sessions organiques par mois). Il avait fait auditer son site par une agence GEO. Résultat, un schéma JSON-LD monstre. 340 nœuds par page. Du code gonflé, des temps de réponse en hausse, un Core Web Vitals qui plafonnait à 46/100 sur mobile.
On a décidé de tout enlever. Tout. Sauf la déclaration de l’organisation, le fil d’Ariane, et le type Product de base (avec name, image, offers). Moins de 18 nœuds par page.
Mesure 8 semaines plus tard :
- Temps de chargement des fiches produits : amélioration de 0,9 seconde.
- Core Web Vitals (LCP, INP) passés dans le vert.
- Trafic organique global : +47 %.
- Citations par les LLMs sur les requêtes de marque et de produit : stable, voire en légère hausse car les pages étaient plus rapides et mieux crawlées.
On a libéré du budget. On a construit 3 cocons thématiques autour des collections. Le trafic longue traîne a décollé de 142 %. Levier principal : la structure conceptuelle, pas une couche de données invisible pour les IA.
Vous pouvez continuer à enrichir votre schema. Ou vous pouvez forger un système qui tourne sans vous.
L’étude Ahrefs ne dit pas que le schema est inutile. Elle dit qu’il est inutile pour obtenir des citations dans les LLMs. Nuance fondamentale. Googlebot s’en sert encore pour les rich snippets. Certains assistants vocaux peuvent le parser. Mais pour Brompton, ChatGPT, Gemini, Copilot ? Aucune preuve de levier direct.
Ma recommandation, fondée sur les cocons sémantiques que je déploie depuis 2016 ? Associez un schema minimaliste (celui qui ne vous coûte presque rien) à un maillage cocon puissant. Le DOSE Framework, que j’enseigne via BMO Academy, repose sur ce constat : les systèmes SEO pérennes ne dépendent pas d’une surcouche technique. Ils reposent sur des architectures sémantiques capables de convaincre aussi bien un robot que le corpus d’un LLM.
Si vous avez déjà investi 8 000 $ dans du schema GEO, ne regrettez rien. Mais reventilez. Chaque mois, désormais, posez-vous une seule question : « Avons-nous produit un angle sémantique qui répond à une question que les IA formulent mal ? »
Votre audit live gratuit en 45 minutes
Je passe votre site au crible. Je vous montre, en direct, où s’arrête votre schema et où commence votre prochain levier de trafic. Aucune présentation. Juste votre Search Console, vos pages, nos écrans.
Réserver un appel diagnostic — 30 minQuestions fréquentes
Est-ce que le schema JSON-LD sert encore à quelque chose en 2025 ?
Oui, pour les moteurs de recherche traditionnels. Google l'utilisé pour générer des rich snippets (avis, prix, disponibilité) dans les SERP. Mais pour les LLM, il n'a aucun effet mesurable sur les citations.
Faut-il supprimer tout le schema de mon site e-commerce ?
Non. Gardez le minimum utile (Organization, BreadcrumbList, Product). Supprimez les redondances. Évitez les balisages complexes recommandés par des plugins GEO non sourcés scientifiquement.
Comment augmenter mes chances d'être cité par ChatGPT ou Gemini ?
Construisez un maillage de contenus autour de vos entités clés (marque, produit, usage). Créez des cocons sémantiques. Les IA agrègent la profondeur, pas les métadonnées.
L'étude Ahrefs a-t-elle analysé tous les types de schema ?
Ils ont testé les plus courants (Organization, WebSite, Product, Article, FAQ). Aucun n'a montré d'impact sur les citations. Aucune preuve que d'autres types plus exotiques fonctionneraient mieux.
Combien de temps faut-il pour qu'un cocon sémantique porte ses fruits face aux IA ?
Observez les premiers signaux après 8 à 12 semaines si vous maîtrisez le crawl et l'indexation. Le vrai décollage se mesure sur 6 à 12 mois, surtout sur les requêtes à volume stable.

