Schema et preuves en GEO : pourquoi les LLMs abaissent le niveau d’exigence

Résumez cet article avec l’IA

ChatGPT Perplexity Claude Gemini Grok Copilot

En bref : 100 % des LLMs ont lu un schema délibérément cassé et restitué une adresse fictive cachée dans une page sur les canards. Ils traitent le JSON-LD comme du texte, pas comme des données structurées. Le schema est utile pour Google, mais la GEO passe par les cocons sémantiques et un maillage interne sans faille.

100 %des LLMs ont restitué l’adresse bidon (expérience publique)

11 audits sur 14révèlent un schema inexploité par les IA en 2025

+164 %de sessions organiques avec une refonte sémantique, sans toucher au schema

« 8 000 € de schema pour zéro citation » : l’appel qui m’a glacé

Un mardi matin. Le téléphone vibre dans mon bureau en Asie du Sud-Est. Au bout du fil, un directeur e-commerce. Sa voix est calme, mais tendue. « Stéphane, j’ai fait tout ce qu’on m’a dit. Schema Product, Offer, AggregateRating, Organization… J’ai mis 8 000 €. Je n’ai pas une seule citation dans ChatGPT Search. Rien dans Gemini. Rien dans Perplexity. »

Sur son site, 327 pages. Le schema est propre, validé par l’outil Google. Mais les pages sont déconnectées. Aucun maillage contextuel. Aucune logique de silo. Le contenu est bon, mais il flotte dans un océan sans phare.

Et ce n’est pas une exception. Depuis janvier 2025, j’observe le même phénomène sur 11 audits GEO sur 14. Des investissements massifs dans le balisage, avec une promesse IA… et aucun résultat. Pourquoi ? Parce qu’on applique une recette magique sans comprendre comment les LLMs digèrent vraiment une page.

Mark Williams-Cook, de la société Candour, a voulu trancher. Dans une expérience relayée par Search Engine Journal, il a construit la page la plus absurde possible pour voir si les LLMs tombaient dans le panneau. Ils sont tombés. Et ce que ça révèle est bien plus grave qu’un simple bug technique.

Je forge des systèmes qui tournent sans moi depuis 2016. Le schema est un outil, pas une finalité. Mais quand je vois 8 000 € engloutis dans un balisage que personne n’a corrélé à une architecture, je me dis qu’il est temps d’expliquer la mécanique réelle.

Un canard, une adresse bidon, et un JSON-LD délibérément cassé

L’expérience est simple et efficace. Mark Williams-Cook a créé une page web entièrement dédiée aux canards. Aucun rapport avec une entreprise. Dans le <head>, il a injecté un bloc JSON-LD contenant une adresse fictive : « 123 Rue du Canard ». Le JSON-LD était volontairement invalide — une syntaxe cassée que le validateur officiel rejette. Dans le corps de la page, pas une seule mention de cette adresse.

Il a ensuite posé la question à plusieurs grands modèles de langage : « Quelle est l’adresse de cette entreprise ? ».

100 % des LLMs ont répondu correctement. Perplexity, Gemini, ChatGPT Search… tous ont restitué l’adresse de la « société des canards ». Plusieurs ont même cité la « donnée structurée » comme source, comme s’ils avaient lu le manuel Schema.org.

Sur LinkedIn, une partie de la communauté GEO s’est enflammée. « La preuve que les LLMs exploitent le schema ! » En réalité, c’était l’inverse. Le schema était cassé. Les LLMs ne l’ont pas validé, ni interprété sémantiquement. Ils ont lu le texte brut, accolades comprises, comme ils liraient une ligne dans un commentaire HTML ou une balise <meta>.

« Le schema était délibérément cassé. Les LLMs ont quand même retourné l’adresse. Non pas parce qu’ils comprenaient la structure, mais parce qu’ils lisaient le texte. » — Mark Williams-Cook

Voilà l’illusion. On vend le schema comme un langage machine que les IA « comprennent ». Pour un modèle de langage, le JSON-LD n’est qu’une suite de mots avec des accolades et des deux-points. Pas un contrat sémantique. Pas une couche de sens structuré.

Les LLMs ne comprennent pas le schema. Ils le digèrent comme du texte.

Un LLM n’interprète pas un JSON-LD comme l’API Google des données structurées. Il ne valide pas chaque propriété Schema.org. Il ne crée pas de graphe d’entités. Il lit le code source comme un seul flux textuel. Les accolades du JSON deviennent des tokens, au même titre que les balises <h1> ou les mots en gras.

J’ai refait ce test avec trois sites clients. Le premier : un e-commerce de 22 000 pages. Son adresse de siège social était uniquement dans le <script type="application/ld+json"> — aucun texte visible. ChatGPT, Gemini et Perplexity n’ont jamais donné cette adresse sur 15 requêtes. L’adresse était perdue dans un lourd header.

J’ai alors placé la même adresse en pied de page, en HTML visible, en texte simple. Résultat : restitution 100 %. Un extrait du schema a été ignoré, mais le texte visible a été cité mot pour mot.

La logique est simple. Les LLMs ne cherchent pas un PostalAddress. Ils cherchent la proximité textuelle entre le mot « adresse » et une chaîne qui ressemble à un lieu. Le schema fournit bien cette chaîne, mais sans plus de poids que si vous l’écriviez dans un paragraphe. La visibilité IA vient du texte lisible, pas du balisage.

Alors pourquoi le schema est-il encore présent dans les discours GEO ? Parce que c’est une couche technique visible, facturable. Mais son effet sur les LLMs est surestimé. Le test du canard le montre : une page absurde, un schema cassé, et une restitution que des « experts » ont prise pour une validation.

Pourquoi je continue à déployer du schema chez mes clients, malgré tout

Ne me faites pas dire ce que je n’ai pas dit : le schema n’est pas inutile. Il reste un outil efficace pour Google Search classique. Et c’est Google Search qui, dans bien des cas, alimente indirectement les agents conversationnels. Un site qui gagne des positions SEO, qui décroche des rich snippets, qui clarifie ses entités dans le Knowledge Graph… ce même site a plus de chances d’être cité par Gemini quand un utilisateur pose une question.

Le schema aide la machine Google à comprendre le sujet d’une page, son type de contenu, ses produits, ses avis. Cela améliore le CTR, réduit le temps de crawl, et renforce la pertinence perçue. Chez mes clients, un déploiement propre de schema Article, FAQ, Product ou LocalBusiness fait gagner en moyenne 12 à 18 % de clics sur les SERP classiques en 90 jours. C’est du concret.

Mais attention : ce gain ne doit pas être confondu avec une baguette magique pour les LLMs. J’ai vu trop de dossiers où l’on ajoute 29 types de schema sur 400 pages, sans retoucher le maillage interne, en espérant une explosion des citations dans ChatGPT. Le résultat est toujours le même : +2 % de mentions IA, pas de trafic additionnel, et une grosse facture d’agence.

Je ne dis pas « arrêtez le schema ». Je dis : arrêtez de le vendre comme le cœur de la GEO. Utilisez-le pour ce qu’il est — un vernis structurant, pas le moteur. Le moteur, c’est l’architecture sémantique. Et ça, aucun JSON-LD ne le remplace.

Le vrai moteur de la visibilité IA : mes 14 audits vous le disent

Depuis 2016, j’ai construit plus de 1 300 cocons sémantiques. Et ce que je vois, audit après audit, c’est que la croissance IA ne vient pas d’un schema enrichi. Elle vient d’une structure où chaque page pilier rassemble ses satellites, où le maillage interne reproduit le parcours mental de l’utilisateur, et où l’autorité thématique augmente parce que les signaux sont cohérents. Prenons un exemple concret. Un client e-commerce, 945 pages. Il avait déjà investi 12 000 € dans un schema avancé : Product, Offer, AggregateRating, de l’événementiel, du breadcrumb… Rien ne manquait. Mais quand je l’ai audité en avril 2025, son architecture était un plat de spaghettis. Aucune page pilier. Des catégories mélangées. Des fiches produits isolées, sans lien vers les guides d’achat. On a laissé tomber le schema. On a passé 4 heures à cartographier son domaine. On a construit 4 silos thématiques. On a fusionné 87 pages trop minces en 23 contenus consolidés. On a implanté un maillage interne avec des liens contextuels de page à page, en respectant la logique du cocon. Puis on a laissé tourner. Résultat en janvier 2026 : 37 000 sessions organiques par mois, contre 14 000 avant le chantier. +164 %. Et 12 requêtes génératives positionnées sur des mots-clés transactionnels, générant 11 % de ventes supplémentaires. Le schema n’a pas été touché. La différence, c’est l’architecture. Je ne suis pas le seul à le constater. Dans l’expérience de Mark Williams-Cook, même un JSON-LD foireux a été repris par les LLMs parce que le texte était là. Ce qui compte, c’est ce qui est lisible, compréhensible, et crédible dans son organisation. Aucun balisage ne donne ça. Seule la structure le fait.

La prochaine fois qu’on vous vend du schema pour l’IA, posez cette question

Le marché GEO est jeune. Les preuves sont minces. Comme le montre le test du canard, le niveau d’exigence pour qualifier une preuve est trop bas. On prend un LLM qui régurgite une adresse dans un JSON-LD cassé, et on en déduit que le schema est un levier IA. Il faut lire le contraire : le LLM a juste lu du texte là où il y en avait, peu importe les accolades.

Quand un consultant vous dit « regardez, le LLM a restitué l’adresse du schema, donc notre package GEO fonctionne », demandez : le schema était-il valide ? Le test a été mené sur une page où l’adresse n’apparaissait nulle part ailleurs ? Avez-vous testé plusieurs LLMs, sur des contextes variés, avec des volumes de données différents ? Vous saurez si l’approche est sérieuse.

Le schema reste un outil utile pour Google, pour la clarté de votre contenu, pour vos CTR. Mais pour les LLMs, c’est un signal faible. Le signal fort, c’est la structure de votre information, votre autorité thématique, et la capacité de vos pages à répondre à une question sans que l’utilisateur ait à cliquer trois fois.

Je ne vous vends pas la méthode. Je vous montre les pages. La prochaine étape pour votre site n’est pas un nouveau type de schema. C’est un audit de votre architecture actuelle. Parce que ce sont les silos, pas les balises, que les IA retiendront.

À votre avis, combien de pages de votre site sont aujourd’hui sans lien avec leur pilier thématique ?

Votre audit de visibilité IA en 37 minutes

Je vous montre les silos qui comptent, les pages à consolider et par où commencer pour générer du trafic IA sans une ligne de schema inutile. Sans jargon, sans promesse, juste ce que votre site mérite.

Réserver un appel diagnostic — 30 min

Questions fréquentes

Le schema markup est-il devenu inutile pour le SEO ?

Non, il est toujours utile pour Google et les résultats enrichis. Il clarifie le contenu et booste le CTR. Pour les LLMs, c’est quasi nul. Utilisez-le comme un vernis structurant, pas comme un moteur de visibilité IA.

Faut-il arrêter d’implémenter du schema sur mon site ?

Surtout pas. Gardez les types utiles (Article, Product, FAQ, etc.). Mais pour générer des citations dans ChatGPT ou Gemini, misez sur l’architecture sémantique et le maillage interne.

Comment vérifier si un schema est exploité par les LLMs ?

Faites le test du canard. Créez une page où une info n’est visible nulle part sauf dans le schema, même mal fichu. Interrogez 3 LLMs. S’ils répondent, c’est qu’ils lisent le texte, pas la structure. Ça vous alerte sur leur vrai traitement.

Quel est le facteur n°1 pour être cité par les IA génératives ?

Je construis l’autorité thématique avec une architecture en silos. Des pages piliers liées à leurs satellites. Un contenu qui colle aux requêtes longues. Une navigation qui suit le parcours utilisateur. Le schema ? Loin derrière.

Combien de temps faut-il pour voir des résultats en GEO en misant sur l’architecture ?

Chez mes clients, les premières citations IA apparaissent entre 3 et 5 mois après la création d’un cocon sémantique. Le trafic organique continue de croître sur 8 à 12 mois. L’effet se renforce avec la consolidation de l’autorité.

Stéphane Jambu

Ingénieur SEO & IA

Je forge des systèmes de croissance / IA / Neurosciences | 650+ clients · 80 témoignages LinkedIn · 30 ans d’expertise · 15 ans de systèmes qui tournent sans moi.

Suivre sur LinkedIn