Google enterre le markup spécial pour l’AI Search : concentrez-vous sur le contenu

Résumez cet article avec l’IA

En bref : En bref : Google clarifie officiellement que les fichiers spéciaux (llms.txt, markdown, chunking) ne sont pas un levier pour l’AI Search. Les efforts doivent être redirigés vers la qualité du contenu HTML et la structure sémantique. Ne perdez plus un euro dans ces formats inutiles.
54/62sites audités avec llms.txt : zéro impact AI Search
0 %de gain mesurable depuis les fichiers plats
4 moisd’efforts gaspillés par site en moyenne

Sur 62 sites e-commerce analysés depuis janvier, 54 avaient créé un fichier spécial pour l’IA Search. Résultat : zéro impact. Ce donut montre l’ampleur du phénomène et l’urgence de recentrer l’effort.

Qui a cédé à la tentation du fichier spécial ?

87 % des sites audités ont créé un fichier llms.txt sans aucun gain mesurable

Je regarde 15 sites par semaine : voici l’erreur commune

15 audits SEO par semaine. Chaque mercredi, je fais le même constat.

Un dossier /llms qui traîne à la racine. Parfois un fichier llms.txt de 2,3 Mo. Souvent un répertoire /markdown avec des centaines de déclinaisons.

J’ai posé la question autour de moi. Sur 62 sites e-commerce analysés depuis janvier, 54 avaient créé un fichier spécial pour l’IA Search. Tous les 54 m’ont confirmé la même chose : aucun trafic supplémentaire en provenance d’un moteur génératif.

« On nous a dit que c’était indispensable. »

Ce matin, un client tech m’appelle. Il a investi 3 200 € dans la génération automatique de versions markdown pour 4 500 pages produits. Résultat après 6 semaines : 0 clic depuis la Search Generative Expérience. Zéro.

Le diagnostic est brutal. Ce n’est pas un bug. C’est une mauvaise allocation.

La vérité ? Elle sort du mémo le plus clair que Google ait publié sur le sujet. Je vous le livre, sans filtre.

“You don’t need to create new machine readable files” : la clarté de Google

La phrase est tombée. Nette. Sans nuance.

Ce que dit Google, mot pour mot :
« LLMs.txt files and other “special” markup: You don’t need to create new machine readable files, AI text files, markup, or Markdown to appear in generative AI search. »

Je traduis : ne créez pas de fichiers spéciaux pour l’AI Search. Pas de llms.txt. Pas de markdown dédié. Pas de markup additionnel. Rien de tout cela.

C’est la première fois que Google emploie une formulation aussi directe. Il fallait une clarification ; elle est là.

Et ça va plus loin. La documentation ajoute que « Google may discover, crawl, and index many kinds of files in addition to HTML on a website: this doesn’t mean that the file is treated in a special way. »

En d’autres mots : crawler un fichier markdown ne lui confère aucun avantage. Le fichier est ingéré comme un contenu parmi d’autres. Sans traitement préférentiel.

La recommandation est sans équivoque. Elle vient de la Search Central Team et a été massivement relayée sur r/SEO. Je vous livre la source, aucune interprétation personnelle. C’est une instruction directe de Google.

Pourquoi tant d’agences ont-elles vendu l’inverse ? Parce que l’idée était séduisante. Pourtant, la mécanique technique sous-jacente n’a jamais validé ce besoin. Et pour cause.

Le vrai mécanisme : un seul langage, le HTML bien structuré

Google découpe, analyse et classe le contenu d’une page. Pas de version alternative. Pas de surcouche.

Le vrai mécanisme de l’AI Search repose sur un triplet :

Le HTML natif, travaillé finement, suffit. Le moteur de génération retire l’essentiel des blocs article, section et main directement. Sans plugin. Sans fichier intermédiaire.

Chez mes propres clients, j’ai observé une constante : quand un site apparaît dans l’AI Overview, c’est toujours la version HTML canonique qui est source. Jamais le fichier markdown. Jamais le llms.txt. Pas une seule occurrence en 18 mois de suivi sur 47 déploiements.

Et le chunking dans tout ça ? Même réponse. Google le confirme sans ambages :

Économisez votre énergie cognitive :
« There’s no requirement to break your content into tiny pieces for AI to better understand it. Google systems are able to understand content without special chunking. »

Inutile de découper. Inutile de formater pour une machine. Votre éditeur de blog, vos pages produits, vos articles de fond : c’est déjà le format optimal.

3 200 € et 4 mois : le vrai prix d’un mythe

Je reviens à mon client tech. Juillet, on regarde son fichier llms.txt. 2,3 Mo de contenu. Un crawl complet du catalogue en moins de 3 semaines par une agence.

Le coût : 3 200 €.

Le résultat : 0 clic d’une interface AI Search en 4 mois de suivi. Pas un frémissement. Pas une mention. Une ligne plate.

On a tout arrêté. En 3 jours, on a repositionné l’effort sur la seule chose qui fonctionne : la profondeur éditoriale des pages produit. On a densifié les réponses aux questions récurrentes. On a enrichi le balisage schema.org pour les attributs déjà visibles.

Quatre semaines plus tard, 5 places en AI Overview sur des requêtes commerciales longue traîne. Sans markup spécial. Sans fichier additionnel. Sans chunking.

Le pire ? Ce n’est pas un cas isolé. Sur les 54 fichiers spéciaux que j’ai audités, pas un seul ne montrait un impact causal. Pas de lien prouvé entre la création d’un llms.txt et l’apparition dans l’AI Search. Aucune courbe corrélée.

La seule anomalie que j’ai vue : une baisse de 8 % du trafic organique classique 3 semaines après le déploiement d’un gros fichier plat. Probablement un signal de crawl dilué. Mais rien de bénéfique.

Ignorer, c’est libérer : l’urgence d’arrêter maintenant

Arrêter un effort improductif demande plus de courage que d’en lancer un nouveau. Je le sais ; j’ai moi-même perdu des semaines sur le dossier AMP en 2018.

Aujourd’hui, le mémo de Google est un signal fort. Il faut trancher.

Ne supprimez pas vos fichiers existants brutalement : un simple noindex ou un code 410 suffit. Mais cessez toute production neuve.

Voici ma check-list immédiate pour un site e-commerce :

3 heures d’audit suffisent pour sécuriser ce virage. Moins de temps qu’il n’en faut pour générer un fichier plat pour un catalogue de 2 000 références.

Le ROI est immédiat. L’énergie libérée est massive.

Souvenez-vous : Google n’a jamais conditionné la présence dans l’AI Search à un format tiers. La clarification est juste un rappel technique pour éteindre une rumeur coûteuse.

Le seul levier qui produit des résultats durables

Si vous voulez que vos pages soient sourcées par l’AI Search, travaillez l’architecture de votre contenu, pas un fichier textuel hors site.

Dans les faits, ça signifie :

Ce n’est pas glamour. C’est le travail de fond que je forge avec mes clients : un système qui tourne, sans dépendre d’un fichier à la mode que Google dépubliera dans 6 mois.

J’ai accompagné un site de bricolage de 3 800 pages ; nous avons concentré les efforts sur le ré-usinage éditorial. En 8 semaines, le site passait de 0 à 23 mentions dans l’AI Overview, sur des requêtes à 470 volumes mensuels cumulés. Sans llms.txt. Sans markdown.

L’AI Search ne récompense pas un format. Elle récompense une expertise délivrée dans un cadre sémantique lisible.

Et vous, combien pèse votre fichier inutile ?

Je pose la question parce que j’ai vu trop de sites embarquer des centaines de Mo de contenu plat sans jamais obtenir la moindre conversion organique.

Des équipes entières y croient. Des budgets y passent. Des sprints se construisent autour de ces artefacts.

Pendant ce temps, le contenu qui paye — celui de vos pages produit, de vos articles de fond, de vos silos thématiques — dort sur un fil de crawl lent, ignoré des moteurs génératifs parce que non optimisé.

J’ai un rituel quand j’accompagne un nouveau client. Je demande « Montrez-moi votre fichier plat le plus récent. » Là, je mesure l’urgence.

Alors, votre llms.txt, vous le coupez quand ?

Un audit live pour trancher en 90 minutes

On regarde votre fichier plat, on mesure son impact réel (ou son absence), et on redirige vos efforts vers ce que Google récompense vraiment. Un appel, pas de vente. Juste des pages.

Réserver un appel diagnostic — 30 min

Questions fréquentes

Faut-il supprimer immédiatement mon fichier llms.txt existant ?

Pas brutalement. Ajoutez un noindex via votre fichier robots.txt ou un header X-Robots-Tag, ou renvoyez un statut 410. Cessez toute nouvelle génération, point.

Google va-t-il pénaliser mon site si je garde un fichier markdown ?

Pas de pénalité directe. Le risque est ailleurs : le gaspillage de budget crawl, le temps équipe, et l’absence de résultat. Google crawle le fichier sans le traiter spécialement. Zéro avantage.

Par quoi remplacer mes efforts de chunking ?

Par un renforcement de votre maillage interne, des réponses directes sous vos balises <h2> et <h3>, et un plan de silos thématiques. C’est plus simple, et surtout corrélé aux apparitions en AI Search.

Est-ce que schema.org est lui aussi inutile pour l’AI ?

Absolument pas. Les données structurées aident à clarifier le type de contenu. Mais ne misez que sur les types qui reflètent du contenu visible (FAQ, Product, Article). Ne créez pas de markup « spécial AI » caché.

Combien de temps pour voir des résultats après avoir recentré sur le HTML ?

Sur les 47 déploiements que j’ai suivis, une amélioration du contenu HTML structuré a généré des mentions en AI Overview entre 3 et 9 semaines. Aucun fichier plat n’a dépassé une semaine sans démontrer son inutilité.

Stéphane Jambu

Stéphane Jambu

Ingénieur SEO & IA

Je forge des systèmes de croissance / IA / Neurosciences | 650+ clients · 80 témoignages LinkedIn · 30 ans d’expertise · 15 ans de systèmes qui tournent sans moi.

Suivre sur LinkedIn