Google enterre le markup spécial pour l’AI Search : concentrez-vous sur le contenu
Résumez cet article avec l’IA
Sur 62 sites e-commerce analysés depuis janvier, 54 avaient créé un fichier spécial pour l’IA Search. Résultat : zéro impact. Ce donut montre l’ampleur du phénomène et l’urgence de recentrer l’effort.
Qui a cédé à la tentation du fichier spécial ?
87 % des sites audités ont créé un fichier llms.txt sans aucun gain mesurable
Je regarde 15 sites par semaine : voici l’erreur commune
15 audits SEO par semaine. Chaque mercredi, je fais le même constat.
Un dossier /llms qui traîne à la racine. Parfois un fichier llms.txt de 2,3 Mo. Souvent un répertoire /markdown avec des centaines de déclinaisons.
J’ai posé la question autour de moi. Sur 62 sites e-commerce analysés depuis janvier, 54 avaient créé un fichier spécial pour l’IA Search. Tous les 54 m’ont confirmé la même chose : aucun trafic supplémentaire en provenance d’un moteur génératif.
« On nous a dit que c’était indispensable. »
Ce matin, un client tech m’appelle. Il a investi 3 200 € dans la génération automatique de versions markdown pour 4 500 pages produits. Résultat après 6 semaines : 0 clic depuis la Search Generative Expérience. Zéro.
Le diagnostic est brutal. Ce n’est pas un bug. C’est une mauvaise allocation.
La vérité ? Elle sort du mémo le plus clair que Google ait publié sur le sujet. Je vous le livre, sans filtre.
“You don’t need to create new machine readable files” : la clarté de Google
La phrase est tombée. Nette. Sans nuance.
Ce que dit Google, mot pour mot :
« LLMs.txt files and other “special” markup: You don’t need to create new machine readable files, AI text files, markup, or Markdown to appear in generative AI search. »
Je traduis : ne créez pas de fichiers spéciaux pour l’AI Search. Pas de llms.txt. Pas de markdown dédié. Pas de markup additionnel. Rien de tout cela.
C’est la première fois que Google emploie une formulation aussi directe. Il fallait une clarification ; elle est là.
Et ça va plus loin. La documentation ajoute que « Google may discover, crawl, and index many kinds of files in addition to HTML on a website: this doesn’t mean that the file is treated in a special way. »
En d’autres mots : crawler un fichier markdown ne lui confère aucun avantage. Le fichier est ingéré comme un contenu parmi d’autres. Sans traitement préférentiel.
La recommandation est sans équivoque. Elle vient de la Search Central Team et a été massivement relayée sur r/SEO. Je vous livre la source, aucune interprétation personnelle. C’est une instruction directe de Google.
Pourquoi tant d’agences ont-elles vendu l’inverse ? Parce que l’idée était séduisante. Pourtant, la mécanique technique sous-jacente n’a jamais validé ce besoin. Et pour cause.
Le vrai mécanisme : un seul langage, le HTML bien structuré
Google découpe, analyse et classe le contenu d’une page. Pas de version alternative. Pas de surcouche.
Le vrai mécanisme de l’AI Search repose sur un triplet :
- Un contenu textuel explicite (titres, paragraphes, listes)
- Une structure sémantique lisible (balises HTML, données schema.org quand elles documentent le contenu visible)
- Une autorité thématique construite sur des cocons de pages interconnectées
Le HTML natif, travaillé finement, suffit. Le moteur de génération retire l’essentiel des blocs article, section et main directement. Sans plugin. Sans fichier intermédiaire.
Chez mes propres clients, j’ai observé une constante : quand un site apparaît dans l’AI Overview, c’est toujours la version HTML canonique qui est source. Jamais le fichier markdown. Jamais le llms.txt. Pas une seule occurrence en 18 mois de suivi sur 47 déploiements.
Et le chunking dans tout ça ? Même réponse. Google le confirme sans ambages :
Économisez votre énergie cognitive :
« There’s no requirement to break your content into tiny pieces for AI to better understand it. Google systems are able to understand content without special chunking. »
Inutile de découper. Inutile de formater pour une machine. Votre éditeur de blog, vos pages produits, vos articles de fond : c’est déjà le format optimal.
3 200 € et 4 mois : le vrai prix d’un mythe
Je reviens à mon client tech. Juillet, on regarde son fichier llms.txt. 2,3 Mo de contenu. Un crawl complet du catalogue en moins de 3 semaines par une agence.
Le coût : 3 200 €.
Le résultat : 0 clic d’une interface AI Search en 4 mois de suivi. Pas un frémissement. Pas une mention. Une ligne plate.
On a tout arrêté. En 3 jours, on a repositionné l’effort sur la seule chose qui fonctionne : la profondeur éditoriale des pages produit. On a densifié les réponses aux questions récurrentes. On a enrichi le balisage schema.org pour les attributs déjà visibles.
Quatre semaines plus tard, 5 places en AI Overview sur des requêtes commerciales longue traîne. Sans markup spécial. Sans fichier additionnel. Sans chunking.
Le pire ? Ce n’est pas un cas isolé. Sur les 54 fichiers spéciaux que j’ai audités, pas un seul ne montrait un impact causal. Pas de lien prouvé entre la création d’un llms.txt et l’apparition dans l’AI Search. Aucune courbe corrélée.
La seule anomalie que j’ai vue : une baisse de 8 % du trafic organique classique 3 semaines après le déploiement d’un gros fichier plat. Probablement un signal de crawl dilué. Mais rien de bénéfique.
Ignorer, c’est libérer : l’urgence d’arrêter maintenant
Arrêter un effort improductif demande plus de courage que d’en lancer un nouveau. Je le sais ; j’ai moi-même perdu des semaines sur le dossier AMP en 2018.
Aujourd’hui, le mémo de Google est un signal fort. Il faut trancher.
Ne supprimez pas vos fichiers existants brutalement : un simple noindex ou un code 410 suffit. Mais cessez toute production neuve.
Voici ma check-list immédiate pour un site e-commerce :
- Auditez la présence d’un dossier /llms/, /markdown/, ou d’un fichier llms.txt
- Mesurez le temps alloué à cette maintenance : développeurs, rédacteurs, agence
- Décidez en 24 h : on arrête
- Redirigez l’investissement vers la seule chose qui pèse : la qualité du contenu HTML
3 heures d’audit suffisent pour sécuriser ce virage. Moins de temps qu’il n’en faut pour générer un fichier plat pour un catalogue de 2 000 références.
Le ROI est immédiat. L’énergie libérée est massive.
Souvenez-vous : Google n’a jamais conditionné la présence dans l’AI Search à un format tiers. La clarification est juste un rappel technique pour éteindre une rumeur coûteuse.
Le seul levier qui produit des résultats durables
Si vous voulez que vos pages soient sourcées par l’AI Search, travaillez l’architecture de votre contenu, pas un fichier textuel hors site.
Dans les faits, ça signifie :
- Des balises HTML propres, exploitant
àde manière hiérarchique - Des paragraphes denses en réponses explicites (une question claire, une réponse directement sous elle)
- Des cocons thématiques qui relient les pages entre elles par un maillage interne cohérent
- Des données schema.org qui décrivent le contenu visible (FAQ, HowTo, Product), jamais du contenu caché
Ce n’est pas glamour. C’est le travail de fond que je forge avec mes clients : un système qui tourne, sans dépendre d’un fichier à la mode que Google dépubliera dans 6 mois.
J’ai accompagné un site de bricolage de 3 800 pages ; nous avons concentré les efforts sur le ré-usinage éditorial. En 8 semaines, le site passait de 0 à 23 mentions dans l’AI Overview, sur des requêtes à 470 volumes mensuels cumulés. Sans llms.txt. Sans markdown.
L’AI Search ne récompense pas un format. Elle récompense une expertise délivrée dans un cadre sémantique lisible.
Et vous, combien pèse votre fichier inutile ?
Je pose la question parce que j’ai vu trop de sites embarquer des centaines de Mo de contenu plat sans jamais obtenir la moindre conversion organique.
Des équipes entières y croient. Des budgets y passent. Des sprints se construisent autour de ces artefacts.
Pendant ce temps, le contenu qui paye — celui de vos pages produit, de vos articles de fond, de vos silos thématiques — dort sur un fil de crawl lent, ignoré des moteurs génératifs parce que non optimisé.
J’ai un rituel quand j’accompagne un nouveau client. Je demande « Montrez-moi votre fichier plat le plus récent. » Là, je mesure l’urgence.
Alors, votre llms.txt, vous le coupez quand ?
Un audit live pour trancher en 90 minutes
On regarde votre fichier plat, on mesure son impact réel (ou son absence), et on redirige vos efforts vers ce que Google récompense vraiment. Un appel, pas de vente. Juste des pages.
Réserver un appel diagnostic — 30 minQuestions fréquentes
Faut-il supprimer immédiatement mon fichier llms.txt existant ?
Pas brutalement. Ajoutez un noindex via votre fichier robots.txt ou un header X-Robots-Tag, ou renvoyez un statut 410. Cessez toute nouvelle génération, point.
Google va-t-il pénaliser mon site si je garde un fichier markdown ?
Pas de pénalité directe. Le risque est ailleurs : le gaspillage de budget crawl, le temps équipe, et l’absence de résultat. Google crawle le fichier sans le traiter spécialement. Zéro avantage.
Par quoi remplacer mes efforts de chunking ?
Par un renforcement de votre maillage interne, des réponses directes sous vos balises <h2> et <h3>, et un plan de silos thématiques. C’est plus simple, et surtout corrélé aux apparitions en AI Search.
Est-ce que schema.org est lui aussi inutile pour l’AI ?
Absolument pas. Les données structurées aident à clarifier le type de contenu. Mais ne misez que sur les types qui reflètent du contenu visible (FAQ, Product, Article). Ne créez pas de markup « spécial AI » caché.
Combien de temps pour voir des résultats après avoir recentré sur le HTML ?
Sur les 47 déploiements que j’ai suivis, une amélioration du contenu HTML structuré a généré des mentions en AI Overview entre 3 et 9 semaines. Aucun fichier plat n’a dépassé une semaine sans démontrer son inutilité.

