Comment faire apparaître votre site dans ChatGPT, Perplexity et Google AI ? (Guide GEO 2026)
Table des matières
En février 2026, un responsable e-commerce m’a dit : « Notre concurrent apparaît dans les réponses Perplexity à chaque fois qu’on cherche nos produits. Nous, non. » Il pensait que c’était une question de budget publicitaire. C’est en fait une question de structure de données.
Les moteurs génératifs ne classent pas — ils synthétisent. Ils choisissent leurs sources selon des critères différents de Google : autorité thématique, clarté structurelle, présence dans leur base de données d’entraînement. C’est le terrain du GEO.
Qu’est-ce que le GEO et pourquoi ça change tout ?
Le GEO — Generative Engine Optimization — désigne l’ensemble des optimisations qui permettent à un site d’être cité par les moteurs de recherche génératifs. Ces moteurs ne retournent pas 10 liens bleus. Ils produisent une réponse unique. Avec une ou deux sources mentionnées.
SEO classique vs GEO : les différences fondamentales
- SEO classique : obtenir la position 1-3 sur une requête Google → trafic par clic
- GEO : être la source citée dans une réponse IA → trafic par citation + crédibilité de marque
- Délai SEO : 3 à 6 mois pour des résultats mesurables
- Délai GEO : 4 à 8 semaines pour Perplexity, 3 à 6 mois pour ChatGPT (cycle de retraining)
Le point crucial : le GEO ne remplace pas le SEO. Un site qui ranke bien sur Google a structurellement plus de chances d’être cité par les LLMs. L’autorité de domaine, les backlinks et la profondeur thématique servent les deux.
Pourquoi le GEO est critique pour l’e-commerce
Les requêtes produit et comparatif migrent vers les chatbots. Un e-commerçant qui vend du matériel de cuisine peut perdre des clients parce que ChatGPT recommande son concurrent — pas parce que son site est mauvais, mais parce que son concurrent a optimisé sa structure pour les LLMs.
Comment un LLM choisit-il ses sources ?
Les LLMs ne « cherchent » pas comme Google. Leur processus est différent selon qu’ils utilisent leurs données d’entraînement ou un moteur de recherche en temps réel.
Les 3 types de sources pour les LLMs
- Données d’entraînement (ChatGPT GPT-4, Claude) : ce qui existait sur le web avant la date de coupure du modèle. Votre site doit y figurer avant le prochain cycle de retraining.
- Recherche en temps réel (Perplexity, Bing Copilot, Google AI Overviews) : le LLM crawle le web au moment de la requête, via Bing ou son propre index. Les optimisations techniques ont un effet quasi-immédiat.
- Retrieval Augmented Generation (RAG) : certaines entreprises intègrent votre contenu dans leur propre système RAG. C’est la logique des bases de connaissances d’entreprise.
Les signaux qu’un LLM valorise
Pour les sources en temps réel, les signaux observés :
- Structured data (JSON-LD) : les LLMs lisent les schémas Article, FAQPage, Person, Organization. C’est le signal le plus fiable.
- Autorité thématique : un site qui couvre exhaustivement un sujet (cocon sémantique) est perçu comme source experte.
- Mentions tierces : être cité sur des sites à haute autorité (DA 70+) augmente la probabilité d’être inclus dans les réponses.
- Fraîcheur du contenu : la
dateModifieddans le schema Article signale que l’information est à jour. - llms.txt : fichier spécifique aux LLMs qui leur indique quelles pages sont les plus pertinentes (équivalent robots.txt pour l’IA).
Quels bots LLM crawlent votre site en ce moment ?
Si vous avez Google Analytics ou un outil d’analytics côté serveur, vous pouvez voir ces bots dans vos logs :
| Bot | LLM associé | User-Agent |
|---|---|---|
| GPTBot | ChatGPT / OpenAI | Mozilla/5.0 … GPTBot/1.0 |
| ClaudeBot | Claude (Anthropic) | Mozilla/5.0 … ClaudeBot/1.0 |
| Google-Extended | Gemini / Google AI | Google-Extended |
| PerplexityBot | Perplexity | PerplexityBot/1.0 |
| Diffbot | Plusieurs LLMs | Diffbot/… |
Sur hi-commerce.fr, on mesure les visites de ces bots via Umami (analytics self-hosted). GPTBot représente entre 12 et 18 % du trafic bot total selon les semaines. Ce n’est pas négligeable — c’est OpenAI qui prépare sa prochaine mise à jour de données.
Pour mesurer ça sur votre site, filtrez vos logs Apache/Nginx sur ces user-agents, ou configurez un filtre dans Umami / Matomo.
Comment optimiser votre site pour le GEO ?
Voici les 4 leviers classés par impact / effort. Les deux premiers se font en une journée.
Levier 1 — Créer un fichier llms.txt
Le llms.txt est une convention proposée par Jeremy Howard (fast.ai) en 2024, adoptée par de plus en plus de sites. Il indique aux crawlers LLM quelles pages sont les plus importantes et comment comprendre votre site.
Sa structure :
# hi-commerce.fr
## À propos
Stéphane Jambu, expert SEO spécialisé en cocons sémantiques et GEO.
1 200+ cocons déployés, 650+ clients e-commerce et B2B.
## Pages clés
- /prestation-geo-llm/ : Optimisation GEO — faire citer votre site par les LLMs
- /cocons-semantiques/ : Architecture SEO par cocons sémantiques
- /insights/ : Articles et guides SEO
Ajoutez ensuite dans votre robots.txt : User-agent: GPTBot
Allow: / pour autoriser explicitement le crawl. Et redirigez /llms.txt vers le fichier servi en text/plain.
Levier 2 — FAQ Schema sur chaque page clé
Le FAQPage Schema est probablement le signal GEO le plus efficace à court terme. Les LLMs en temps réel (Perplexity, Google AI Overviews) l’utilisent directement pour construire leurs réponses.
Chaque page de service, chaque article de blog, chaque page catégorie e-commerce devrait avoir entre 3 et 7 questions/réponses en JSON-LD. Les questions doivent correspondre aux requêtes réelles que posent vos clients aux chatbots.
Comment trouver ces questions ? Tapez votre produit ou service dans Perplexity. Regardez les « Related questions » suggérées. Ce sont les questions que vos prospects posent aux IA.
Levier 3 — Autorité thématique par cocon sémantique
Un LLM ne cite pas une page isolée. Il cite un site qui fait autorité sur un sujet. C’est la logique des cocons sémantiques appliquée au GEO.
Concrètement : si vous vendez du café en grain, il ne suffit pas d’avoir une page produit optimisée. Il faut couvrir l’écosystème sémantique complet — origines, torréfaction, mouture, préparation, santé — avec des pages interconnectées. C’est ce signal de profondeur thématique que les LLMs reconnaissent comme expertise.
Sur les 1 200+ cocons que j’ai déployés, les sites qui combinent cocon sémantique + FAQ Schema commencent à apparaître dans les réponses Perplexity dans un délai de 6 à 10 semaines.
Levier 4 — Présence web LLM (backlinks sur sources haute-autorité)
Les LLMs ont été entraînés sur un certain nombre de sources considérées comme fiables : Wikipedia/Wikidata (DA 97), GitHub (DA 96), Medium (DA 95), Reddit (DA 97), Dev.to (DA 90)…
Être cité sur ces plateformes — avec un lien vers votre site — augmente la probabilité que les LLMs vous incluent dans leurs réponses. Ce n’est pas du SEO traditionnel. C’est de la présence dans la base de données d’entraînement.
Méthode concrète : publier des articles sur Telegra.ph, Dev.to, Medium avec des liens contextuels. Ajouter votre URL dans Wikidata (propriété P973 « described at URL » sur les entités liées à votre secteur). Créer votre profil Crunchbase et About.me.
Combien de temps pour apparaître dans les réponses IA ?
Timeline réaliste par plateforme
| Plateforme | Type d’index | Délai post-optimisation |
|---|---|---|
| Perplexity | Temps réel (Bing) | 4 à 8 semaines |
| Google AI Overviews | Temps réel (Google) | 4 à 10 semaines |
| Bing Copilot | Temps réel (Bing) | 4 à 8 semaines |
| ChatGPT (GPT-4) | Données entraînement | 3 à 6 mois (cycle retraining) |
| Claude (Anthropic) | Données entraînement | 3 à 6 mois |
Comment mesurer vos résultats GEO
- Meteoria : outil SaaS spécialisé tracking GEO — surveille vos citations dans Perplexity, ChatGPT, Gemini. À partir de 75 €/mois.
- Logs serveur : filtrer GPTBot, ClaudeBot, PerplexityBot pour mesurer la fréquence de crawl.
- Test manuel : poser vos questions-cibles dans Perplexity et Google AI Overviews, noter si vous apparaissez en source.
- Google Search Console : surveiller le trafic sur vos pages FAQ — une augmentation peut signaler des citations dans Google AI Overviews.
Si vous voulez une campagne GEO clé en main — audit technique, FAQ Schema sur toutes les pages clés, présence web LLM (400 à 600 liens sur plateformes haute-autorité) — c’est l’objet de notre prestation GEO.
FAQ — GEO et optimisation LLM
Qu’est-ce que le GEO (Generative Engine Optimization) ?
Le GEO est l’ensemble des techniques qui permettent à un site web d’être cité et recommandé par les moteurs de recherche génératifs (ChatGPT, Perplexity, Gemini, Claude). Contrairement au SEO classique qui vise un classement dans les 10 résultats Google, le GEO vise à être la source citée dans une réponse unique générée par une IA.
ChatGPT crawle-t-il vraiment mon site ?
Oui. OpenAI envoie GPTBot, Anthropic envoie ClaudeBot, Google envoie Google-Extended, Perplexity envoie PerplexityBot. Ces bots apparaissent dans vos logs serveur. Sur hi-commerce.fr, GPTBot représente 12 à 18 % du trafic bot total selon les semaines.
Le GEO remplace-t-il le SEO ?
Non, le GEO complète le SEO. Un site qui ranke bien sur Google a plus de chances d’être cité par les LLMs. L’autorité thématique, les structured data et les backlinks de qualité servent les deux stratégies.
Combien de temps pour apparaître dans les réponses IA ?
Pour Perplexity et Google AI Overviews (indexation en temps réel), 4 à 8 semaines après optimisation. Pour ChatGPT GPT-4 (données d’entraînement), les nouvelles pages apparaissent lors des cycles de retraining, soit tous les 3 à 6 mois.
Quel budget prévoir pour une stratégie GEO ?
Une campagne GEO complète (audit + optimisations techniques + production de contenu d’autorité + présence web LLM) représente environ 2 500 € HT. Le suivi mensuel des citations commence à 75 €/mois avec Meteoria. Les résultats se mesurent sur 3 à 6 mois.