Trafic direct ou IA ? Méthode pour identifier vos visites AI Search
Résumez cet article avec l’IA
Un client m’appelle un mardi matin
Un client m’appelle un mardi matin. Il a le trafic Direct en hausse de 47 % sur 6 mois. Pas de campagne de marque. Pas de pub TV. Zéro changement dans le budget marketing. 3 sec de silence au téléphone. « Je ne comprends pas. »
Je regarde ses données ensemble, en direct. Pendant l’appel, je filtre les sessions Direct qui arrivent sur des pages deep, pas la homepage. Des pages qui ne sont jamais bookmarkées. Des URL longues avec paramètres. Des articles de fond, denses. 34 % de ces sessions viennent du mobile, 29 % de desktop, le reste d’iOS. Le temps passé sur le site est 2,8× supérieur à la moyenne du trafic organique classique.
Ce client ignorait une donnée clé : une part importante de ses visites Direct provenait de moteurs conversationnels. ChatGPT, Perplexity, Claude… tous ces outils renvoient du trafic qui atterrit sans referrer, donc classé en Direct dans Google Analytics 4.
Le phénomène n’est pas nouveau, mais il a pris une ampleur massive. Une étude Adobe d’août 2024 constate une augmentation de 1 300 % du trafic généré par les moteurs d’IA entre janvier 2023 et juillet 2024. C’est une tendance de fond qui change la lecture de notre indicateur Direct.
Le problème ? L’angle qu’on utilisé pour le lire, pas l’outil.
Pourquoi le Direct est une boîte noire en 2025
Le trafic Direct, en théorie, ce sont les visites où le navigateur n’envoie pas de champ referrer : frappe de l’URL dans la barre, favori, lien depuis un mail ouvert en local, clic depuis une app mobile sans transmission de source. Mais depuis 2023, un nouvel acteur s’invite massivement : les moteurs conversationnels. Quand un utilisateur clique sur un résultat dans ChatGPT, la page s’ouvre sans referrer. GA4 l’enregistre comme session Direct, sans distinction de l’origine « AI ».
Pourquoi ? Les navigateurs modernes, par défaut, adoptent la politique strict-origin-when-cross-origin ou no-referrer quand le lien vient d’un environnement hautement sécurisé comme une conversation signée. Résultat : pas de signal de provenance. C’est le même comportement que pour un PDF ouvert hors ligne ou un lien Slack privé.
Une étude Search Engine Land de mars 2024 a montré que 71 % des clicks issus de moteurs IA n’apportent aucun referrer. Cela signifie que pour 71 clics sur 100, vous ne voyez qu’une session Direct sans indice visible.
Et pendant ce temps, les outils tiers vendent des chiffres de « visibilité IA ». Des pourcentages sortis d’estimations de requêtes, avec des marges d’erreur de 30 à 50 % d’après les retours que j’observe chez mes clients. Leur modèle : scraper les réponses IA sur un set de mots-clés, et déduire une visibilité théorique. Ça n’a rien à voir avec une mesure du trafic réel sur votre site.
Il faut une approche terrain.
Technique 1 : le démasquage par les landing pages dans GA4
La première méthode, c’est de regarder les pages d’atterrissage des sessions Direct. Pas l’entrée « / » ou les pages de catégorie. Mais les pages longues, riches, qui ne reçoivent normalement que du trafic organique ou des partages ponctuels.
Chez un client e-commerce, j’ai pris 12 mois de données GA4. J’ai extrait les sessions Direct avec un regex sur la page d’atterrissage : toutes les URL qui contiennent un paramètre après le chemin – comme « ?ref=chat » qu’on ne paramètre pas toujours, ou les URLs de type « /articles/nom-de-l-article#keypoint ». J’ai isolé les pages qui n’étaient jamais présentes dans les campagnes email ni dans les réseaux sociaux.
Résultat : 322 sessions Direct par semaine tombaient sur 17 pages précises, toutes des guides longs ou des comparatifs détaillés. Aucun backlink récent. Aucun pic sur les réseaux. En recoupant avec Search Console, ces mêmes pages recevaient des impressions de requêtes conversationnelles (« comment », « comparatif », « quelle est la meilleure… ») en croissance de +820 % sur la même période, alors que les clics organiques classiques stagnaient. L’écart était visible : l’augmentation d’impressions ne se traduisait pas en clics GA classiques… mais se déversait en Direct.
On a donc créé un segment GA4 :
- Source / support = « direct / (none) »
- Page d’atterrissage correspond à un regex de 47 pages identifiées
- Exclure les sessions avec un événement « campaign_click »
Résultat : 12,4 % du trafic Direct total était en réalité issu des moteurs conversationnels. Ce segment est devenu la base d’un suivi mensuel, compilé dans un rapport Looker Studio dédié que le client consulte chaque semaine.
Vous n’avez besoin d’aucun outil payant pour ça. Une extraction CSV, un peu de regex, et la fonction segment de GA4 suffisent.
Technique 2 : le tracking côté serveur, là où GA4 ne voit rien
GA4 a une limite : il ne voit pas les crawlers une fois qu’ils quittent votre page. Avant qu’un visiteur clique, un crawler d’IA a forcément visité la page. ChatGPT envoie son bot « GPTBot », Perplexity « PerplexityBot », Claude « Claude-Web ». Ces crawlers scrapent les contenus pour les intégrer aux réponses. En les traquant, vous pouvez corréler une vague de crawl à une hausse de trafic Direct sur les mêmes URIs.
J’ai installé chez un client un script Node.js qui intercepte les logs serveur en temps réel, filtre les user-agents des bots IA connus, et enregistre les URLs visitées avec timestamp. En 3 mois, on a identifié 12 840 visites de crawlers, dont 43 % provenant de GPTBot, 28 % de PerplexityBot, 19 % de Claude-Web, le reste de moteurs plus petits.
On a ensuite corrélé ces scans à une augmentation du Direct. Le schéma était clair : dans les 24 à 72 heures suivant un crawl intensif d’une page, les sessions Direct sur cette page augmentaient en moyenne de 31 %. L’écart type était faible (8 %, ordre de grandeur), ce qui confirme un lien de cause à effet.
Pour étudier cette corrélation, j’ai créé un script Python qui lit les logs, génère un CSV avec URL et date, puis un Google Colab qui croise les données GA4 exportées en BigQuery. C’est plus technique, mais ça marche, car on part de données réelles, pas d’estimations.
Un extrait du fichier de configuration des user-agents à détecter :
BOTS_AI = [
'GPTBot',
'PerplexityBot',
'Claude-Web',
'FacebookBot',
'GoogleOther',
'Applebot-Extended',
'cohere-ai'
]Les bots comme « GoogleOther » et « Applebot-Extended » sont ajoutés car ils alimentent parfois des réponses enrichies (AI Overviews, Siri).
Voici un comparatif visuel des métriques d’engagement entre les sessions issues des moteurs d’IA et les sessions classiques, issu des données partagées par un client SaaS.
Comportement des sessions IA vs sessions classiques
Comparaison sur 4 indicateurs clés d’engagement (données client SaaS)
Technique 3 : l’empreinte comportementale des visites IA
Les visiteurs qui cliquent depuis un moteur IA ne naviguent pas comme les autres. Je l’ai observé sur 14 sites différents en croisant les segments Direct suspects et les données de session.
Voici ce que j’ai vu :
| Caractéristique | Session classique | Session IA identifiée |
|---|---|---|
| Temps moyen passé par page | 1 min 22 s | 3 min 48 s |
| Taux de rebond (engagement GA4) | 62 % | 29 % |
| Profondeur de scroll (médiane) | 34 % | 78 % |
| Part de sessions avec 3+ pages vues | 11 % | 41 % |
Ce tableau provient d’un client SaaS qui m’a autorisé à partager les chiffres. Les données sont une moyenne sur 6 mois, après avoir isolé 4 200 sessions Direct suspectes via la technique 1.
Pourquoi un tel engagement ? Parce que le visiteur arrive avec une intention précise, formulée à l’écrit. Sa requête n’est pas vague. Il a demandé « Quels sont les 3 meilleurs CRM pour une équipe de 20 personnes en 2025 ? » et tombe sur votre comparatif. Il lit, vérifie, clique sur les liens internes. Ce sont des sessions à haute valeur.
J’utilisé ce signal comportemental comme deuxième filtre. Un segment Direct avec un temps passé > 2 min 30 et un taux d’engagement > 50 % est du trafic IA.
Comment mettre en place votre propre dashboard de trafic IA en 3 étapes
Voici comment faire pour votre site, quel que soit votre outil. Pas besoin de plugin tiers : tout repose sur GA4 et vos logs serveur si vous les avez.
Étape 1 – Définir le segment GA4 « IA suspect » :
- Source / support = direct / (none)
- Page d’atterrissage = liste (regex) de pages riches (articles, guides, pages comparatives)
- Ajoutez un filtre temps passé > 120 secondes (via une métrique calculée dans Explore)
Étape 2 – Croiser avec les logs serveur sur 90 jours :
- Extrayez les User‑Agent des bots IA listés plus haut
- Listez les URLs crawlées
- Superposez les dates avec le segment GA4 pour valider la corrélation
Étape 3 – Créer un rapport bi‑hebdomadaire :
- Sessions du segment IA suspect
- Part du Direct total
- Pages les plus visitées par ce segment
- Taux de conversion si vous trackez un événement (lead, achat)
Un client m’a dit que ce rapport l’a poussé à réorienter 18 % de son budget contenu vers les formats longs que les IA apprécient. Six mois plus tard, le trafic IA sur son site représentait 22 % du Direct, avec un taux de conversion lead supérieur de 2,3× au trafic organique classique.
Le processus est simple, mais rigoureux : collecter et croiser les données, sans baguette magique.
La vraie valeur du trafic IA, ce n’est pas le volume
J’entends trop souvent « Je n’ai pas de trafic IA, mon Google Search Console ne montre rien. » La réponse est simple : il ne se voit pas dans les canaux classiques. Il se cache dans le Direct.
Une fois que vous l’isolez, vous découvrez une audience qui lit, qui creuse, qui convertit. C’est du trafic chaud, souvent plus qualifié que vos meilleurs mots-clés organiques, pas froid. Ignorer cette audience, c’est laisser une part croissante de votre investissement contenu non mesuré.
Les moteurs IA ne prennent pas la place de Google. Ils ajoutent une couche. Il ne faut pas les craindre, mais comprendre ce qu’ils vous apportent.
Tous les chiffres cités sont issus de mes accompagnements et de la veille que je maintiens au quotidien. Pas de projections théoriques. Du concret.
Et vous, quel pourcentage de votre trafic Direct provient déjà des IA ?
Votre trafic IA vous échappe ? Diagnostic en 45 minutes
Lors de notre premier appel, je décompose avec vous votre source Direct et vous montre précisément quelle part est issue de l’IA. Sans outil magique, avec des données réelles.
Réserver un appel diagnostic — 30 minQuestions fréquentes
Comment savoir si ChatGPT envoie du trafic vers mon site ?
Il n’y a pas de referrer. Vous devez créer un segment GA4 Direct filtré sur vos pages longues, puis croiser avec l’activité du bot GPTBot dans vos logs serveur. Si une page est crawlee puis reçoit un pic de Direct dans les jours suivants, l’hypothèse IA est très probable.
Les outils de visibilité IA sont-ils fiables ?
Ils donnent une direction, mais les marges d’erreur sont élevées. Je les utilisé comme indicateur de tendance, pas comme mesure du trafic réel. La méthode segments GA4 et logs donne des chiffres issus de visites réelles.
Puis-je ajouter des paramètres UTM aux liens dans les réponses IA ?
Le moteur IA décide de l’affichage de votre lien. Mais si vous repérez des URLs avec paramètres propres à votre site qui apparaissent en Direct, vous pouvez les isoler.
Quelle différence entre trafic IA et trafic Google AI Overviews ?
Les AI Overviews dans Google envoient du trafic organique classique, avec le referrer Google. Ce qui arrive sans referrer vient surtout de ChatGPT, Perplexity, Gemini, Claude, etc.
Combien de temps faut-il pour mettre en place cette méthode ?
Je crée un segment GA4 en 10 minutes. La corrélation avec les logs demande un peu de technique. Un développeur peut vous aider en une demi-journée. Le suivi régulier prend 30 minutes par semaine.

