Un développeur ajoute 200 lignes de JSON-LD un mardi matin. FAQ, Article, BreadcrumbList, Organization : tout y est, proprement imbriqué, validé par le Rich Results Test de Google. Il attend. Deux semaines plus tard, ses citations dans Google AI Overviews ont légèrement baissé. Ses pages ChatGPT n’ont pas bougé d’un cran. C’est exactement ce que l’équipe Ahrefs a mesuré entre août 2025 et mars 2026, sur 1 885 pages et 4 000 pages contrôle.
Pour des pages déjà citées par les moteurs IA, ajouter du schema markup n’améliore pas les citations. Sur Google AI Overviews, les pages traitées ont même reculé de 4,6% par rapport aux contrôles, un écart statistiquement significatif avec une probabilité de 1 sur 2 500 d’être due au hasard. Sur Google AI Mode et ChatGPT, les variations (+2,4% et +2,2%) sont statistiquement indiscernables du bruit.
Comment l’étude a été construite
Louise Linehan et Xibeijia Guan ont isolé 1 885 pages ayant introduit du JSON-LD entre août 2025 et mars 2026, identifiées par le crawler Ahrefs qui avait constaté l’absence de schema lors d’un passage précédent puis sa présence lors d’un passage suivant. Ces pages ont été appariées à 4 000 pages contrôle sans schema, sur critères de similarité (trafic, âge du domaine, niche sectorielle). Condition d’entrée dans le dataset : chaque page traitée avait déjà 100 citations ou plus dans Google AI Overviews en février 2025, avant l’ajout de schema.
Cette condition est le point structural de l’étude. Elle garantit que les pages observées ne souffrent pas d’un problème de visibilité préexistant ; elle mesure l’effet marginal du schema sur des contenus déjà reconnus par les systèmes IA. Quatre tests parallèles ont été conduits pour dépister les faux positifs, dont une analyse événementielle semaine par semaine vérifiant que les deux groupes n’avaient pas commencé à diverger avant l’intervention.
Résultat des quatre tests : aucun effet positif clair. La baisse de 4,6% sur AI Overviews reste orpheline d’une explication ; les auteurs reconnaissent qu’elle pourrait être un artefact, pas nécessairement un effet causal du schema.
La confusion qui alimente l’industrie GEO
Alors pourquoi 53% des pages citées par l’IA incluent-elles du JSON-LD ? Ahrefs a analysé 6 millions d’URLs et confirmé ce chiffre. Les pages citées sont environ trois fois plus susceptibles d’avoir du schema que la moyenne du web.
Cette corrélation a été répercutée comme une preuve causale dans des dizaines de guides GEO et AEO publiés depuis 2024 : « Ajoutez du schema pour être cité. » L’étude Ahrefs casse ce raisonnement : les pages très bien structurées, bien maintenues, avec du schema, sont aussi des pages qui investissent dans leur contenu, leur autorité et leur maillage. Le schema est un marqueur de qualité éditoriale globale, pas la variable active qui déclencherait les citations.
Une étude Search/Atlas de décembre 2024 avait déjà trouvé zéro corrélation entre taux de couverture schema et taux de citation. La même limite se retrouve dans un rapport Search Engine Land de mars 2026 : « À ce jour, il n’existe aucune étude peer-reviewed sur l’impact du schema sur la visibilité en IA search, ni aucune expérimentation contrôlée sur le comportement de citation des LLMs. » L’étude Ahrefs est précisément cette expérimentation contrôlée qui manquait.
Ce que les systèmes IA font réellement avec le JSON-LD
Une expérience de searchVIU, citée dans le rapport Ahrefs, a testé si cinq systèmes IA (GPT-4o, Claude, Perplexity, Gemini, Bing Copilot) utilisaient activement le schema lors du fetch d’une page en temps réel. Le constat : le JSON-LD n’est pas lu par les chatbots lors de l’accès direct à un contenu. Il peut être utilisé lors de phases d’indexation antérieures, mais au moment du raisonnement, les LLMs traitent le texte visible, pas les métadonnées structurées.
Ce résultat est cohérent avec une déclaration de Fabrice Canel, product manager chez Microsoft Bing, en mars 2025 : le schema aide les LLMs de Microsoft à comprendre le contenu pour Copilot, mais dans la phase de crawl et d’indexation, pas dans la génération de réponse proprement dite. L’équipe Google Search avait exprimé une position similaire en avril 2025, évoquant un « avantage » sans préciser la nature exacte du mécanisme.
Une étude publiée dans Nature Communications en février 2024 complique le tableau : les LLMs extraient l’information de façon plus précise quand ils reçoivent des prompts structurés avec des champs définis, plutôt que des instructions ouvertes du type « extrais ce qui importe ». Ce résultat s’applique à la façon dont on interroge un LLM, pas à la façon dont un moteur IA ingère une page web, mais il suggère que la structuration du contenu reste pertinente à un niveau différent de la simple balise JSON-LD.
Quand le schema markup garde une utilité réelle
Conclure que « le schema ne sert à rien pour les citations IA » serait aller trop vite. L’étude Ahrefs le dit explicitement : elle ne peut pas se prononcer sur les pages qui ne sont pas encore citées. L’effet potentiel du schema sur la phase de découverte initiale reste non mesuré. Quatre cas où il conserve une utilité documentée :
- Crawl et indexation initiale. Pour des pages sans historique de citation, le JSON-LD peut faciliter la compréhension du contenu par les robots d’indexation avant que le LLM entre en jeu. Cet effet est admis par Google et Microsoft Bing.
- Entités de marque et Knowledge Graph. Le schema Organization, Person et SameAs aide les moteurs à établir des connexions entre votre marque, vos auteurs et vos sujets, renforçant l’autorité perçue à long terme indépendamment des citations directes.
- Types HowTo et FAQ. Ces deux types correspondent directement aux formats de réponse que ChatGPT et Perplexity utilisent pour les requêtes procédurales. L’alignement structurel entre le schema et le format de réponse attendu reste une hypothèse logique même si les données causales sont minces.
- Rich results et CTR. Le schema continue d’activer des rich snippets dans les résultats classiques, ce qui influe sur le CTR organique. Cet effet est bien documenté et indépendant de la question des citations IA.
Ce que les guides GEO ne disent pas
Le marché GEO repose en partie sur une asymétrie d’information. Les prestataires qui vendent des audits de schema markup ont un intérêt structurel à présenter la corrélation comme une prescription actionnable. Les études qui contredisent cette narration, Search/Atlas en décembre 2024 et Ahrefs en mai 2026, sont publiées mais rarement reprises dans les guides pratiques.
| Source | Date | Méthodologie | Résultat principal |
|---|---|---|---|
| Ahrefs (Linehan & Guan) | Mai 2026 | Expérimentation contrôlée : 1 885 pages traitées, 4 000 contrôles | Aucun effet positif mesurable ; -4,6% sur AIO (significatif) |
| Search/Atlas | Décembre 2024 | Étude de corrélation observationnelle | Zéro corrélation entre couverture schema et taux de citation |
| Ahrefs (prévalence) | 2025-2026 | Analyse descriptive : 6 millions d’URLs | 53% des pages citées ont du JSON-LD (corrélation, pas causalité) |
| searchVIU | Octobre 2025 | Test de fetch direct sur 5 LLMs | JSON-LD non lu lors du fetch en temps réel par les chatbots |
| Nature Communications | Février 2024 | Étude LLM sur extraction d’information structurée | Prompts structurés améliorent l’extraction (+38 points dans le test GPT-4) |
En pratique, déployer le schema pour les bénéfices mesurables (rich results, crawl, entités de marque) sans lui attribuer un rôle direct dans les citations IA reste la position la plus défendable. Le travail éditorial, densité factuelle, structure de réponse directe, autorité thématique, est ce que les études pointent comme facteur actif dans la visibilité au sein des systèmes génératifs.
Gartner estime que le volume de recherche traditionnel baissera de 25% d’ici fin 2026. Ce contexte devrait inciter à une lecture rigoureuse des études plutôt qu’à suivre les prescriptions GEO les moins vérifiées.
La limite que l’étude reconnaît elle-même
L’étude Ahrefs mesure l’effet du schema sur des pages déjà dans le circuit des citations. Elle ne dit rien sur les pages qui démarrent de zéro, sans historique, et pour lesquelles le schema pourrait jouer un rôle dans la phase de découverte initiale. Un suivi sur 90 jours sur ce sous-ensemble reste à faire. Ahrefs l’a suggéré dans le rapport lui-même.
Vérifiez dans le rapport Ahrefs Cited Pages quelles pages de votre domaine sont aujourd’hui citées par les systèmes IA avant d’investir dans un déploiement schema à grande échelle.