Pourquoi Schema.org compte plus que jamais pour le GEO
Schema.org est un vocabulaire JSON-LD que Google a poussé depuis 2011 pour décrire les entités du web (entreprises, produits, articles, personnes). Ce que peu de marketers ont compris : depuis 2024, ce vocabulaire est massivement consommé par les LLM, parce qu'il est non-ambigu, machine-readable et déjà standardisé.
Google Search Central a confirmé en 2025 que les données structurées sont un signal d'éligibilité pour les AI Overviews. Anthropic, dans sa documentation MCP, recommande explicitement le JSON-LD comme format prioritaire pour exposer du contexte stable à un LLM. L'étude « GEO: Generative Engine Optimization » (Aggarwal et al., Princeton CS, 2024) place le balisage structuré dans le top 5 des leviers d'amélioration de visibilité IA.
Les 7 types Schema.org à déployer en priorité
Pas la peine de viser le catalogue complet (plus de 800 types). Pour 90 % des sites B2B et e-commerce français, les 7 types suivants couvrent l'essentiel : Organization, Product (ou Service), FAQPage, HowTo, Article, BreadcrumbList, Person. Détails et code ligne par ligne ci-dessous.
1. Organization — votre carte d'identité
Le type de base. Sans Organization valide, les IA n'ont pas de référence stable de votre marque et peuvent l'attribuer à un homonyme. À placer une seule fois, idéalement sur la page d'accueil. Le champ sameAs est critique : il lie votre site à votre Wikidata, LinkedIn, Crunchbase, et consolide votre Knowledge Graph.
2. Product — pour l'e-commerce et le SaaS
Pour chaque produit ou offre SaaS. Avec AggregateRating et Offer, vous donnez aux IA tout ce qu'il faut pour citer votre produit dans une comparaison. ChatGPT Shopping et Perplexity utilisent ce schéma pour leurs réponses commerciales.
3. FAQPage — le levier le plus puissant pour les LLM
FAQPage est le format que ChatGPT et Perplexity ré-emploient le plus directement dans leurs réponses, parce que la structure question/réponse est parfaitement extractible. À placer sur toutes vos pages commerciales, articles de blog et pages d'offres.
4. HowTo — pour vos guides procéduraux
HowTo signale à l'IA un contenu pédagogique étape par étape. Très utile pour les articles de méthodologie, les tutoriels d'installation, les checklists. Les IA citent volontiers les HowTo dans les réponses à « comment faire X ? ».
5. Article — pour vos contenus éditoriaux
Article (ou BlogPosting, NewsArticle) signale qu'un contenu est éditorial, daté, signé et donc citable. Datez systématiquement avec datePublished et dateModified — les LLM privilégient les contenus récents pour les sujets sensibles à la fraîcheur (tarifs, tendances, classements).
6. BreadcrumbList — pour la navigation contextuelle
BreadcrumbList donne la hiérarchie de votre site (Accueil > Ressources > Article). Les IA s'en servent pour comprendre le contexte d'un contenu (article isolé vs partie d'un cluster thématique). Implémentation triviale, à faire systématiquement.
7. Person — pour vos auteurs et experts
Associer une Person identifiable (avec linkedin, sameAs Wikidata) à un contenu renforce le signal E-E-A-T (Expérience, Expertise, Autorité, Confiance) que Google et les LLM valorisent. Particulièrement utile pour les contenus YMYL (santé, finance, droit) et les contenus d'opinion.
5 erreurs courantes (et comment les éviter)
- JSON-LD invalide. Une virgule manquante invalide tout le bloc — l'IA ne lit rien. Validez systématiquement avec le Rich Results Test de Google.
- Incohérence entre Schema.org et le contenu visible. Si le nom de l'entreprise dans Organization diffère de celui affiché sur la page, Google peut désactiver le balisage et l'IA peut ignorer.
- FAQPage en double. Ne mettez qu'une seule FAQPage par page. Plusieurs entraînent des erreurs de parsing.
- Pas de sameAs dans Organization. Sans ces liens vers Wikidata/LinkedIn, votre Knowledge Graph reste flou.
- Schema.org rempli automatiquement avec des champs vides. Mieux vaut omettre un champ que le laisser vide — un champ vide est un signal négatif.
Validation : 3 outils à utiliser systématiquement
- Google Rich Results Test (search.google.com/test/rich-results) — outil de référence. Vérifie la validité, l'éligibilité aux rich snippets, et signale les avertissements.
- Schema.org Validator (validator.schema.org) — vérifie la conformité stricte au vocabulaire. Plus pointilleux que Google.
- Test manuel ChatGPT — collez l'URL de la page dans ChatGPT et demandez « décris cette entreprise ». Si la description correspond exactement à votre Schema.org Organization, vous êtes bien lu.
Impact mesurable du Schema.org sur les citations IA
Sur 22 missions NEXUS GEO en 2025-2026 où la mise à niveau Schema.org a été le principal levier des 60 premiers jours, le taux de citation moyen sur 30 prompts métier est passé de 12 % à 31 % — un facteur 2,6x. L'effet est plus marqué sur Perplexity (qui lit explicitement le JSON-LD pendant le browsing) que sur ChatGPT en mode entraînement.
Pour une approche complète, combinez Schema.org avec un [llms.txt structuré](/ressources/llms-txt-guide-complet) et une [méthodologie de mesure mensuelle](/ressources/mesurer-citations-ia-outils-methodes-2026).
Checklist 20 points pour un Schema.org GEO-ready
- Organization déployé sur la page d'accueil avec name, url, logo, description.
- Organization.sameAs pointe vers Wikidata, LinkedIn, Crunchbase au minimum.
- Organization.contactPoint complet (email, areaServed, availableLanguage).
- Organization.foundingDate présent.
- Product ou Service sur chaque page d'offre avec name, description, brand.
- Offer avec price, priceCurrency, availability sur chaque page produit.
- AggregateRating sur les pages produit avec reviewCount sourcé.
- FAQPage sur toutes les pages commerciales avec au moins 5 paires Q/R.
- FAQPage unique par page (jamais en double).
- Article sur tous les contenus de blog avec datePublished et dateModified.
- Article.author en type Person avec url et sameAs.
- BreadcrumbList sur toutes les pages internes.
- HowTo sur les guides procéduraux avec totalTime et step détaillés.
- Person pour chaque auteur récurrent, avec jobTitle et worksFor.
- Aucun champ vide dans le JSON-LD (omettre plutôt que vider).
- JSON-LD placé dans <head>, pas en <body>.
- Validation 100 % Rich Results Test sans erreur.
- Validation Schema.org Validator sans avertissement bloquant.
- Test manuel ChatGPT confirmant la cohérence du contenu.
- Mise à jour trimestrielle systématique du Schema.org (offres, prix, équipe).
FAQ
Sources
- Google Search Central — Documentation « Structured data and AI Overviews », 2025.
- Schema.org — Vocabulaire officiel et exemples (schema.org).
- Aggarwal P. et al. — « GEO: Generative Engine Optimization » — Princeton CS, 2024 (arxiv.org/abs/2311.09735).
- Anthropic — Documentation Model Context Protocol, recommandations format JSON-LD, 2025.
- Google Rich Results Test (search.google.com/test/rich-results).
Votre Schema.org est-il vraiment GEO-ready ?
NEXUS GEO audite votre balisage sémantique et le reconfigure pour les IA génératives. Audit complet sur 47 critères en 10 jours pour 1 750 € TTC.
