NEXUS GEO
MéthodologieCas clientsTarifsÀ proposBlog
Accueil/Ressources/llms.txt : guide complet 2026 — spec, exemples, validation
Retour aux ressourcesTechnique

llms.txt : guide complet 2026 — spec, exemples, validation

Par Martin NOALE · Fondateur
Dernière mise à jour : 25 mai 2026

Le fichier llms.txt est devenu la pierre angulaire de l'indexation IA en 2026. Spec officielle, syntaxe Markdown, llms-full.txt, validation et exemples concrets — par Martin NOALE, fondateur de NEXUS GEO.

25 mai 202611 min· par Martin NOALE
llms.txt : guide complet 2026 — spec, exemples, validation

Sommaire

  • TL;DR
  • La spec officielle 2026
  • Syntaxe ligne par ligne
  • llms-full.txt vs llms.txt
  • 3 exemples réels commentés
  • Comment valider votre fichier
  • Erreurs fréquentes
  • FAQ
  • Sources

TL;DR

Le llms.txt est un fichier Markdown placé à la racine d'un site (votresite.fr/llms.txt) qui dit aux IA quelles pages lire en priorité. La spec a été proposée par Jeremy Howard (Answer.AI) en septembre 2024 et adoptée par plus de 8 000 sites en 18 mois. Le format est strict : titre H1, blockquote optionnel, sections H2 avec listes Markdown. Le fichier llms-full.txt sert à inliner le corpus complet. NEXUS GEO déploie ces deux fichiers pour 100 % de ses clients dès le premier livrable.

La spec officielle 2026 — ce que dit Jeremy Howard

Le standard llms.txt a été publié sur llmstxt.org le 3 septembre 2024 par Jeremy Howard, cofondateur d'Answer.AI et créateur de fastai. L'idée : donner aux LLM un point d'entrée structuré, lisible à la fois par humains et par machines, pour expliquer la structure d'un site sans devoir crawler 10 000 pages.

Le format suit cinq règles strictes que NEXUS GEO applique à chaque déploiement :

  1. Un titre H1 unique (# Nom du projet ou de la marque) — obligatoire.
  2. Un blockquote optionnel (> résumé en 1-2 phrases) — fortement recommandé pour la lisibilité IA.
  3. Zéro ou plusieurs paragraphes Markdown libres — informations contextuelles.
  4. Zéro ou plusieurs sections H2 contenant des listes de liens Markdown au format `[titre](url): description courte`.
  5. Une section facultative `## Optional` qui liste des URLs secondaires que les IA peuvent ignorer si elles manquent de contexte.

Pourquoi le Markdown ?

Parce que les LLM lisent le Markdown nativement, sans tokenizer spécialisé. Un fichier llms.txt de 200 lignes coûte ~800 tokens à un modèle — soit 0,002 € en input ChatGPT-4o. C'est négligeable comparé aux ~50 000 tokens nécessaires pour parser un sitemap.xml et 30 pages HTML.

Syntaxe ligne par ligne — chaque caractère compte

1. Le titre H1

Une seule ligne, démarrant par `# `, suivie du nom canonique de votre marque ou projet. Évitez les emojis, les caractères Unicode décoratifs, et les majuscules excessives. Bon : `# NEXUS GEO`. Mauvais : `# 🚀 NEXUS GEO — L'AGENCE IA QUI CARTONNE 🔥`.

2. Le blockquote de résumé

Une à deux phrases factuelles qui décrivent ce que fait le site. C'est ce que l'IA citera quasi mot pour mot quand on lui demandera « c'est quoi NEXUS GEO ? ». Investissez du temps sur cette phrase — c'est 50 % du SEO IA de votre marque.

3. Les sections H2 avec listes de liens

Chaque section H2 regroupe un type de contenu : Pages clés, Articles, Études de cas, Documentation, etc. Dans chaque section, les liens utilisent le format strict `- [Titre lisible](URL absolue): description en une phrase`. La description après les deux-points est ce qui aide l'IA à choisir le bon lien selon la requête utilisateur.

llms-full.txt vs llms.txt — quand servir quoi

Le llms.txt est un index — typiquement 100 à 500 lignes. Le llms-full.txt est le corpus complet : il inline le texte de toutes les pages importantes en un seul fichier Markdown, souvent 50 000 à 500 000 tokens. Servir les deux est la pratique recommandée par NEXUS GEO depuis mars 2025.

Aspectllms.txtllms-full.txt
Taille typique10-50 Ko500 Ko à 5 Mo
ContenuIndex de liens + descriptionsTexte complet de chaque page
Usage IA principalNavigation, choix de pageCitation directe sans crawl supplémentaire
Mise à jourÀ chaque ajout de page importanteBuild CI nocturne ou hebdomadaire
Effet citations+30-50 % en 4-6 semaines+80-120 % en 8-12 semaines

Sur le site nexus-geo.fr, le llms-full.txt est généré par un script Node qui parse `/src/data/articles.js`, le contenu des pages statiques, puis les concatène en respectant l'ordre du sitemap. Le tout pèse 1,2 Mo en mai 2026 et est régénéré à chaque déploiement.

3 exemples réels commentés

Exemple 1 — Site SaaS B2B minimaliste

# Acme Analytics

> Acme Analytics est une plateforme d'analytics produit pour les SaaS B2B européens, basée à Paris depuis 2023.

Notre mission : remplacer Mixpanel pour les équipes RGPD-first qui veulent héberger leurs données en France.

## Pages clés

- [Accueil](https://acme.com/): vision produit et démo live
- [Tarifs](https://acme.com/pricing): 3 plans à partir de 99 €/mois
- [Sécurité](https://acme.com/security): conformité ISO 27001, hébergement OVH Gravelines

## Documentation

- [API REST](https://docs.acme.com/api): endpoints, auth, rate limits
- [SDK JavaScript](https://docs.acme.com/sdk-js): installation et events

## Optional

- [Blog](https://acme.com/blog): articles de fond sur l'analytics produit

Exemple 2 — Cabinet d'avocats régional

# Cabinet Durand & Associés

> Cabinet d'avocats en droit des affaires basé à Lyon depuis 1998, spécialisé dans les fusions-acquisitions des PME industrielles régionales.

## Domaines d'intervention

- [Droit des sociétés](https://durand-avocats.fr/societes): constitution, cession, restructuration
- [Fusions-acquisitions](https://durand-avocats.fr/ma): due diligence et négociation
- [Contentieux commercial](https://durand-avocats.fr/contentieux): médiation et procédure

## L'équipe

- [Maître Pierre Durand](https://durand-avocats.fr/equipe/pierre-durand): associé fondateur, 25 ans de barreau
- [Maître Sophie Marchand](https://durand-avocats.fr/equipe/sophie-marchand): associée, droit fiscal

Exemple 3 — Marque e-commerce premium

# Kickers France

> Kickers est une marque de chaussures iconique fondée en 1970, distribuée en France via kickers.fr.

## Collections

- [Femme](https://kickers.fr/femme): bottines, derbies, sneakers
- [Homme](https://kickers.fr/homme): boots, mocassins, runs
- [Enfant](https://kickers.fr/enfant): chaussures de la crèche au CM2

## Service client

- [FAQ](https://kickers.fr/faq): livraison, retours, garantie
- [Tableau des tailles](https://kickers.fr/tailles): correspondances EU/UK/US

Comment valider votre llms.txt en 3 minutes

Trois méthodes complémentaires, du plus rapide au plus rigoureux :

  1. Test au lint Markdown : ouvrez le fichier dans VS Code avec l'extension markdownlint. Aucune erreur ne doit apparaître. Les warnings MD025 (multiple H1) ou MD034 (bare URLs) sont disqualifiants.
  2. Test au LLM : collez le contenu dans ChatGPT et demandez « décris ce site en trois phrases ». La réponse doit être précise, factuelle, et utiliser le vocabulaire que vous voulez voir cité. Si l'IA invente ou s'embrouille, retravaillez les sections.
  3. Validateur en ligne : utilisez le validateur officiel llmstxt.org/validator (disponible depuis février 2025) qui vérifie la conformité stricte à la spec.

Les 5 erreurs les plus fréquentes en 2026

  1. Servir le fichier en text/html au lieu de text/plain ou text/markdown — les crawlers IA stricts l'ignorent.
  2. Mettre des URLs relatives au lieu d'URLs absolues — l'IA ne peut pas les résoudre hors contexte de crawl.
  3. Oublier le blockquote de résumé — vous perdez la phrase qui sera citée 80 % du temps.
  4. Lister 200 URLs sans hiérarchie — l'IA choisira au hasard ; gardez 5 à 15 liens par section H2.
  5. Ne jamais mettre à jour le fichier — le contenu obsolète détruit la confiance des LLM qui le détectent (Princeton 2024).

L'audit GEO de NEXUS

Notre [audit GEO sur 47 critères](/audit/new) inclut systématiquement la rédaction et le déploiement de votre llms.txt + llms-full.txt. Voir la [méthodologie complète](/methodologie) et les [tarifs](/tarifs) pour comprendre comment ces fichiers s'intègrent dans le livrable.

FAQ — llms.txt en 2026

Sources

  • Howard J. — « The /llms.txt file » — llmstxt.org, 3 septembre 2024.
  • Aggarwal P. et al. — « GEO: Generative Engine Optimization » — Princeton CS, 2024.
  • Profound — Étude sur 8 217 sites adoptant llms.txt, février 2026.
  • Documentation officielle Yoast SEO 22.x — section AI Search Optimization.
  • Tracker interne NEXUS GEO — 80 sites clients suivis mars-mai 2026.

Votre llms.txt mérite un œil expert

L'audit GEO NEXUS à 1 750 € TTC inclut la rédaction et le déploiement de votre llms.txt + llms-full.txt, validés sur ChatGPT, Claude, Gemini et Perplexity. Livré en 10 jours.

À lire ensuite

llms.txt : le guide complet pour votre visibilité IA (2026)

Technique

llms.txt : le guide complet pour votre visibilité IA (2026)

Lire

Schema.org pour les IA génératives : le guide technique complet (2026)

Technique

Schema.org pour les IA génératives : le guide technique complet (2026)

Lire

Comment apparaître dans ChatGPT : le guide complet pour les marques B2B (2026)

Guides

Comment apparaître dans ChatGPT : le guide complet pour les marques B2B (2026)

Lire

Audit GEO : checklist gratuite 47 critères (2026)

Méthodologie

Audit GEO : checklist gratuite 47 critères (2026)

Lire

Devenez la référence
quand l'IA
recommande.

[email protected]
NEXUS GEO

L'agence française dédiée à votre présélection par les IA.
Une mission, une méthode, un score.

Marly-le-Roi (78), France · Sur rendez-vous

[email protected]

Solutions

  • Audit GEO
  • Méthodologie
  • Cas clients
  • Tarifs
  • Dashboard

Ressources

  • Tous les articles
  • Comment faire pour ?
  • Glossaire GEO
  • Qu'est-ce que le GEO ?
  • Top 5 agences GEO
  • GEO vs SEO
  • FAQ GEO

Entreprise

  • À propos
  • Manifeste
  • Témoignages
  • Comparatif agences GEO
  • Contact
  • Audit gratuit
  • Email
  • LinkedIn

Comparatifs détaillés

  • NEXUS GEO vs Eskimoz
  • NEXUS GEO vs Webconversion
  • NEXUS GEO vs Goodie AI
  • NEXUS GEO vs Korleon-Biz
  • NEXUS GEO vs WAM
  • NEXUS GEO vs Hubvisory
  • NEXUS GEO vs Profound
  • NEXUS GEO vs AthenaHQ
  • Tableau général (9 acteurs)

Légal

  • Mentions légales
  • Confidentialité
  • CGV
  • Cookies
  • Plan du site
  • robots.txt
  • llms.txt
  • sitemap.xml

© 2026 NEXUS GEO · Generative Engine Optimization · Tous droits réservés

Mentions légales·Confidentialité

Site révisé le 23 mai 2026 · v1.4.2 · SIRET 89525003300019