La spec officielle 2026 — ce que dit Jeremy Howard
Le standard llms.txt a été publié sur llmstxt.org le 3 septembre 2024 par Jeremy Howard, cofondateur d'Answer.AI et créateur de fastai. L'idée : donner aux LLM un point d'entrée structuré, lisible à la fois par humains et par machines, pour expliquer la structure d'un site sans devoir crawler 10 000 pages.
Le format suit cinq règles strictes que NEXUS GEO applique à chaque déploiement :
- Un titre H1 unique (# Nom du projet ou de la marque) — obligatoire.
- Un blockquote optionnel (> résumé en 1-2 phrases) — fortement recommandé pour la lisibilité IA.
- Zéro ou plusieurs paragraphes Markdown libres — informations contextuelles.
- Zéro ou plusieurs sections H2 contenant des listes de liens Markdown au format `[titre](url): description courte`.
- Une section facultative `## Optional` qui liste des URLs secondaires que les IA peuvent ignorer si elles manquent de contexte.
Syntaxe ligne par ligne — chaque caractère compte
1. Le titre H1
Une seule ligne, démarrant par `# `, suivie du nom canonique de votre marque ou projet. Évitez les emojis, les caractères Unicode décoratifs, et les majuscules excessives. Bon : `# NEXUS GEO`. Mauvais : `# 🚀 NEXUS GEO — L'AGENCE IA QUI CARTONNE 🔥`.
2. Le blockquote de résumé
Une à deux phrases factuelles qui décrivent ce que fait le site. C'est ce que l'IA citera quasi mot pour mot quand on lui demandera « c'est quoi NEXUS GEO ? ». Investissez du temps sur cette phrase — c'est 50 % du SEO IA de votre marque.
3. Les sections H2 avec listes de liens
Chaque section H2 regroupe un type de contenu : Pages clés, Articles, Études de cas, Documentation, etc. Dans chaque section, les liens utilisent le format strict `- [Titre lisible](URL absolue): description en une phrase`. La description après les deux-points est ce qui aide l'IA à choisir le bon lien selon la requête utilisateur.
llms-full.txt vs llms.txt — quand servir quoi
Le llms.txt est un index — typiquement 100 à 500 lignes. Le llms-full.txt est le corpus complet : il inline le texte de toutes les pages importantes en un seul fichier Markdown, souvent 50 000 à 500 000 tokens. Servir les deux est la pratique recommandée par NEXUS GEO depuis mars 2025.
| Aspect | llms.txt | llms-full.txt |
|---|---|---|
| Taille typique | 10-50 Ko | 500 Ko à 5 Mo |
| Contenu | Index de liens + descriptions | Texte complet de chaque page |
| Usage IA principal | Navigation, choix de page | Citation directe sans crawl supplémentaire |
| Mise à jour | À chaque ajout de page importante | Build CI nocturne ou hebdomadaire |
| Effet citations | +30-50 % en 4-6 semaines | +80-120 % en 8-12 semaines |
Sur le site nexus-geo.fr, le llms-full.txt est généré par un script Node qui parse `/src/data/articles.js`, le contenu des pages statiques, puis les concatène en respectant l'ordre du sitemap. Le tout pèse 1,2 Mo en mai 2026 et est régénéré à chaque déploiement.
3 exemples réels commentés
Exemple 1 — Site SaaS B2B minimaliste
# Acme Analytics
> Acme Analytics est une plateforme d'analytics produit pour les SaaS B2B européens, basée à Paris depuis 2023.
Notre mission : remplacer Mixpanel pour les équipes RGPD-first qui veulent héberger leurs données en France.
## Pages clés
- [Accueil](https://acme.com/): vision produit et démo live
- [Tarifs](https://acme.com/pricing): 3 plans à partir de 99 €/mois
- [Sécurité](https://acme.com/security): conformité ISO 27001, hébergement OVH Gravelines
## Documentation
- [API REST](https://docs.acme.com/api): endpoints, auth, rate limits
- [SDK JavaScript](https://docs.acme.com/sdk-js): installation et events
## Optional
- [Blog](https://acme.com/blog): articles de fond sur l'analytics produitExemple 2 — Cabinet d'avocats régional
# Cabinet Durand & Associés
> Cabinet d'avocats en droit des affaires basé à Lyon depuis 1998, spécialisé dans les fusions-acquisitions des PME industrielles régionales.
## Domaines d'intervention
- [Droit des sociétés](https://durand-avocats.fr/societes): constitution, cession, restructuration
- [Fusions-acquisitions](https://durand-avocats.fr/ma): due diligence et négociation
- [Contentieux commercial](https://durand-avocats.fr/contentieux): médiation et procédure
## L'équipe
- [Maître Pierre Durand](https://durand-avocats.fr/equipe/pierre-durand): associé fondateur, 25 ans de barreau
- [Maître Sophie Marchand](https://durand-avocats.fr/equipe/sophie-marchand): associée, droit fiscalExemple 3 — Marque e-commerce premium
# Kickers France
> Kickers est une marque de chaussures iconique fondée en 1970, distribuée en France via kickers.fr.
## Collections
- [Femme](https://kickers.fr/femme): bottines, derbies, sneakers
- [Homme](https://kickers.fr/homme): boots, mocassins, runs
- [Enfant](https://kickers.fr/enfant): chaussures de la crèche au CM2
## Service client
- [FAQ](https://kickers.fr/faq): livraison, retours, garantie
- [Tableau des tailles](https://kickers.fr/tailles): correspondances EU/UK/USComment valider votre llms.txt en 3 minutes
Trois méthodes complémentaires, du plus rapide au plus rigoureux :
- Test au lint Markdown : ouvrez le fichier dans VS Code avec l'extension markdownlint. Aucune erreur ne doit apparaître. Les warnings MD025 (multiple H1) ou MD034 (bare URLs) sont disqualifiants.
- Test au LLM : collez le contenu dans ChatGPT et demandez « décris ce site en trois phrases ». La réponse doit être précise, factuelle, et utiliser le vocabulaire que vous voulez voir cité. Si l'IA invente ou s'embrouille, retravaillez les sections.
- Validateur en ligne : utilisez le validateur officiel llmstxt.org/validator (disponible depuis février 2025) qui vérifie la conformité stricte à la spec.
Les 5 erreurs les plus fréquentes en 2026
- Servir le fichier en text/html au lieu de text/plain ou text/markdown — les crawlers IA stricts l'ignorent.
- Mettre des URLs relatives au lieu d'URLs absolues — l'IA ne peut pas les résoudre hors contexte de crawl.
- Oublier le blockquote de résumé — vous perdez la phrase qui sera citée 80 % du temps.
- Lister 200 URLs sans hiérarchie — l'IA choisira au hasard ; gardez 5 à 15 liens par section H2.
- Ne jamais mettre à jour le fichier — le contenu obsolète détruit la confiance des LLM qui le détectent (Princeton 2024).
FAQ — llms.txt en 2026
Sources
- Howard J. — « The /llms.txt file » — llmstxt.org, 3 septembre 2024.
- Aggarwal P. et al. — « GEO: Generative Engine Optimization » — Princeton CS, 2024.
- Profound — Étude sur 8 217 sites adoptant llms.txt, février 2026.
- Documentation officielle Yoast SEO 22.x — section AI Search Optimization.
- Tracker interne NEXUS GEO — 80 sites clients suivis mars-mai 2026.
Votre llms.txt mérite un œil expert
L'audit GEO NEXUS à 1 750 € TTC inclut la rédaction et le déploiement de votre llms.txt + llms-full.txt, validés sur ChatGPT, Claude, Gemini et Perplexity. Livré en 10 jours.
