Le mécanisme
Comment ChatGPT, Perplexity et Gemini choisissent les sources qu'ils citent
Une IA générative ne "lit" pas votre site comme un humain. Elle cherche des faits qu'elle peut extraire avec certitude, vérifier, et reformuler sans risque de se tromper. Voici, concrètement, ce qui fait pencher la balance en votre faveur — les six mêmes critères que ChatJaune analyse sur votre site.
Deux façons dont une IA trouve l'information
ChatGPT combine ses connaissances entraînées à l'avance avec des recherches web en temps réel quand la question l'exige ; il privilégie les contenus complets, bien sourcés, avec des signaux d'expertise clairs. Perplexity, de son côté, fonctionne quasiment toujours en recherche live et se distingue par une forte exigence de fraîcheur et de traçabilité de ses sources — il indique d'ailleurs plus systématiquement ses citations que les autres. Gemini, lui, s'appuie directement sur l'index de recherche de Google — les mêmes pages bien structurées qui aident votre référencement classique l'aident aussi ici. Dans tous les cas, un contenu ambigu, mal structuré ou introuvable au bon moment est simplement ignoré.
Les 6 critères qui font la différence
1. Données structurées (schema.org)
Un bloc JSON-LD "Organization" ou "LocalBusiness" donne à la machine une fiche d'identité non ambiguë : nom, activité, adresse, horaires. Sans ça, l'IA doit deviner ces informations dans du texte libre — avec un risque d'erreur qu'elle préfère éviter en ne vous citant pas du tout.
2. Cohérence NAP (Nom, Adresse, Téléphone)
Si votre adresse diffère entre votre site, votre fiche Google et un annuaire professionnel, une IA ne peut pas être sûre de laquelle est correcte — et une IA qui n'est pas sûre ne prend pas le risque de citer une information fausse.
3. FAQ structurée en JSON-LD
Une FAQ balisée "FAQPage" présente déjà vos réponses au format exact qu'une IA conversationnelle cherche à produire — question, réponse claire. C'est le format le plus directement "réutilisable" qui existe.
4. Fichier llms.txt
C'est l'équivalent du robots.txt, mais pour les IA : un fichier texte à la racine de votre site qui indique explicitement quelles pages sont prioritaires et résume votre activité. Peu de sites l'ont — c'est donc un signal simple à mettre en place qui vous démarque encore aujourd'hui.
5. Métadonnées (description, Open Graph)
Une meta description claire et des balises Open Graph donnent à l'IA un résumé fiable de chaque page en un coup d'œil, sans avoir à analyser tout le contenu pour deviner de quoi elle parle.
6. Lisibilité pour les LLM
Des phrases courtes, des titres clairs, un contenu suffisamment développé : c'est plus facile à découper et à citer pour un modèle de langage qu'un mur de texte marketing dense ou des formulations vagues.
Aucun de ces six critères ne demande de refaire votre site. Ce sont des ajustements ciblés, souvent quelques blocs de code à ajouter à des endroits précis.