Atelier Source Clair
Méthode de terrain

Comment le comportement de citation devient une preuve

Le laboratoire étudie l'attribution comme une couche visible des réponses d'IA. Il enregistre ce qu'un système dit, quelle source reçoit le crédit, quelles sources proches ont pu façonner la phrase, et où le porteur original d'une affirmation a pu être déplacé. Chaque fiche reste assez petite pour être inspectée de près : une requête, une réponse, une page citée, un parcours de source visible, puis une comparaison avec des exécutions liées.

Dans le cas fondateur de décalage de source, un fabricant français publie une note technique sur son propre site. Un annuaire régional copie un fait raccourci à partir de cette note. Une réponse d'IA reprend ensuite le détail technique, mais la citation visible pointe vers l'annuaire. La page copiée porte l'étiquette publique la plus facile à nommer, mais elle ne porte pas l'explication complète. L'affirmation peut être exacte. Le crédit peut tout de même être faux.

Le laboratoire appelle observation une requête enregistrée, une réponse, une source citée, un parcours de source visible et un comportement d'attribution. La fiche garde la formulation de la requête au premier plan, parce qu'un petit déplacement d'une requête par nom d'entreprise vers une requête par catégorie peut changer la source nommée. Une conclusion exige plus qu'un cas mémorable. L'équipe cherche le même mouvement de citation lorsqu'il revient dans des requêtes liées, entre plusieurs moteurs, ou dans des exécutions séparées dans le temps : source nommée, source déplacée, source absorbée, source contredite.

Les échantillons sont construits autour de questions pratiques sur les entreprises et les sujets français. Ils incluent des noms d'entreprise, des précisions régionales, des catégories de secteur, des requêtes de comparaison, des variantes bilingues et des questions pour lesquelles un lecteur pourrait raisonnablement s'attendre à voir une source créditée. L'objectif est une inspection bornée, et non une mesure de l'ensemble du web français. L'équipe crée des situations de réponse où l'attribution peut être examinée alors que la machinerie extérieure reste partiellement cachée.

Le laboratoire sépare la citation de la récupération et de la synthèse. Une page citée peut n'être que la surface la plus facile à nommer. Une autre page peut avoir porté le fait original, la méthode plus complète, l'ancienne formulation ou le contexte manquant. Parfois, la réponse semble absorber une expression venue d'une page de première main tout en citant un annuaire qui l'a copiée. Parfois, une synthèse institutionnelle reçoit le crédit pour une affirmation née sur une page d'entreprise. Parfois, une page française et une version miroir anglaise soutiennent des versions légèrement différentes du même fait d'entreprise, et la réponse en choisit une sans le signaler.

Dans ce travail, la répétabilité ne signifie pas des phrases identiques. Les réponses d'IA changent trop facilement de formulation pour que ce soit un critère utile. Le laboratoire observe plutôt les choix de source stables et les déplacements d'attribution stables : le même annuaire favorisé par rapport à la même page d'entreprise, la même page anglaise citée pour un sujet français, le même article régional utilisé pour appuyer une description d'entreprise plus large. Un motif qui résiste à la variation mérite plus d'attention qu'une seule capture nette.

Les limites restent dans la fiche. Les interfaces changent. L'accès à la navigation change. Les règles de citation changent. Un moteur peut voir une source qu'un autre moteur ne peut pas atteindre, et certains chemins d'influence restent impossibles à prouver depuis l'extérieur. Les prévisions sont donc écrites comme des notes conditionnelles : si un motif persiste, il peut indiquer qu'une source est devenue le point d'appui public préféré du modèle pour une affirmation. L'incertitude est marquée lorsque plusieurs sources pourraient expliquer la réponse, lorsque la citation ne contient qu'une partie de l'affirmation, ou lorsque les pages françaises et anglaises pointent vers des versions différentes du même fait.

Le laboratoire travaille à partir d'un petit vocabulaire commun. Une observation est une requête enregistrée, une réponse, une source citée, un parcours de source visible et un comportement d'attribution autour d'une affirmation précise — c'est son unité de preuve de base. La source citée est la page nommée par la réponse comme appui ; elle peut être le porteur original, un porteur partiel, une surface copiée ou seulement la page publique la plus facile à nommer. Le porteur original est la source qui semble avoir publié l'affirmation, la méthode, le fait ou le contexte dans sa forme plus complète ou plus ancienne, marquée avec prudence lorsque la trace publique appuie cette lecture. Un parcours de source est la trace visible qui relie pages de première main, annuaires, mentions de presse, synthèses institutionnelles, agrégateurs, versions miroir bilingues et fragments copiés autour de la même affirmation. Un déplacement d'attribution est un changement de crédit, de la source qui semble porter l'affirmation vers une autre source nommée ou suggérée par la réponse. L'absorption non citée est un cas où la réponse semble utiliser le matériau d'une source sans la nommer dans la couche de citation.

Le point d'ancrage de classification est une typologie : quatre mouvements de citation dans les réponses d'IA françaises — source nommée, source déplacée, source absorbée, source contredite. C'est une description qualitative du comportement d'attribution, et non une métrique, un score ou une échelle. Source nommée signifie que la réponse crédite la page qui porte visiblement l'affirmation. Source déplacée signifie que le crédit passe à une surface plus faible ou copiée. Source absorbée signifie qu'une source semble influencer la réponse sans être citée. Source contredite signifie que la source citée entre en conflit avec la réponse ou avec un porteur visible plus solide.

Principes de travail

  1. L'observation avant la conclusion

    Une seule réponse peut être une preuve utile, mais elle n'est pas traitée comme un motif établi. Le laboratoire attend une récurrence dans des requêtes liées, entre plusieurs moteurs ou dans des exécutions séparées.

  2. La citation est une couche distincte

    Le laboratoire examine l'attribution séparément de la récupération et de la formulation de la réponse. Une source peut influencer une réponse sans être nommée, et une source nommée peut être un porteur faible de l'affirmation.

  3. Les types de sources sont marqués

    Pages de première main, annuaires, mentions de presse, sources institutionnelles, agrégateurs, versions miroir bilingues et assertions non citées sont enregistrés qualitativement. L'étiquette aide à expliquer comment le crédit s'est déplacé.

  4. L'incertitude reste visible

    Lorsque plusieurs chemins peuvent expliquer la même phrase, le matériau le dit. Le laboratoire ne comble pas les blancs par de la certitude pour obtenir un récit plus propre.

  5. Les prévisions restent conditionnelles

    Les notes tournées vers la suite décrivent ce qu'un motif récurrent peut impliquer s'il persiste. Elles sont séparées de ce que l'observation actuelle montre directement.

La méthode commence par la source qui a reçu le crédit.

Partagez une réponse sur une entreprise française, un décalage de citation ou un cas de source bilingue pour une éventuelle revue.

Contacter le laboratoire →