Qu'est-ce que la divergence entre modèles ?

Réponse en 60 secondes

La divergence entre modèles est l'étude technique de quand et pourquoi des modèles de langage indépendants produisent des réponses différentes à la même entrée. Là où le désaccord IA est l'expérience utilisateur de la différence, la divergence est le prisme d'ingénierie sur les causes sous-jacentes — les schémas qui expliquent pourquoi un panel se divise sur une question particulière. Comprendre la divergence est comment un système de vérification transforme le désaccord de bruit en source d'information structurée.

La divergence n'est pas aléatoire. Elle s'agglutine autour de causes spécifiques — lacunes des données d'entraînement, dates de fin d'entraînement, différences de fine-tuning d'instruction, famille architecturale — et un système qui reconnaît la cause peut faire des choses utiles avec le désaccord plutôt que de simplement rapporter qu'il existe.

Une définition formelle

La divergence entre modèles est la différence mesurable entre les sorties de modèles indépendants sur la même entrée. La mesure a trois couches.

Divergence de surface. Formulation différente, sens éventuellement identique. La divergence de surface est principalement cosmétique et ne devrait pas être confondue avec le désaccord substantiel.

Divergence sémantique. Affirmations différentes sur la réalité, même après normalisation de la formulation de surface. La divergence sémantique est la couche qui compte pour la vérification — c'est ce qui dit à l'utilisateur que le panel est en désaccord sur quelque chose de réel.

Divergence évidentielle. Sources différentes ou interprétations différentes de la même source. La divergence évidentielle est la couche la plus profonde ; elle pointe vers une ambiguïté authentique dans le dossier public sous-jacent.

Un traitement sérieux de la divergence distingue les trois couches. La divergence de surface ne mérite pas d'investigation. La divergence sémantique mérite l'attention de l'utilisateur. La divergence évidentielle mérite la consultation d'experts.

Les causes structurelles de la divergence entre modèles

La divergence n'est pas aléatoire. Elle s'agglutine autour de cinq causes identifiables.

Composition des données d'entraînement. Des modèles entraînés sur des corpus différents — mélanges différents de web public, littérature académique, code, livres, données multilingues — développent des intuitions différentes sur les mêmes questions. Un modèle entraîné lourdement sur des sources américaines répond différemment à propos de sujets européens qu'un modèle entraîné sur un corpus plus équilibré.

Date de fin d'entraînement. Les modèles ont différentes dates « d'expiration du savoir ». Sur les sujets qui ont changé récemment — lois, découvertes scientifiques, réglementations, prix — les modèles à fin d'entraînement plus ancienne divergent prévisiblement des modèles à fin plus récente. La divergence est datée ; un système attentif peut identifier de quel côté d'un changement connu chaque modèle se situe.

Fine-tuning d'instruction et RLHF. Les modèles sont post-entraînés avec des objectifs différents. Certains sont accordés pour être plus prudents, certains plus directs. Certains sont accordés pour ajouter des nuances ; d'autres pour les omettre. Ces différences d'accordage produisent une divergence sur le style de la réponse même quand l'affirmation substantielle est la même.

Architecture et échelle. Les modèles plus petits raisonnent moins en profondeur sur les problèmes multi-étapes ; les plus gros les gèrent mieux. Sur les questions qui exigent de parcourir plusieurs étapes d'inférence, la divergence entre petits et grands modèles est structurelle et prévisible.

Échantillonnage aléatoire. Chaque modèle a un réglage de température et une génération stochastique. Ré-échantillonner le même modèle produit de petites variations qui ne sont pas vraiment de la « divergence » au sens significatif — c'est du bruit au sein d'une seule surface statistique.

Un système de vérification qui connaît ces causes peut étiqueter utilement les divergences. « Les modèles convergent sauf un avec une date de fin d'entraînement plus ancienne » est plus utile à la décision que « le panel s'est divisé ». L'étiquetage transforme le désaccord en diagnostic.

Comment un système de vérification utilise la divergence

Un système multi-modèles bien conçu traite la divergence comme une sortie de premier ordre et l'utilise de trois façons.

Comme signal de calibration. Là où la divergence est élevée, la confiance est en conséquence plus basse. Le score d'accord se lit sur le schéma de divergence.

Comme drapeau pour vérification par source primaire. Là où la divergence est élevée sur des affirmations factuelles spécifiques, le système signale ces affirmations pour l'attention de l'utilisateur ou pour une récupération automatisée contre des sources autoritatives.

Comme indice UI. La divergence est mise sous les yeux de l'utilisateur dans l'interface explicitement — pas enfouie dans une note de bas de page. L'utilisateur lisant la sortie voit quelles affirmations sont convergentes (la plupart de la réponse) et lesquelles sont divergentes (les parties qui nécessitent une attention supplémentaire). C'est le mouvement qui convertit la sortie multi-modèles brute en un produit utile.

Un système qui n'utilise pas la divergence — qui la lisse en une réponse confiante unique — a fait le travail d'exécuter plusieurs modèles et a jeté le signal le plus précieux que ce travail a produit.

Exemples pratiques

Divergence de récence. Un utilisateur demande à propos d'un changement légal récent. Cinq modèles disent « la loi est X » ; un dit « la loi était X jusqu'à l'année dernière ; elle est maintenant Y ». Le schéma de divergence est cohérent avec un modèle ayant une date de fin d'entraînement plus récente. Le système peut signaler cela explicitement et l'utilisateur peut investiguer l'angle récence directement.

Divergence géographique. Un utilisateur demande à propos d'un sujet avec forte variation géographique — droit du travail, cadres de santé, structure fiscale. Les modèles entraînés sur différents mélanges de données géographiques divergent prévisiblement. Le système peut faire émerger l'angle géographique et demander à l'utilisateur de spécifier quelle juridiction compte.

Divergence architecturale. Un utilisateur pose une question d'inférence multi-étapes. Les modèles plus grands atteignent une conclusion ; les plus petits atteignent une conclusion différente parce qu'ils tronquent la chaîne de raisonnement. Le système peut signaler la question comme inférentielle et pondérer les modèles plus grands plus fortement.

Divergence d'accordage. Un utilisateur demande sur un sujet contesté. Les modèles accordés pour être prudents ajoutent des nuances ; les modèles accordés pour être directs donnent la conclusion. Le contenu substantiel est similaire ; le cadrage diffère. C'est de la divergence de surface déguisée en divergence sémantique ; un bon système le reconnaît et le décompte.

Idées reçues courantes

« Divergence veut dire que les modèles sont bugués. » Non. La divergence est une caractéristique des raisonneurs indépendants. La question intéressante est ce que la divergence révèle — pas comment la supprimer.

« Toute divergence est également importante. » La divergence de surface est cosmétique. La divergence sémantique est significative. La divergence évidentielle est la plus importante. Les traiter pareillement est un échec UX.

« Plus de divergence équivaut à une sortie pire. » Plus de divergence équivaut à un rapport plus honnête de l'incertitude sous-jacente. Un sujet sur lequel le panel est en désaccord était un sur lequel l'utilisateur avait besoin de savoir qu'il était contesté.

« La divergence devrait être supprimée dans le résumé final. » Non. Cacher la divergence produit une réponse plus soignée mais moins utile. Le mouvement honnête est de préserver la divergence avec une attribution claire.

Concepts apparentés

Le désaccord IA est l'expérience utilisateur de la divergence. Le consensus IA est le système plus large qui fait émerger à la fois convergence et divergence. La vérification multi-modèles est l'ingénierie de mesurer la divergence à l'échelle. Le score d'accord IA est la lecture quantitative qui complète l'affichage qualitatif de la divergence. La confiance IA est le cadre plus large de comment la divergence affecte la confiance calibrée.

Questions fréquentes

La divergence est-elle la même chose que le désaccord ? Le désaccord est le mot utilisateur ; la divergence est le mot technique. Ils réfèrent au même phénomène à différents niveaux de description.

Puis-je dire quel modèle a raison quand ils divergent ? Parfois — quand les schémas de divergence correspondent à des causes connues (récence, géographie, architecture). Souvent, seule une investigation plus poussée contre les sources primaires peut déterminer quel côté a la bonne réponse.

Supprimer la divergence améliore-t-il la réponse ? Cela supprime une information utile. Le traitement honnête est de préserver la divergence et de la faire émerger clairement.

Pourquoi tous les modèles ne convergent-ils pas s'ils ont été entraînés sur du texte internet similaire ? Parce que « similaire » n'est pas « identique ». Différents mélanges de données d'entraînement, différents objectifs, différents accordages post-entraînement, et différentes architectures produisent tous des intuitions systématiquement différentes. Convergence sur les questions courantes ; divergence sur la longue traîne.