AIファクトチェックの本当の問題

ChatGPTに法的条項を貼り付けます。AIはすべて正確だと確認します。プロフェッショナルなトーン。よく構造化された回答。信頼します。

しかし、その条項が間違っていたら？AIも同様だったとしたら？

AIのハルシネーション問題はよく知られていますが、本当の難しさはより微妙です：AIは不確実性を示しながら間違いを犯しません。正しいときと全く同じトーンで間違えます。正しい回答と作り上げられた回答の間に視覚的な違いはありません。

データ：20の質問で何が起きたか

10問中4問で、6つのモデルが実質的に矛盾しています。

短い答え：単一のモデルがファクトチェックに「最高」というものはありません。複数モデル間の合意スコアが実際に機能します：

主張、医療的質問、法的条項を貼り付け — 6つのAIモデルがどこで同意し、どこで異なるかを確認してください。

ファクトチェックセッション：12秒。すべての結果に合意スコアを表示。最初のセッション無料。

関連記事：