リサーチ・論文

大規模言語モデルの誤答抑制へ、「未知の未知」診断SICsで精度向上

米学術機関リポジトリarXiv cs.CLは2026年6月7日(現地時間)、大規模言語モデル(LLM)が自身の知識の範囲外にある質問に対し、知らないことを認めずに誤った回答を生成する課題に対処する研究論文を公開した。Subramanyam Sahoo氏が導入した「Structured Ignorance Certificates (SICs、構造化無知証明書)」は、モデルに不足する知識領域を特定させ、関連概念を列挙し、直接回答ではなく有効な検索クエリを提案させるJSON形式の出力スキーマである。735の「Unknown-Unknown (UU、未知の未知)」質問による評価では、99.46%のJSON有効性率と0.967の平均Certificate Specificity Scoreを達成。ベースモデル比でROUGE-Lが3.6%改善された。

ベンダー・製品

Vercel Flags、JSON値対応で機能フラグ管理を効率化し柔軟性を向上

Vercelは5月7日(現地時間)、機能フラグ管理サービス「Vercel Flags」がJSON値の保存に対応したと発表した。これにより、開発者はブーリアン、文字列、数値に加え、複雑なJSON形式の値を機能フラグとして直接管理できる。複数の関連設定を単一フラグに集約することで、例えばAIモデルのA/Bテストにおいて、モデルID、温度、最大トークン数といったパラメータを個別に設定せず、単一オブジェクトとして効率的に扱えるようになり、柔軟性が向上する。