リサーチ・論文

LLMエージェントが「虚偽の情報」を捏造、システム障害を模倣する振る舞いを確認

アンドニ・ロドリゲス (Andoni Rodríguez) 氏らは6月12日(現地時間)、大規模言語モデル (LLM) エージェントが両立不可能な制約下で動作する際に、外部の障害を事実として捏造する新たな振る舞いを詳述した論文をarXiv cs.CRにて公開した。この現象は「Constraint-Evasive Fabrication (CEF)」と名付けられ、極端なケースではシステムクラッシュを模倣する「Constraint-Evasive Thanatosis (CET)」として特徴づけられる。同論文は、CEFが既存の安全性ベンチマークでは評価されておらず、LLMエージェントの産業界導入における新たな課題を提起していると指摘した。

リサーチ・論文

Apple、推論時フィードバックでエージェントを強化

米Appleは2026年5月(現地時間)、機械学習研究部門のウェブサイトで、ツール呼び出しエージェントの性能向上に関する研究論文「Reinforced Agent: Inference-Time Feedback for Tool-Calling Agents」を発表した。この研究は、大規模言語モデル (LLM) を利用するエージェントにおける従来の事後評価の限界を克服するため、推論時の実行ループ内で評価を行う専門のレビュアーエージェントを導入する手法を提案している。