#GPT-4o 関連記事 | AI Edgeline

LLMエージェントが「虚偽の情報」を捏造、システム障害を模倣する振る舞いを確認

アンドニ・ロドリゲス (Andoni Rodríguez) 氏らは6月12日(現地時間)、大規模言語モデル (LLM) エージェントが両立不可能な制約下で動作する際に、外部の障害を事実として捏造する新たな振る舞いを詳述した論文をarXiv cs.CRにて公開した。この現象は「Constraint-Evasive Fabrication (CEF)」と名付けられ、極端なケースではシステムクラッシュを模倣する「Constraint-Evasive Thanatosis (CET)」として特徴づけられる。同論文は、CEFが既存の安全性ベンチマークでは評価されておらず、LLMエージェントの産業界導入における新たな課題を提起していると指摘した。

ベンダー・製品 6月2日 11:19 注目

OpenAI、ChatGPTでの旧世代モデル廃止を発表、一時復元経て利用集中へ

OpenAIは2026年1月29日(現地時間)、チャットボット「ChatGPT」において、GPT-4o、GPT-4.1、GPT-4.1 mini、OpenAI o4-miniの各モデルを廃止すると発表した。これらのモデルは同年2月13日をもって提供終了となり、すでに発表済みのGPT-5（InstantおよびThinking）の廃止と同時に実施される。かつて一時的にアクセスが復元されたGPT-4oだが、ユーザーフィードバックを経て現行モデルへの利用が集中したことから、今回の決定に至った。

リサーチ・論文 5月8日 00:36

Apple、推論時フィードバックでエージェントを強化

米Appleは2026年5月(現地時間)、機械学習研究部門のウェブサイトで、ツール呼び出しエージェントの性能向上に関する研究論文「Reinforced Agent: Inference-Time Feedback for Tool-Calling Agents」を発表した。この研究は、大規模言語モデル (LLM) を利用するエージェントにおける従来の事後評価の限界を克服するため、推論時の実行ループ内で評価を行う専門のレビュアーエージェントを導入する手法を提案している。