リサーチ・論文

拡散型言語モデル向け制御生成、適応型スケジューラーで改善

arXiv cs.LGは2026年5月8日(現地時間)、Hanhan Zhou、Shamik Roy、Rashmi Gangadharaiahの3氏による論文を発表した。同論文は、離散拡散型言語モデル(DLMs)における制御生成手法の改善を提案。既存手法が抱える生成品質の低下という課題に対し、属性のコミットタイミングに応じた適応型スケジューラーの有効性を示した。

リサーチ・論文

Apple、知覚品質と高速性を両立させた画像コーデック研究発表

Apple Machine Learning Researchは2026年5月(現地時間)、知覚品質と実行速度の双方を最適化する実用的な学習型画像コーデックに関する包括的な研究成果を発表した。この研究では、主要なモデリング選択肢を詳細に検討し、新たなコーデックを構築。従来のコーデックだけでなく、既存の学習型コーデックと比較しても、大幅な圧縮性能の向上と高速な処理能力を実現している。特に、iPhone 17 Pro Maxにおいては12メガピクセル画像のエンコードを230ミリ秒、デコードを150ミリ秒で完了できる性能を示しており、モバイルデバイスにおける高画質コンテンツの処理に新たな可能性を開くものと期待される。

リサーチ・論文

Apple、推論時フィードバックでエージェントを強化

米Appleは2026年5月(現地時間)、機械学習研究部門のウェブサイトで、ツール呼び出しエージェントの性能向上に関する研究論文「Reinforced Agent: Inference-Time Feedback for Tool-Calling Agents」を発表した。この研究は、大規模言語モデル (LLM) を利用するエージェントにおける従来の事後評価の限界を克服するため、推論時の実行ループ内で評価を行う専門のレビュアーエージェントを導入する手法を提案している。