#MachineLearning 関連記事

「SafeGene」、LLMの安全性劣化を防ぐ再利用可能アダプターを提案

arXiv cs.AIは2026年6月2日(現地時間)付けで提出された論文で、オープンウェイト大規模言語モデル（LLM）のファインチューニング時に頻発する安全アライメントの弱体化という課題に対し、革新的な解決策「SafeGene」を発表した。SafeGeneは、モデル固有の修復ではなく、タスク横断的に再利用可能な安全性アダプターモジュールとして機能するよう設計されており、アーキテクチャ互換性のあるモデルファミリー全体でその有効性を示している。これにより、LLMの安全性を効率的に維持しつつ、多様なカスタム利用への適応を可能にする。

リサーチ・論文 5月28日 19:18 注目

PEFT評価に新ベンチマーク「PEFT-Arena」安定性・可塑性から分析

Yangyi Huang氏らは5月27日(現地時間)、大規模言語モデル（LLM）のParameter-efficient finetuning (PEFT)に関する新たな評価手法「PEFT-Arena」を発表した。この研究は、PEFTの評価が、ダウンストリームタスクの精度だけでなく、事前学習済み能力の保持も考慮すべきという問題提起に基づいている。「PEFT-Arena」は、ターゲットタスクへの適応能力（可塑性）と忘却への耐性（安定性）という「安定性-可塑性ジレンマ」の観点からPEFTを評価する。複数のPEFT手法を比較した結果、同等のパラメータ予算において、直交ファインチューニングが最も有利な「パレートフロンティア」を達成したという。

リサーチ・論文 5月28日 03:22 注目

SLMの出力制約「Constraint Tax」指摘、精度と妥当性のトレードオフを浮上

Jaideep Ray氏は2026年5月20日(現地時間)、論文「The Constraint Tax: Measuring Validity-Correctness Tradeoffs in Structured Outputs for Small Language Models」を発表し、小型言語モデル (SLM) に見られる「constraint tax (制約税)」現象を提唱した。構造化出力が求められるSLMにおいて、厳格な出力制約を課すと、スキーマ妥当性は高まる一方で回答精度が大幅に低下することを指摘。この課題がプロダクション環境でのSLM導入において重要性を持つとした。

リサーチ・論文 5月16日 16:27 注目

EviScreen、履歴症例から領域証拠活用し診断精度と解釈性を向上

Chenyu Lian氏らは5月14日(現地時間)、疾患スクリーニング向けフレームワーク「EviScreen」をarXiv cs.CVで発表した。既存の医療画像診断モデルが抱える解釈性の低さや性能不足に対し、過去症例から領域レベルの証拠を用いる証拠推論アプローチを導入。臨床レベルのリコールを維持しつつ特異度を顕著に高め、リアルワールドの疾患スクリーニングにおいて優れた性能と客観的な解釈可能性を実現したと報告されている。

リサーチ・論文 5月14日 04:34

拡散型言語モデル向け制御生成、適応型スケジューラーで改善

arXiv cs.LGは2026年5月8日(現地時間)、Hanhan Zhou、Shamik Roy、Rashmi Gangadharaiahの3氏による論文を発表した。同論文は、離散拡散型言語モデル（DLMs）における制御生成手法の改善を提案。既存手法が抱える生成品質の低下という課題に対し、属性のコミットタイミングに応じた適応型スケジューラーの有効性を示した。

リサーチ・論文 5月8日 08:32

Apple、知覚品質と高速性を両立させた画像コーデック研究発表

Apple Machine Learning Researchは2026年5月(現地時間)、知覚品質と実行速度の双方を最適化する実用的な学習型画像コーデックに関する包括的な研究成果を発表した。この研究では、主要なモデリング選択肢を詳細に検討し、新たなコーデックを構築。従来のコーデックだけでなく、既存の学習型コーデックと比較しても、大幅な圧縮性能の向上と高速な処理能力を実現している。特に、iPhone 17 Pro Maxにおいては12メガピクセル画像のエンコードを230ミリ秒、デコードを150ミリ秒で完了できる性能を示しており、モバイルデバイスにおける高画質コンテンツの処理に新たな可能性を開くものと期待される。

リサーチ・論文 5月8日 00:36

Apple、推論時フィードバックでエージェントを強化

米Appleは2026年5月(現地時間)、機械学習研究部門のウェブサイトで、ツール呼び出しエージェントの性能向上に関する研究論文「Reinforced Agent: Inference-Time Feedback for Tool-Calling Agents」を発表した。この研究は、大規模言語モデル (LLM) を利用するエージェントにおける従来の事後評価の限界を克服するため、推論時の実行ループ内で評価を行う専門のレビュアーエージェントを導入する手法を提案している。

#MachineLearning