リサーチ・論文

拡散言語モデルのトークン編集精度向上、自己生成エラー学習で実現

arXiv cs.CLは6月15日(現地時間)、リン・ヤオ (Lin Yao) 氏による研究論文「Self-Generated Error Training for Token Editing in Diffusion Language Models」を公開した。本論文は、拡散言語モデル (Diffusion Language Models) におけるトークン編集の精度を高める新たな手法を提案している。特に、LLaDA2.1を用いたブロック拡散デコーディングプロセス中に確定されたトークンを修正するトークン間 (T2T) 編集が抱える課題に対応する。

リサーチ・論文

FuRAがLoRAを凌駕、フルランク適応フレームワークで事前学習モデル微調整効率化

arXiv cs.LGは2026年5月19日(現地時間)、Yequan Zhao氏らの研究チームが新たなフレームワーク「FuRA (Full-Rank Adaptation)」を提案したと発表した。この論文によると、FuRAは事前学習済みモデルの微調整効率を高めるもので、既存のFull fine-tuning (Full FT) やLoRAが考慮しなかった事前学習中のスペクトル構造を利用する。これにより、FuRAはパラメーター、メモリ、ステップ時間の効率をLoRAと同等に保ちながら、複数の設定でFull FTを上回る性能を実現した。

ベンダー・製品

医療AI「MedQA」がAMD ROCmで稼働、CUDAなしでファインチューニング

MedQAプロジェクトは5月7日(現地時間)、AMD ROCm環境を活用し、臨床質問応答モデルのファインチューニングに成功した。これはNVIDIA CUDAに依存せず、AMD Instinct MI300X上でHugging Faceのエコシステムが機能することを実証するものである。Qwen3-1.7Bモデルを基盤に、医療分野の多肢選択式質問への回答と、その背後にある臨床的説明の生成を目指しており、新たな医療AI開発の可能性を示している。