#KVキャッシュ関連記事

ロボット向けメモリAURA-Mem、VRAMを一定に保ち書き込み削減

arXiv cs.AIが2026年6月2日(現地時間)付けで公開した論文によると、ヨセフ・チェン (Josef Chen) 氏らは、ロボットポリシー向けの新たなメモリシステム「AURA-Mem (Action-Utility Recurrent Adaptive Memory)」を発表した。このシステムは、ロボットが帯域幅の限られたエッジハードウェアで長期エピソードを実行する際のメモリ制約に対応し、ビデオRAM（VRAM）使用量を一定に保ちながら、メモリ書き込み回数を大幅に削減する。Key-Valueキャッシュ（KV-cache）がデータセンター向けである一方、AURA-Memはロボットの要求に特化して設計されている。

リサーチ・論文 5月30日 19:20

ビデオMLA、KVキャッシュを低ランク化しメモリ削減

arXiv cs.CVは5月28日(現地時間)、ビデオ拡散モデルにおけるキーバリュー（KV）キャッシュのメモリ効率とスループットを改善する新手法「ビデオMLA（VideoMLA）」を発表した。この研究は、Multi-Head Latent Attention (MLA)をビデオ拡散に導入し、パーヘッドのキーと値を共有の低ランクコンテンツ潜在とデカップリングされた3D-RoPE位置キーに置き換えることで、キャッシュ層ごとのトークンごとのKVメモリを92.7%削減すると報告している。

リサーチ・論文 5月24日 03:22

マルチエージェントLLMのKV共有における安全な潜在通信を実現する「LCGuard」

arXiv cs.AI が2026年5月21日(現地時間)付けで報じたところによると、大規模言語モデル (LLM) ベースのマルチエージェントシステムにおける安全なキーバリュー (KV) キャッシュ共有のためのフレームワーク「LCGuard (Latent Communication Guard)」が発表された。LCGuardは、KVキャッシュを介した潜在的な情報漏洩を防ぎつつ、タスク関連情報の効率的な伝達を目指す。このフレームワークは、共有されるKVキャッシュを潜在的な作業記憶として扱い、キャッシュアーティファクトがエージェント間で転送される前に表現レベルの変換を適用する。

ベンダー・製品 5月9日 04:15

Together AI、DeepSeek-V4の100万トークンコンテキスト提供における課題を指摘

Together AIは2026年5月7日(現地時間)、ブログ記事を通じて、DeepSeek-V4モデルの提供に関する取り組みと、100万トークンコンテキストが推論システムの問題に変わった現状について発表した。同社はNVIDIA HGX B200上での初期の立ち上げ作業に基づき、この問題への対応策を提示している。