Apple ML Research、「VideoFlexTok」発表 長尺動画を効率処理
Apple ML Researchは2026年7月(現地時間)、動画の高次元ピクセルデータを粗密な可変長トークンシーケンスにマッピングする新しいトークン化手法「VideoFlexTok (ビデオフレックストーク)」を発表した。この技術は、従来の3Dグリッドトークン化が抱える高い学習複雑性を克服し、効率的な下流モデリングを可能にすることで、特に長尺動画の処理における計算コスト削減に貢献する。
Tag
1 件の関連記事