#ASR 関連記事 | AI Edgeline

【速報】Apple、ASRエラー修正に特化モデルを提案

Appleは2026年7月5日(現地時間)、機械学習研究ブログ「Apple ML Research」において、自動音声認識（ASR）のエラー修正に関する研究論文を発表した。同研究は、従来の言語モデルが抱える課題に対し、コンパクトなseq2seqモデルを用いたアプローチを提示している。このモデルは、実音声および合成音声から生成されたASRエラーで訓練されており、低遅延で高精度な修正を実現する。

ベンダー・製品 6月10日 09:15 注目

【速報】Hugging Face Blog、コードスイッチング音声対応のASRベンチマーク公開

ServiceNow-AIは2026年6月9日(現地時間)、Hugging Face Blogで、コードスイッチング音声に対応する自動音声認識（ASR）モデルのベンチマークとデータセットを発表した。多言語話者の日常的なコミュニケーションであるコードスイッチングに対応する音声エージェントの性能を評価するため、人事（HR）およびITサービス管理（ITSM）のシナリオに焦点を当てている。

ベンダー・製品 6月5日 01:15 注目

NVIDIA、多言語対応の音声認識モデル「Nemotron 3.5 ASR」を発表

NVIDIAは2026年6月4日(現地時間)、ストリーミング多言語対応の音声テキスト変換 (ASR) モデル「Nemotron 3.5 ASR」を発表した。このモデルは6億パラメータを持ち、単一のチェックポイントから40の言語ロケールに対応。リアルタイムで文字起こしを行い、句読点と大文字・小文字の付与も可能である。前モデルNemotron 3 ASRの成果を踏まえ、Cache-Aware FastConformer-RNNTアーキテクチャを採用し、低レイテンシと高精度を両立する。オープンウェイトとして提供され、利用者は自身の特定の要件に合わせて調整できる。