【速報】Hugging Face Blog、コードスイッチング音声対応のASRベンチマーク公開
ServiceNow-AIは2026年6月9日(現地時間)、Hugging Face Blogで、コードスイッチング音声に対応する自動音声認識(ASR)モデルのベンチマークとデータセットを発表した。多言語話者の日常的なコミュニケーションであるコードスイッチングに対応する音声エージェントの性能を評価するため、人事(HR)およびITサービス管理(ITSM)のシナリオに焦点を当てている。
Tag
2 件の関連記事
ServiceNow-AIは2026年6月9日(現地時間)、Hugging Face Blogで、コードスイッチング音声に対応する自動音声認識(ASR)モデルのベンチマークとデータセットを発表した。多言語話者の日常的なコミュニケーションであるコードスイッチングに対応する音声エージェントの性能を評価するため、人事(HR)およびITサービス管理(ITSM)のシナリオに焦点を当てている。
NVIDIAは2026年6月4日(現地時間)、ストリーミング多言語対応の音声テキスト変換 (ASR) モデル「Nemotron 3.5 ASR」を発表した。このモデルは6億パラメータを持ち、単一のチェックポイントから40の言語ロケールに対応。リアルタイムで文字起こしを行い、句読点と大文字・小文字の付与も可能である。前モデルNemotron 3 ASRの成果を踏まえ、Cache-Aware FastConformer-RNNTアーキテクチャを採用し、低レイテンシと高精度を両立する。オープンウェイトとして提供され、利用者は自身の特定の要件に合わせて調整できる。