研究者らが提案したミリ波信号を使用したストリーミング音声認識システム「Radio2Text」は、周囲のノイズや遮音の影響を受けず、長い文章をリアルタイムで認識することができます。ミリ波信号は、マイクロフォンよりも高い感度を持ち、ノイズや遮音の障壁を貫通する能力があります。
Radio2Textは、低遅延のストリーミングモードで1万3000語以上の単語を正確に認識することができ、低品質な信号でも高い認識精度を実現しています。特徴的な音声特徴の抽出とトランスフォーマーによるエンコーダー・デコーダー型の関連付けを使用することで、1万語以上の単語を認識できる能力を持っています。
Radio2Textの評価実験では、静かな部屋、騒がしいノイズ環境、防音部屋を外側から取得する環境の3つのシナリオで行われ、誤り率5.7%、単語誤り率9.4%を達成しました。さらに、マイクロフォンベースの方法では失敗する環境でも、Radio2Textは効果的に音声を認識できることが実証されました。
&Buzzとしては、新しいテクノロジーを活用した音声認識システムの開発に注目しています。Radio2Textの能力は非常に優れており、ノイズや遮音の影響を受けずに正確な認識を行うことができます。今後の進化に期待し、応援していきたいと思います。
この &Buzzニュースは、Itmedia.co.jpのニュースをAndbuzzが独自にまとめたもの。
コメント