共通基盤技術・その他

印刷用ページへ

車内音声通話の雑音除去技術

様々な雑音を除去し、目的の音声信号のみを抽出。
聞き取りやすい音声通話を実現しました。

概要

車内音声通話の雑音除去技術

三菱電機株式会社では、カーナビゲーションなどに搭載されるハンズフリーでの通話時に生じる雑音による音声通話品質の劣化を大幅に改善する雑音除去技術を開発しました。今回、精密な音声モデルを構築し、様々な雑音が混在する音から目的の音声信号のみを抽出する機械学習技術を確立。従来技術では困難であったウインカーやワイパーの作動音などの非定常雑音を含む雑音を96%取り除き、聞き取りやすい音声通話を可能にしました。雑音除去技術は、電話機のエコーキャンセル機能をはじめ、ヘッドホンの外来雑音の抑止機能であるノイズキャンセリング機能などで実用化されています。また車内におけるハンズフリーでの通話では、車の走行などに関わる定常雑音(走行音・エアコン音など)を除去する技術が実用化され、既に車に搭載されています。しかしウインカー音・ワイパー音・対向車の走行音などのダイナミックに変動する非定常雑音に関しては、これまで有効な雑音除去技術はありませんでした。

技術ポイント

精密な音声モデルを構築し、機械学習技術を確立

雑音には無数の種類が存在するため、全ての雑音を詳細に表現できるモデルを開発することは大変困難です。本技術では声帯・呼気・声道により構成される人の音声生成メカニズムに着目して音声モデルを構築。例えば、“ま"という音声は肺から出る呼気の強さや声帯の振動で決まる周波数と声道の形で決まる音韻特性の組み合わせで規定することができます。これら音声固有の特徴は雑音のパターンと異なることを利用して、雑音が付加された音声入力から人の音声に対応する信号のみ抽出し、残りの信号を雑音として除去する機械学習技術(ニューラルネットワーク)を確立しました。

雑音を96%除去し、聞き取りやすい音声を実現

音声モデルの構築により、定常雑音だけでなく、これまで除去が難しかった非定常雑音も効率よく除去することができ、聞き取りやすい音声通話の実現に貢献します。大量の実データを用いた音声モデルの学習により、実際に車を運転する際に含まれる様々な雑音、例えば走行音・エアコン音などの定常雑音のみならず、ウインカー音・ワイパー音・対向車の走行音などの非定常雑音にも対応可能です。実環境で収録された車内雑音が混じった音声入力を用いた実験では、雑音の96%を除去することを実証しました。


このページを共有

研究開発・技術
カテゴリ内情報