IEEEフェロー
Jonathan Le Roux
音声・音響信号処理分野
ここから本文
IEEEフェロー
音声・音響信号処理分野
IEEEフェローのご紹介
多くの人が話しているような複雑な音響環境でも、人間には特定の話者や興味ある話題に集中して聞き取る能力があります。「カクテルパーティー効果」と呼ばれるこの効果を機械で実現しようと長年取り組んできたJonathan Le Roux Ph.D.。ディープクラスタリングをはじめとする実用的な手法を開発し、大きな進歩をもたらしました。
初めは、単一チャネルで、混合された音声から2人の未知の話者を分離する技術からスタートし、その後、マイクの数や形状などに左右されないマルチチャネル設定へと拡張されていきました。この一連の業績は、音声分離の分野における重要なマイルストーンといえます。Jonathanは、これら音声分離の研究を基に、情報送信から受信までのすべてのプロセスにおけるディープラーニングフレームワークでのマルチスピーカーASR(複数の話者が同時に音声認識を行う技術)の新しいアプローチも開拓しました。これらの技術は、スマートスピーカーや電話会議、モバイル端末などさまざまな機器、用途に適用でき、暮らしの質の向上に貢献します。
Jonathanはこれらの技術的貢献が評価され、2024年にIEEEフェローに昇格しました。
この昇格によって「MERLは研究者たちにインスピレーションをもたらし、その卓越した存在性と革新性によって大きな影響力をもつ研究拠点である」ことを再認識したとJonathanは語ります。「最も重要なのは、MERLがさまざまな分野での世界クラスの能力を持つ研究者たちの集合体であること。数歩歩くだけで、各分野のトップエキスパートと科学的な議論ができ、クロストピックのコラボレーションにつながることがよくあります」。
機械が音響信号や他のデータを通じて周囲を聞き取り、理解し、相互作用できるようにすることをチームとしての目標に掲げるJonathan。マルチモーダルAIと生成AIを通じて音響環境のモデリングをさらに深めていくことに情熱を傾けています。
最後に、若手研究者たちへ「研究を続けるうえで一番大切なのは楽しむこと!」とメッセージを送ります。
フランスのパリにあるエコール・ノルマル・シュペリウールで数学の学士号と修士号を取得。2009年に東京大学で博士号を取得し、その後NTTのコミュニケーション科学研究所でポスドク研究員として勤務。2011年にMERLに入社。専門は音声とオーディオの信号処理。ヨーロッパで育ちアジアで学んだ後アメリカを見て、そこで働くことに興味があったというJonathanは、現在MERLにおいて Speech & Audioチームを率いる。特に注力しているのは、音声認識や音声強調、音源分離などの分野で、機械学習の応用や深層学習を活用した研究に取り組んでいる。