English | アクセス | お問い合わせ

公益財団法人 NEC C&C財団

 

2009年度C&C賞受賞者

Group A

板倉 文忠 博士

板倉 文忠 博士
Dr. Fumitada Itakura
名城大学 教授
名古屋大学 名誉教授



業績記

「音声分析合成による高能率音声符号化技術の先駆的研究」

業績記補足

板倉文忠博士は、名古屋大学大学院学生時代、日本電信電話公社通信研究所時代、ベル研究所時代を通じて音声分析合成による高能率音声符号化方式の先駆的研究開発を推進し、斬新な方式を次々に開発しました。同氏の開発によるこれらの方式は、音声の周波数特性のパラメータを統計的な手法により分析抽出するという考えに基づいており、声の通り道である声道の特性をディジタル・フィルタ特性(全極形)で近似し、そのフィルタ係数を伝送して元の音声を合成するものです。音声波そのものを直接ディジタル化して伝送するPCM方式等に比べ、1/10~1/20のデータ速度での音声信号の伝送を可能とする技術です。

板倉博士が開発した最尤スペクトル推定法、ML(Maximum Likelihood)方式(1966年)は、最尤推定(*)により、音声合成に必要なフィルタ係数を最適かつ効率良く求めるもので、同博士は世界に先駆けてこの方式のアルゴリズムを提案し、数学的に確立すると共に、実際に自然かつ明瞭な音声合成を実証しました。この方式はさらに、予測誤差の偏相関係数を求めて制御することで安定性を増したPARCOR(Partial Auto Correlation)方式(1969年)へと進化しました。1971年には音声応答装置として実用化され、また各種の電話によるデータサービス等に供されました。このように博士の研究は、従来の音声分析合成法を近代化し、新研究領域を開拓するものでした。

LSP(Line spectrum pair)方式(1975年)は、PARCOR方式のアルゴリズムをさらに発展させ、音声合成フィルタの安定性をより高めたものですが、ディジタル化に適合した量子化誤差の少ない、より安定な方式へと進化しました。このLSP方式は、符号器のLSI化にも適しており、携帯端末の小型化、低消費電力化にも有効なものとなっております。

LSP方式をベースとした音声符号化方式は、その後、国際標準に採用されてITU-TのG.729(1995年)、G.723(1995年)等の規格となりました。G.729はVoIPでの低ビット圧縮符号化方式として世界に広く普及しています。また、方式の呼称は様々ですが、ディジタル携帯電話への適用を目指して、各国で様々な工夫が成され、日本のPDC、欧州のGSM等第2世代携帯電話方式はもとより、W-CDMA等第3世代へも適用が進められました。いずれも、PCM方式に比べ、1/10~1/20の情報量で良好な音声の再現を可能とするものであり、これらの方式は板倉博士が開発したPARCORやLSP方式を基盤技術として発展したものであります。

この様に、板倉博士は現在の携帯電話、VoIP等の普及に欠かせない基盤技術を開発し、それらの業績は世界に於ける低ビット圧縮符号化の標準化やその広範な使用の土台となるものとして、C&C賞に相応しい業績であると考えます。

(*) 確率論的モデルのパラメータを変化させ、観測データに最もよく「あてはまる」ものを探索・決定していく方法