English | アクセス | お問い合わせ

公益財団法人 NEC C&C財団

 

2013年度C&C賞受賞者

Group B

Vladimir Vapnik 博士

ウラジミール バプニック 教授
Prof. Vladimir Vapnik

コロンビア大学教授
NEC北米研究所フェロー



業績記

統計的学習理論の構築ならびに高性能かつ実用的な学習アルゴリズムの発明に関わる貢献

業績記補足

近年の計算機技術とネットワークの急速な発展を背景に大量のデータの蓄積が可能となり、データ分析により有用な知識を獲得するための重要な技術として機械学習が注目されています。機械学習は、データから有用な規則、知識表現、弁別基準などを抽出する技術であり、応用分野は、信号処理、自然言語処理、音声処理、画像処理、生物学、ロボット制御、金融工学、データマイニングなど多岐にわたります。バプニック教授は、この機械学習技術において、革新的な理論を開発し、本技術の成長と発展に貢献しています。  

機械学習は、1960年代に、人間のような学習能力をもった機械(モデル)を作るための学習理論として、人の視覚と脳の機能をシンプルにモデル化したパーセプトロン(Perceptron)と呼ばれるモデルが提唱され研究が進みました。1980年代には、これを改良した多層パーセプトロンと呼ばれるモデルが開発され多方面に応用されましたが、望ましくない局所最適解への収束など、いくつかの問題点がありました。  

バプニック教授は、1995年に、このような問題を解決した学習機械として知られる、サポートベクターマシン(SVM:Support Vector Machine)の提案を行いました。SVMは、統計的学習理論の枠組みで提案された学習機械であり、特にパターン認識の能力において最も優れた学習モデルの1つであることが知られています。近年の情報処理、特に、画像処理、音声認識、自然言語処理、Web検索、データマイニング等で、ほとんどの研究者が活用しており、その業績は深く尊敬されています。  

機械学習の技術領域でバプニック教授が創り出したブレークスルーは極めて大きく、学術的な業績としてまとめると以下のようになります。  

  1. 機械学習での未学習のデータに対する識別の誤差(汎化誤差)について、統計的学習理論の枠組みに基づく評価理論を提案し、SVMがいかなる識別問題に対しても安定して高い識別精度を実現できる高い汎化性能を持つことを示したこと。また、この中で、学習機械の複雑さを示すVC次元(Vapnik-Chervonenkis dimension)なる指標を提案し、世界に知らしめたこと。  
  2. 汎化誤差を最小にする分離境界の決定に関し、従来の方式と比べて分離するデータ集合と分離境界の間隔(マージン)の最大化という明確な基準を持つことを特徴とするSVMを提案したこと。本方式は最適化に係るパラメータの調整が不要で、既存の最適化ツールと組合せて実装することが容易であり、応用面を含め広く世界に普及させることができたこと。 
  3. 1963年にバプニック教授が発表した初期のSVMは、データの分離が容易な線形分離可能問題にしか適用できなかったが、カーネル関数を用いて複雑なパターン認識対象を別の高次元の特徴空間へ写像し線形分離を行う手法を提案し、SVMが線形分離不可能問題にも優れた性能を発揮することを示したこと。これは、カーネル関数に関する有用性を知らしめた貢献であり、その後、従来から知られる様々な線形手法がカーネル化され、線形分離不可能問題への適用が広く実現されたこと。  

これらのバプニック教授の業績は、情報処理の最先端の領域で広く知られており、「Statistical learning theory」等の著書の論文引用数は数万件にのぼります。また、SVMは、特に実用面において、従来の統計的な手法に比べ高次元の分類問題で優位性を発揮し、パターン認識の標準手法としての地位を確立しています。さらに、SVMに留まらず、数値予測を目的とする回帰問題に適用したSVR(Support Vector Regression)や、教師なしデータの誤分類の最小化を目的とするTransductive学習など、新たな手法の提案も進め、機械学習技術の発展に大きく貢献しています。  

今日、機械学習技術は、様々なWebサービスやソーシャルサービスの実現、医療や環境などへの情報通信の適用領域の拡大、ビッグデータの活用など、情報通信技術の発展を支える重要な基盤技術となっています。バプニック教授の業績は、これら情報通信全般の発展に大きく貢献するものであり、C&C賞に相応しい業績と言えます。