研究内容

[研究1 (南)]

  • 雑談対話
  • 言語獲得機構の解明
  • 心理学的知見に基づく音声言語処理

コンピュータが人間と自然な会話ができれば、多くの人がコンピュータを自由に使うことができるようになります。音声認識、画像処理、対話処理、音声合成などの基盤的な情報処理技術を統合し、人 と適切に会話できるコンピュータの実現を目指します。この実現のため、人間の言語活動を参考にし、統計 分析、時系列解析、情報理論や信号処理といった情報科学の基礎理論を応用し、人間の言語獲得機構の解析、モデル化を行っています。また、人と雑談による対話を行うシステムの開発、東ロボプロジェクトにおいて英語試験問題を解くシステムの開発も、行っています。これらの研究を通して、自分から言葉を憶え、人間の高度な対話行為を実現するコンピュータを目指していきます。

 

 

[研究2 (古賀)]

  • 類似検索アルゴリズム
  • クラスタリング
  • オンラインアルゴリズム
  • インターネットアルゴリズム

複雑な情報システムを、経験や勘に基づいて制御するのではなく、システマティックに取り扱える対象にすることを目指して、基盤となるアルゴリズム理論の構築、およびそれを利用した応用システムの研究を行っています。アルゴリズムに関しては、ハッシュに代表される高速類似検索アルゴリズムの研究に力を入れています。また、与えられた情報をリアルタイム処理するオンラインアルゴリズムについても研究を進めています。応用システムとしては、グラフ・木構造を利用したメディア(イメージ、ビデオ)データからのパターン発見と認識、大規模データに対するクラスタリングアルゴリズムの開発、インターネットのトラフィック制御、といった研究テーマを取り扱っています。

 

[研究3(戸田)]

  • 二分決定グラフを用いた大規模データ処理

二分決定グラフと呼ばれるデータ圧縮技法を用いた大規模データ処理について研究をしています。現実において解くことが求められる計算問題の中には、網羅的な場合分け処理が必要とされるものが多いので、本研究のねらいは、そのような問題に対してデータ圧縮技法を用いて組合せ爆発を抑制することにより、実用上高速に動作する計算法を与えることです。具体的には、極小ヒッティング集合の列挙(あるいは、単調論理関数の双対化)を中核とした、二分決定グラフを用いたデータ処理基盤の確立、および知識発見をはじめとするさまざまな研究分野への応用を目指しています。

 

[研究4 (中鹿)]

  • 統計的モデリングに基づくメディア情報処理

私達は物を見て音を聴き、脳で情報を処理しています。その結果周囲にあるものを認識したり、状況を理解し、判断することができます。システム(ロボットなど)に同様のことを行わせることができれば、どれほど素晴らしいことでしょう。自分で物事を考え、人の意図を理解しながら行動するシステムの実現も遠い未来ではないかもしれません。私は、このように人と共存するためのシステムの" 理解する" 部分を研究しています。具体的には音声認識、画像認識を始めとしたメディア情報処理及びそれを実現するための統計的アルゴリズムです。人と共存するシステムの開発に向けて、人間の理解機構を解明し、アルゴリズムで模倣させることを目指します。

  • 教師なしディープラーニングを用いた音素体系の自動獲得

赤ちゃんが私たちの会話を聴いて言葉を覚えていく過程と同様に、システムに音声の基礎要素である音素(「あ」や「い」など)のパターンを学習させる研究です。近年ディープラーニングが盛んに研究されていますが、その多くは識別的なアプローチとして使用されています。本研究では生成的な観点からディープラーニングを用います。これは、通常の音声とは音素体系の異なる音声を認識する場合などに役立ちます。例えば幼児は、調音器官や調音方法の未発達に伴って「振動」を「チンロウ」のように発話してしまいます。このような音声を認識したい場合、通常の音素体系を用いるよりも、その発話者に合わせた独自の音素体系に基づいて認識モデルを学習をした方が適切であると考えられます。本研究では、ディープラーニングの教師なし学習によって音声信号から独自の音素体系を獲得しようと試みています。

  • 適応型制限ボルツマンマシンによる任意話者声質変換

声質変換とは、発話内容はそのままに、あたかも別の人が話しているかのように音声を修正する技術です。声質変換に関する多くの研究では、変換元となる話者(入力話者)と変換先となる話者(出力話者)の関係性をモデル化し、入力話者の音声が出力話者の音声となるようにモデルの学習を行います。この際、フレーム単位で対応付けされた入力話者音声・出力話者音声の対データ(パラレルデータ)が必要となります。しかし、パラレルデータを用いると、学習されたモデルはその入力話者・出力話者の対に限定される、発話内容が入力話者・出力話者ともに同一のものでないといけないといった様々な問題が存在します。そこで私は、パラレルデータを一切必要としない、かつ誰から誰への変換も容易に行える声質変換技術を研究しています。本研究で提案する適応型制限ボルツマンマシンは、私たちが音声を聴いたときに、その人が何と言っているのかだけではなく、誰が話しているのかということも同時に理解しているという事実からヒントを得たモデルです。複数の話者の音声を用いて話者に依存しないパラメータと話者に依存したパラメータを同時推定することで、その結果音韻に関する情報と話者性に関する情報が分離可能となります。入力した音声に対して、音韻情報はそのままに、話者情報のみを目的のものに切り換えるだけで声質変換が実現されます。


[研究5 (柳生)]

  • コンテンツ指向ネットワーク
  • アドホック・切断耐性ネットワーク技術
  • ルー ティング制御、トラフィック制御

ネットワーク(インターネット、モバイル網など)において、情報・トラフィックを効率的に転送するための制御技術について研究しています。近年スマートフォンによるビデオ視聴の急増により、ネットワークへの負荷が懸念されています。ネットワークにコンテンツを一時保存(キャッシュ)する能力を付加することで、その軽減を図る研究などを進めています。また、災害によって切断されたネットワークにおいても、キャッシュを利用することで最大限の情報配信が可能な情報配信方式など、通常時と災害時の両方で効率的に動作するネットワークの構築を目指しています。

 

[研究6 (鈴木)]

  • SDN 技術を用いたネットワーク仮想化
  • 経路制御の高信頼化

インターネットに代表される情報ネットワークは、我々の生活や企業の経済活動などを支える重要なインフラとなっています。そのため、情報ネットワークには、社会やニーズの変化に対する対応する能力が求められています。状況の変化に対して柔軟に対応可能なシステムを作るうえで重要な技術が、ネットワーク仮想化技術です。仮想ネットワークの実現には、複数のネットワーク機器の統一的な管理・制御が必要です。その実現技術として、Software-Defined Networking (SDN) 技術が、現在注目されています。私は、このSDN 技術の活用し、様々な状況の変化に迅速に追随可能なネットワーク仮想化技術の研究に取り組みます。