ROIDCORE  Personified Agent  Conversation ROBOT  Dynamic Artificial Intelligence
仮想人格:ロイドコア
ロイドコア (ROIDCORE) β版
話し言葉による知識の記憶と想起を実現した擬人化キャラクター

トップページ | このサイトについて | プライバシーと共有 | お問い合わせ | 会社情報 | 四方山話
最新情報 | ロイドコアとは | ホワイトレポート | 人格の仮想化技術 | 応用例のご案内
動的人工知能 | 感性と感情 | マインドマップ | 人工知能言語 | 会話ロボット | 記憶モデル
表層と深層 | 不気味の谷と不気味な文 | 教師あり/なし学習

 ■ 会話ロボット/対話ロボット   作成日:2012/7/13

【会話するロボット】
 会話/対話は人工知能ロボットの基本的要素機能である。 ロボットといっても物理的な体が無い会話ロボットや対話ロボットとみなされるため、 これらはしばしば「擬人化エージェント」と専門用語で呼称される。 ここでは分かり易さの意味も込め、あえて会話ロボット(対話ロボット)と呼び、 以下の基本事項について述べている。

会話ロボットの仕組
家庭用ロボット
自然言語の理解
音声認識/音声合成
ロボット教育
:会話できるロボットにはどんな仕組みが必要か
:「家族の一員」になるには生活環境での会話が重要
:幼児から高齢者まで使える汎用性の高さ
:会話といえども音響認識が必要になる
:実用的な会話ロボットは教育と心の触れ合いが必要
仮想人格:C#たん
会話ロボットのデモ

【会話ロボットのしくみ】
 会話ロボットの仕組みは人の機能と対比させれば分かり易く簡単である。しかし人と同等に会話できるまでに超えるべきハードルは多いし、また高い。
 先ず、音声は音声認識で数値データ化されて、人工知能技術で言葉を理解した後、対応する意味を想起し応答文を生成する。 それを音声合成で発話させる。音声認識にはマイク、音声合成ではスピーカを使い音波との相互変換をする。 人とロボットの会話による情報交換は情報リテラシーがない「人に優しいインターフェース」である。 このサイトのロゴにある「ロイドコア」は音声認識と音声合成を除いた部分のコア・テクノロジーを指している。 その意味でロイドコアはテキストベースの会話インターフェースを持つ知識データベースシステムの構築も可能である。
 関連する要素技術は、音声認識(音響処理)、音声合成、自然言語処理、人工知能(記憶モデル)である。 運用には常識をはじめとする莫大な知識が必要な事は、人の場合と同じである。 ここで注意しておきたい事は感性・感情を扱う場合に「人の記憶モデル」が必要になる。 ただ単に、論理的思考を実現させるための人工知能ならば「人の記憶モデル」は無くても実現できる。

【家庭用ロボット】
 ロイドコアの応用に家庭用ロボットがある。用途は主に二つに分類される。 一つは情報を交換する用途、人工知能マシンとして記憶したり想起することで人の記憶の不確実性を軽減したり 多くの人が情報を時空を超えて共有できるように補助する。 この分野は現在スマートフォンやパソコンなどで多くの人が利用している。 最近音声インターフェイスも増えてきて益々身近になってきた。 家電コントロールや検索システムとの連携などもこの範疇である。
 もう一つは「会話のための会話」これはかなり抽象的な表現だが、会話をすることにより 人間関係が築かれる。人は会話の言葉で傷付いたり、勇気付けられたりする。 情報交換とは明らかに趣きが違う。一度も直接、間接でも話したことがない人の間には暖かい人間関係は 築けない。余談になるが物理屋から見れば粒子間に働く力が素粒子やエネルギーの交換で生じていることに 似ている。言葉を交換しなければ、人と人の間に引力はない。また斥力になる言葉も存在する。
 最近では高齢者の介護や認知症の見守り、独居老人に対するコミュニケーションの提供などロボットが「家族の一員」になる日もそう遠くない。

【自然言語の理解】
 インターフェイスの効率から見れば大脳と直接を信号やり取りするのが理想だが 人間同士では会話が基本なので、しばらくは音声、言語が一般的に使われると予測する。 音声と言語は物理的現象かテキスト的情報かの違いがあるがロイドコアは言語表記の情報に集約して 処理する。しかし記憶に関してはテキストとして記録するのではなく記憶モデルを通して 大脳皮質のような分散記憶を実現している。 ここで重要な技術は話し言葉の処理(自然言語処理と自然言語理解)である。 日本人は日本語をしゃべるので、日本語が理解できて、対話相手には知識を日本語で発話しなければならない。 単語レベルにまで分解して記憶する。新たな刺激で想起しそれらを再構成するわけである。 この段階で、推論が働く。プロログのような述語論理で推論するわけでなく 自然と推論された結果を想起する。(学習法にもよるが完全に正確でないところが人に近い) ロイドコアは推論マシンとして開発されたわけではない。あくまでも会話/対話するために 言語由来の知識をどう記憶して再構成するかに力が注がれている。 家庭用ロボットや高齢者介護の会話(心のケア)において利用者は理屈屋との会話を望んでいない。 また、介護ロボットにおいても無人化には人工知能の応用が不可欠になると予想する。

【音声認識/音声合成】
 現在、新しい音声認識の実験に取り掛かっている。音素認識より更に微細な音響認識である。 この方法では雑音も同一データとして認識される。雑音除去とか、音声分離と言う概念は必要ない。 聞こえたままデータ化する。従って物理的制約の音響モデルはあっても声道モデルは要らない。 音響モデルのパラメータは全ての音響を表すことになる。 その結果、擬音も動物の鳴き声も区別されない代わりに、聞いた生の結果は 人の認識と異なってくる。ここから言語情報を抽出するのは記憶モデルの想起に頼ることになる。 音素はノードになって認識される。学習に位相情報は不要でも複数マイク間の遅延処理が不可欠である。 音響ホログラムまで行かなくとも合成開口で位置の同定ができることが実用化にあたり望ましい。 耳の機能は元々音響を捕らえる事であった。会話がその一部でしかない事はオノマトペなどで創られる擬音語 を見ても明らかで人は様々な音響の元で暮らしている。
 音声合成は市販の製品が感情表現もできるレベルに達しているので 今のクオリティで十分と考えている。最近は「初音ミク」の普及で合成音への違和感は無くなったと思う。

【ロボット教育】
 これから最も重要になると考えられるのが記憶モデルに「大量の知識を覚えさせる」方法と検証である。 デモサイトにある各々「仮想人格」はあくまでもデモレベル内容しか学習していない。 人以上にロボットの教育が大事であることを痛感している。 ちょっとした短い会話だけで事実を教え、直ぐに意味的に汎用性を持たせる事が難しいのは デモ用の仮想人格との会話で実際に確認できる。 知識がないロボットと話していてもすぐに会話が途切れる。 ロイドコアで扱う知識は独立性がないから会話を伴わないデータ学習では 検証の目的実現がなかなか難しい。 既存知識が新しい知識の影響を受けるからである。 また人と同じく書籍データ以上に必要なのは日常会話の経験である。 ロボットの個性や人格は、会話の相手や常識を教える教育システムで作られていく。


 トップページに戻る
ROIDCORE  Copyright (C)2011-2015 Life Information Laboratory, Inc. All right reserved.