ROIDCORE  Personified Agent  Conversation ROBOT  Dynamic Artificial Intelligence
仮想人格:ロイドコア
ロイドコア (ROIDCORE) β版
話し言葉による知識の記憶と想起を実現した擬人化キャラクター

トップページ | このサイトについて | プライバシーと共有 | お問い合わせ | 会社情報 | 四方山話
最新情報 | ロイドコアとは | ホワイトレポート | 人格の仮想化技術 | 応用例のご案内
動的人工知能 | 感性と感情 | マインドマップ | 人工知能言語 | 会話ロボット | 記憶モデル
表層と深層 | 不気味の谷と不気味な文 | 教師あり/なし学習

 ■ 教師あり学習/教師なし学習   作成日:2014/2/1

 人工知能とは人が持つ知的処理能力を「工学的に真似る」技術の事である。 それ故、大脳の機能をコンピュータなどで擬似的に「模倣する情報処理」技術が必要になる。 基本機能として記憶(記銘)と想起がある。この二つは情報の意味解釈で相互に影響し合っている。 大脳内部に記憶された情報はその意味や解釈に於いて本質的に時間と共に変っていく特性を持つ。 その結果、学習時の教師データ(教師信号)との関係からロイドコアでは学習の種類が一通りである事を述べている。 そして「ひらめき」が情報のミューテーションと関わっていて、外部刺激がそのきっかけに成り得る事を提起している。

人工知能の学習
教師あり/なし学習の違い
教師データの意味
自然言語の役割と問題点
情報のミューテーション
究極の教師信号とは何か
:学習は情報の記憶と想起から始まる
:ロイドコアではこれらを同一視(共通化)している
:教師データは必ず必要か?
:自然言語は知識処理に重要な役割を持つ
:気分転換で情報ミューテーションは起こり得るか?
:教師信号が新たなポテンシャル場を生成する
仮想人格:小町
(C)高松啓二

【人工知能の学習】
 一般的に人工知能といえば学習機能を有するシステムを指す事が多い。 リアルタイムな記憶機能と制御を組み合わせた「人工知能搭載の白物家電」などが良い例である。 最近はロボットの会話に使われるのが一般化してきて、擬人化されたエージェントと同義になっている。 系としての記憶・想起(記憶モデル)と記録・再生(純粋なメモリ装置)との違いは覚える時に意味を解釈するのが記憶であり、それの想起時には機械的な記録の再生と異なり 読み出し時における時点での意味に即した情報再現(再構成)となる。 人工知能も人と同じで再構成された情報が記憶時と異なる解釈(齟齬がある)も特に違和感が無くなってきた。 文章の中に丸括弧で注記など入れるのもこれを回避する一つの現れと見て欲しい。
 このサイトでは人工知能と記憶モデルという二つの言葉を使っているが人工知能機能を代表した総称が前者で後者はその実現に用いる手法の意味で使い分けている。 学習結果が知能実現の源泉になるかどうかはさておき、人工知能に学習が必要な事は間違いない。 人から見ると学習データの基本形は述語やプロダクションルールで表現すると理解しやすい。 階層構造的知識には他項で幾度も触れているように視覚的マインドマップがわかり易く便利だ。 オントロジーの世界では知識を分類をすること、すなわち系統的かつ組織的に「分つ」事が知識の理解と考えている傾向があると思う。

【教師あり学習/教師なし学習の違い】
 表題の「教師あり学習」とは極論するとデータ単体のみの学習が「教師なし学習」で別のデータが述語などでセットになっているのが「教師あり学習」である。 「林檎」の画像を見せると同時に「林檎」の単語を覚えさせるのが「教師あり学習」でただひたすら画像や単語のみをシステムに独立して見せる(自己組織化させる)が「教師なし学習」になる。 ちなみにマインドマップ学習やプロダクションルールは「教師あり学習」の典型で、SOMなどは「教師なしの学習」として良く使われる。
 ロイドコアの記憶モデルから人の大脳が全ての学習において教師信号を必要とするかどうかの結論は明確に導き出せていない。 分類するのに名前(カテゴリやクラスタ名)が付いているかどうかが本来無関係な筈だが、カテゴリやクラスタ名を情報の一部として捕らえると話は別になる。 筆者は脳の学習機能の本質は同一(同じ原理で動作)であり、結果的に両方の機能があるように見えるだけで区別していないのではと考えている。 そして、その前提を基にロイドコアの記憶モデルは共通した原理で作られている。 その結果、クラスタリングと自己組織化が同時に進む仕組みが実現できている。

【教師データの意味】
 前置きが長くなったがここからが本論である。 「このサイトで使っている記憶モデルはいずれであろうか?」 結論を先に言えばどちらでもない。区別をしていない。 詳しく説明すると教師情報があれば「教師あり学習」になり、教師情報がなければ自己想起から内部で作り出す仕組みになっている。 自己組織化には多くの手法があるがここで提案している記憶モデルは自己想起の結果からバインド[ポテンシャル]エネルギーを調達している。 ここで議論すべきは日本語の文章(特に会話文)としてモデルに記憶させる際にどちらの動作を採るのかの基準である。 マインドマップやプロダクションルールのような形式があるものは問題ないが特に客観性がない述語はどうするかである。
 人工知能には別の側面として推論があり、実はこれと原理的な関わりがある。 論理学的手法で厳密に押さえるのは代数方程式を解く手法と同じであり、 一方、あいまいな情報を処理する尤度推定やファジィ推論は統計的手法である。 ここの記憶モデルの推論は明らかに後者である。 しかしながらマインドマップの学習で見られるように他に選択の余地が無いような場合は厳密解のように振舞う。 想起によって得られる出力(ロイドコアでは生成文)は実はいかなる場合も推論の結果として生成される。 まとめると情報もある種のエネルギー体と同じくポテンシャルの海の中で漂流し収まるべく場所に収まっている。 大脳内の記憶情報は動的な固有値とベクトルの集合体とみなしている。

【自然言語の役割と問題点】
 自然言語で表された情報は必ずしも記号論理学や命題論理学の範疇で語れないものが存在する。 一旦言葉に出してしまうと、感情や雰囲気(最近は空気と呼称するらしい)を一挙に固定概念に収束させてしまう。その元の解釈(再構成)は受け取る個人によって異なる。 言語を使ったメディアなどの問題点の多くはこれが原因になり得ている。
 ロイドコアの記憶モデルは日本語をミドルウェアとして用いている。 従って日本語文法からの制約を著しく受ける。また文法も多くの種類が提唱されている。 厳密な文法を採用した「言語モデル」と現実に使われている「話し言葉」との齟齬が誤認や会話の機能不全を生じさせる。 助詞を例にとって挙げると「が」と「は」、「に」と「へ」などである。 これらは統計的な処理で不自然にならない生成文を作ることは可能だろう。 しかし、これには受け取り手(読み手)の認知次第(背景知識の違い)で異なった結果に解釈される。 知識レベルや認知能力だけでは説明が付かない。地域性、国民性やイデオロギーも影響する。 もっと言えば同一人物でも、情報を受け取る際の精神(感情)状態で異なった印象を受けるのである。 詐欺師の類が言葉巧みなのも同じ原理が働く。 感情をコントロールされた後の嘘は誤認と異なり重大な結果を招く。

【情報のミューテーション】
 情報が個人毎に違って見える現象の原因は大脳の応答(動的理解)の違いによる。 大脳はコンピュータの様にいつでも同じ回答を出さない。再現性が極めて低い。 但し、言葉として発するときは閾値内であれば同じ発話になる。 情報の源泉が劣化(神経細胞の死滅など)したり、想起した内容が再記憶される際に間違って強化記憶される事がある。 大脳の記憶自体は頭の中で自分自身で変わりながらグルグルと廻っているのである。 廻るたびに概念とリンク空間は変化する。 この現象があるからこそ新しい考えが生み出されたり、感情の起伏が現れたりする。 ロイドコアではこの外部刺激に起因する部分はシミュレーションしていない。 発想にはイテレーションのループの中に突然変異のような要素が必要である。 これはGAのミューテーションと同じで理解に飛躍的な改善をする可能性を秘めている。 雑音や外乱は大脳にとってとても重要な役割がある。 気分転換の効果もこの類と考えられる。 その意味で教師データではなく教師信号と呼称した方がすっきりする。場合によっては教師刺激と呼んでも良い。

【究極の教師信号とは何か】
 この項の結論として、独自の仮説を述べてみたい。 ここまで書くと命題的な教師信号(教師データ)はあくまでスタティックな情報の記録と大して違いが無いことが分かる。 本当の意味で重要な教師信号となり得るのは自分自身の知識に付加される雑音(ノイズ)や外乱(摂動)により閃く瞬間の何かである。 突き詰めると教師信号は命題やルールではなく情報を変化(へんげ)させるエネルギーと言う事になる。いわゆる自己組織化でバインドするためのエネルギー関数である。 これは量子力学で言うポテンシャル場でのエネルギー固有値の存在と同類である。 ポテンシャル場が変わると必然的に固有値と固有ベクトルも変わる。 エネルギーレベルの縮退は意味の多義性や揺らぎなどに当てはまるだろう。 一般論とかなり異なる論理ではあるが身近に経験される方もあろうかと思う。 ちなみに筆者はシャワーを浴びたり、人に会うとき(教師刺激)エネルギーを得ている気がする。 前者が自己想起で後者が相互想起によるものと考えている。 この考え方では命題が最も大きなエネルギーを持つと解釈できる。 この話は市場制御(広告)に繋がっていくがまた別の機会に述べる事にする。


 トップページに戻る
ROIDCORE  Copyright (C)2011-2015 Life Information Laboratory, Inc. All right reserved.