ROIDCORE  Personified Agent  Conversation ROBOT  Dynamic Artificial Intelligence
仮想人格:ロイドコア
ロイドコア (ROIDCORE) β版
話し言葉による知識の記憶と想起を実現した擬人化キャラクター

トップページ | このサイトについて | プライバシーと共有 | お問い合わせ | 会社情報 | 四方山話
最新情報 | ロイドコアとは | ホワイトレポート | 人格の仮想化技術 | 応用例のご案内
動的人工知能 | 感性と感情 | マインドマップ | 人工知能言語 | 会話ロボット | 記憶モデル
表層と深層 | 不気味の谷と不気味な文 | 教師あり/なし学習

 ■ 過去のツイートをタイムシフトさせて会話する実験   報告作成日:2012/4/12

【時間ずれがある会話実験】
 ここではロイドコアの日本語処理能力を利用して過去のツイートと会話が可能かどうか実験した結果の 中間報告をしています。ツイッターを利用したのは「伝播が早い」という噂を信じたからですが分析結果は一部だけでした。
 最初に、目的を明らかにしておきます。情報化社会で既存の検索システムを「人手」で操作している限り、情報弱者が どこかで不平等な立場に置かれます。高齢化社会でも同じ事が言えます。故に過去のデータ(ビッグデータ)に 誰でもアクセスできるインターフェイスを目指しています。判り易く言うと普段の会話で使えるようにすることです。 ビッグデータの多くは鮮度の違いこそあれ記録データであるから、どのような処理/抽出を施しても 過去との接触であることに違いないのです。
 実験は2大ビッグデータであるツイッターとフェイスブックで実施する予定だったのですが、 フェイスブックは以下の理由で使いませんでした。今後も使う予定は無いです。それで実験をしませんでした。 既に同姓同名で詳細不明なアカウントが取られて、最近メールでこの事を説明する事態になり、 クライアント様の要請でも、あえてメールでお願いしている有様。この場を借りてお詫びします。

【ツイッターボットについて】
 一般の人から見ればツイッターの会話ロボットと言えば、先ず「ツイッターボット」を想像すると思います。 現在、動いているツイッターボットの分析結果から順番に報告していきます。 ツイッターボットは、リクエスト(問合せ/刺激)の仕方で分類すれば、リスト順、乱数、タイマ、語句、文節、文に対し アクノリッジ(承認応答)として記録リスト(ローカルデータ)にある文を何らかの処理をして返答する。 今流行のSi〜も文節/文に対する応答が基本になっている点で同じ機能と言えます。 更に文の上位概念である文脈を利用した例は見当たらなかったのでこれは省略します。 誤解の無いように最初に注釈しておきます。文字列(表層表現)と日本語(意味/深層表現)でリクエスト するのは異なります。語句が並べられると意味が発生します。意味のエンコードです。 その意味で自然言語による検索エンジンとも違います。 語句以上の概念を使う場合は、共起(関連連想)や語句の分類テーブル(上位概念)を介して少しだけ気の利いたことができます。

【記憶の再生】
 実験ではロイドコアの回答文に処理を施し(ここが一番の肝なので企業秘密です)、ツイッターのAPIで検索します。 本当はこのAPIで半分以上、意味が失われてしまうのですが他社のサービスなので仕方ありません。 この実験にあたりロイドコアの吐き出す応答文(未処理)を同時にツイッターに流しています。偶然見た方は 変なボットと思われたことでしょう。つまりこういう訳でお騒がせしてしまいました。
 結果は長期記憶に関しては問題ないことが確認できましたが、短期記憶は会話になりません。 固定化された概念のみ話者の共通認識になり話が通りますが、短期は文脈に起因するところが大きく共通の認識は 持てませんでした。これはある程度は予想していました。「つぶやき」がビッグデータという幻想に囚われていた事を反省 しました。
 一般の会話なら短期記憶も必要。言い換えると記憶を伴わないリクエストはランクページがない 「素の検索エンジン」と同類な結果になります。つまり会話ではなく参照となります。
 記憶データの参照はシーケンシャルでない場合、リンクテーブル(住所/ポインタ)をルックアップするしかありません。 データハッシュも不連続空間への射影であってリンクと同じです。 これらを裏付ける現象は直ぐに確認できます。ツイッターでやたらリンクを貼り付ける人が多い。 人力でローカル参照している訳です。 余談ですが、ロイドコアのノードとリンクを使った記憶は大脳皮質と同じ分散記憶です。
 ハッシュタグはおそらくこの人力リンクの欠点を補う為に導入されたと考えられます。 しかしコードブック(共通認識)を作らず開始したために、ニコ動のタグのように便利には使えません。 ニコ動は百科事典を準備しこの問題を事前に回避しています。コミュニケーションに関してはニコ動の方が 一枚上手と言うことでしょう。 短期記憶は照応でルックアップする機能が必要ですがこの機能は一部の会話ソフトしか実現していない。
 この様な理由から世の中全てのデータを集めても問題は解決しないかもしれない。 ビッグデータに対し会話をするなら避けて通れない課題となるでしょう。 そもそも過去のツイートは短期記憶として再利用できるのか再考が必要です。

【ツイッターの特質】
 ツイッターを始めて数ヶ月経過。広域には語句/リンクつながりで会話している人を散見した。 付帯情報を削ぎ落とした語句に対しアクノリッジを返す為に、ジョークと誤認のレベルのみが以上に高くなっています。 決まりごと、あるいは様式美で使って楽しんでいる人が多いのには正直びっくりしました。 そのような目的もあるでしょうが、時空的に広域になれば意味が薄れ、いずれ表層に収束すると思います。
 ツイッター伝播速度が早い理由は自然に「広くあまねく」ではないことも確認しました。 単に誰かに検定され抽出された情報のみRTで伝わっている。これだから特定ルートのみが早くなる訳である。 もちろん逆の意味でステマ語句も流通する。システム的に公平でも、データは平等になっていない。 この様な問題を抱え当初の予定通り脳モデルと同じ手法が使えるか、結論をまだ出せない状態が続きます。 それで実験はしばらく継続する予定です。


 トップページに戻る
ROIDCORE  Copyright (C)2011-2015 Life Information Laboratory, Inc. All right reserved.