平成23年12月19日(月) 東京工科大学 コンピュータサイエンス学部 亀田弘之 自然言語処理2011 平成23年12月19日(月) 東京工科大学 コンピュータサイエンス学部 亀田弘之
Tokyo University of Technology (思考と言語研究室) 今までやってきたこと 思い出して見てください。 キーワードだけでもいいですので! たくさんのことを学びましたよね。 Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) 今までやってきたこと 自然言語処理とは 自然言語処理(理解)過程の概要 形態素解析(各種手法とツール) 構文解析 言語獲得(未知語獲得・文法獲得) Tokyo University of Technology (思考と言語研究室)
本授業は主として「文字言語+理解」を取り扱う 自然言語処理とは 自然言語 (Natural Languages) 言語 思考のための道具 情報・知識を記述・蓄積するための道具 コミュニケーションのための道具 言語=自然言語+人工言語 自然言語=文字言語+音声言語+視覚言語 処理=理解+生成 処理の主体(機械 or 人間) 本授業は主として「文字言語+理解」を取り扱う Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) 自然言語処理(理解)過程の概要 形態素解析 (Morpheme analysis) 構文解析 (Syntactic analysis) 意味解析 (Semantic analysis) 談話解析 (Discourse analysis) 状況解析 (Situation analysis) など Tokyo University of Technology (思考と言語研究室)
SVM: Support Vector Machine(機械学習法の1つ) 形態素解析の手法 文字種法 最長一致法 文節数最少法 接続表を利用する方法 遷移確率を用いる方法 コスト最小法(Juman) 隠れマルコフモデル法(Chasen) その他(Kabocha等はSVMを利用) SVM: Support Vector Machine(機械学習法の1つ) Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) 形態素解析のツール Juman Chasen(茶筌) Kobako/J その他いろいろあります (Internetなどで調べてみましょう。) 自作のソフトウェア (作成方法の例は授業でやりましたよね!) Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) 統語解析 言語・文法 言語=文法的に適格な文の集合 文法=<Vn, Vt, s, P> Vn:非終端記号の集合 Vt:非終端記号の集合 s: 開始記号 P:書き換え規則群 (チョムスキーの文法理論に準拠) Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) 統語解析 言語・文法 言語=文法的に適格な文の集合 文法=<Vn, Vt, s, P> Vn:非終端記号の集合 (構文構造記述用文法用語集) Vt:終端記号の集合(語彙) s: 開始記号 P:書き換え規則群 (チョムスキーの文法理論に準拠) Tokyo University of Technology (思考と言語研究室)
Tom broke the cup with the hammer. この例文で構文解析の話しをしました。 他の例ではどうなるか挑戦してみてください。 その結果として、自力で構文解析システムを作るために必要な知識や技術が何であるか理解できればOKです。 後は、挑戦あるのみです。 Good Luck! Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) 言語獲得(文法獲得) 未知語獲得(Vtの拡張) 統語規則獲得(VnおよびPの拡張) Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) 未知語獲得 定義 (コメント:研究を進める上での前提) 分類 (コメント:研究目的に応じて決まるもの) Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) 未知語の定義 人間にとっての未知語: 初見の単語?(定義困難?) 機械にとっての未知語: システム辞書に登録されていない単語 (未登録語) Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) 未知語の分類(概要) 第1種の未知語(異表記未知語) 第2種の未知語(未知複合語) 第3種の未知語(その他) Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) 第1種(異表記未知語) 東京大学付属病院 東京大學附属病院 組合せ 組み合せ 組み合わせ 組み合わせ 飛び込む 飛びこむ コンピュータ コンピューター etc. Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) 第2種(未知複合語) 数学辞典 見学旅行 個人旅行 月旅行 温泉旅行 積み立て旅行 etc. これらの単語を辞書で調べてみよう. このうちの幾つかは通常の辞書には載っていない. そのような語は他にもあり得る.どうすればいいのだろうか? Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) 第3種 その他 のだめ rlgg (専門用語) モー娘 りあじゅう (若者語) Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) 未知語処理 要素プロセス 処理モード 処理方略 (strategy) Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) 未知語処理の要素プロセス 未知語存在の検出 未知語候補の切り出し 内部構造の解析 品詞推定 意味推定 意味整合性の確認 辞書処理(追加・削除・更新 など) Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) 未知語処理の処理モード 処理モード 未知語 未知統語規則 モード1 無 モード2 有 モード3 モード4 Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) 今日の内容 より深い自然言語処理 他者理解 感情・意図理解(・社会認知?) 心のモデル(・認知機能モデル?) など (Theory of Mind) Tokyo University of Technology (思考と言語研究室)
心のモデルと それに基づく感情・意図推測方法 東京工科大学 亀田弘之・小澤朋之・難波創 2006年10月20日 電子情報通信学会思考と言語研究会 平成19年10月20日発表資料 於 NHK基礎研究所
Tokyo University of Technology (思考と言語研究室) はじめに(1/5) 社会の高度化・複雑化 いじめ 引きこもり 心の問題 「癒し」を切実に求めている Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) はじめに(2/5) 癒し 心理的効果 人を元気づけることや動機づける 生理的効果 ストレスを低減し血圧や脈拍を正常にさせる 現代社会に必要とされている Tokyo University of Technology (思考と言語研究室)
はじめに(3/5) 人との共存を目的として開発されているロボット 人に安らぎや癒しを与えることができる PaPeRo ifbot Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) はじめに(4/5) 癒される~ ふれあい 円滑で自然な意思疎通が必要不可欠 Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) はじめに(5/5) コミュニケーションによる癒しの実現 人とふれあう癒し系ロボット PDDIN PDDINです よろしく~♪ Tokyo University of Technology (思考と言語研究室)
心のモデルに関するさまざまな提案がされている 従来の心・感情モデル(1/5) 心のモデル “人の心”という概念を扱う場合に,まさに その心自体を記述・表現するためのものである 心のモデルに関するさまざまな提案がされている Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) 従来の心・感情モデル(2/5) 図1:心の計算機モデル(岡田直之) Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) 従来の心・感情モデル(3/5) 図2:意識の外にある無意識の自律分散計算結果にボトムアップに注意を払う受動的な意識を仮定する心のモデル(前野隆司) Tokyo University of Technology (思考と言語研究室)
従来の心・感情モデル(4/5) 図3:感情の立体モデル(P.Plutchik) Tokyo University of Technology (思考と言語研究室)
The Theory of Mind(心の理論) Premack & Wooddruff(1978) Baron-Cohen(1995) Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) 心の理論とは Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) The Theory of Mind ID (Intentionality Detector) 意図検出器 EDD (Eye-Direction Detector) 視線方向検出器 SAM (Shared Attention Mechanism) 共有注意の機構 ToMM (Theory of Mind Mechanism) 心の理論の機構 Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) 従来の心・感情モデル(5/5) 従来のモデルの問題点 1.処理のためのデータ構造やアルゴリズムが明確に示してはいない 2.工学的に応用するまでに至っていない 人とふれあう癒し系ロボットPDDINの 研究・開発による心のモデルの考案 Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) <参考情報>感性情報科学の研究室 東京工科大学で感情関連の研究をしている研究室はいろいろとあります。 亀田研究室(癒し系ロボット・認知機能モデル) 大野研究室(感情音声の認識・合成) 長名研究室(感情のニューラルネットモデル) 岩下研究室(音声対話システム) 千種研究室(感性語検索) 菊池研究室(感性科学・精神物理学) など 飯田研究室(メディア学部・感情音声) Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) PDDIN 2002年度から開発されている 研究内容 1.感情モデルの提案 2.感情モデルをもちいた,感情システムの構築 3.対話処理システムの構築 4.ロボット本体の作製 Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) PDDIN2005 デモムービー このページにムービーを挿入 Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) 考察 モデルの意義の一つは 「システムの設計図」である。 従来の心・感情のモデルは設計図としては不十分。 というのも… Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) ソフトウェア工学の分野では、 「大規模化・複雑化した情報システム」 に対して、様々な観点から分析・記述・設計 人間の心(脳)も同様ではないのか? Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) ソフトウェア工学で使用する図(UML) ユースケース図 クラス図 オブジェクト図 シーケンス図 ステートマシン図 (ステートチャート図) アクティビティ図 コンポーネント図 コミュニケーション図(コラボレーション図) 配置図 コンポジット図 タイミング図 相互作用概念図 こんなにたくさんある! Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) UMLでの各種ビュー こんなにたくさんの視点がある! 論理ビュー ユースケースビュー クラス図 オブジェクト図 シーケンス図 ユースケース図 アクティビティ図 ステートマシン図 (ステートチャート) コミュニケーション図 (コラボレーション図) コンポーネント図 配置図 コンポーネントビュー 配置ビュー 並行性ビュー Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) 人間の心(脳)に対しても、UML (Unified Modeling Language) を参考にしてモデルを記述するべきであろう。 (1つの方針) (もしかしたら、SysML の方がいいかも...) Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) 心のモデル 計算論的なモデル (computational model) が必要 (基本的主張) Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) 記憶のモデル(従来のモデルの例) 銘記 保持 想起 感覚 貯蔵庫 短期記憶 長期記憶 Baddeleyのworking memory理論も計算論的ではない Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) 心のモデル データ構造+アルゴリズム 知識表現+プログラム (オブジェクト指向) Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) 心のモデルの概要図 (次ページ参照) Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) 心のモデルの知識表現 フレーム形式を採用 理由:オブジェクト指向を意識しているため) Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) 心のモデルのプログラム Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) 心のモデルのプログラム 理解と生成 生成はシステム設計者依存 理解は相手がある->この解決方法は? Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) 心のモデルのプログラム 理解と生成 生成:生成関数Fを利用 理解:生成関数Fの逆関数で推定 逆関数の存在は? 逆関数の同定(作成)方法は? 逆関数の計算は? 解決すべき問題はたくさんある! どうすればいいのか!? Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) 刺激A 反応B Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) 同一視 心のメカニズムは共通 D:心の状態 A:発話+仕草 F: D → A D:心の状態 A:発話+仕草 F: D → A 図6.心のモデルの共通仮説 Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) 刺激X 心の状態Y 反応F(X,Y) α A F1 B F2 β F3 F4 γ F5 F6 Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) まとめ 癒しを実現するためには心のモデルが重要 (他者理解なくしては癒しなし!) 計算論的心のモデルが必要 計算論的とは、 知識表現+プログラム 心のモデルの提案 知識表現+プログラム 他者理解の方法 (IbS: Inference by Synthesis) Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) The Theory of Mind ID (Intentionality Detector) 意図検出器 EDD (Eye-Direction Detector) 視線方向検出器 SAM (Shared Attention Mechanism) 共有注意の機構 ToMM (Theory of Mind Mechanism) 心の理論の機構 Tokyo University of Technology (思考と言語研究室)
Tokyo University of Technology (思考と言語研究室) Let’s call it a day! 次回は1月16日です。 良いお年を! Tokyo University of Technology (思考と言語研究室)