エージェントアプローチ 人工知能 1章・2章  M0 片渕 聡 08/07/02.

Slides:



Advertisements
Similar presentations
キー・コンピテンシーと生きる 力 キー・コンピテンシー – 社会・文化的,技術的道具を相互作用的に活用する力 – 自律的に行動する力 – 社会的に異質な集団で交流する力 生きる力 – 基礎・基本を確実に身に付け,いかに社会が変化しようと, 自ら課題を見つけ,自ら学び,自ら考え, 主体的に判断 し,行動し,よりよく問題を解決する資質や能力.
Advertisements

ロボット制御のソフトウェ ア: シミュレータ試作 情報理工学部 情報知能学科 H 207051 中谷聡太郎.
社会システム論 第 1 回 システムとは何か 大野正英 経済学部准教授. この授業のねらい 現代社会をシステムという視点から捉 える。 社会の複雑さをシステムというツール を用いることによって、理解する。
プログラミング言語論 第10回(演習) 情報工学科 木村昌臣   篠埜 功.
心理測定論 信号検出理論.
「わかりやすいパターン認識」 第1章:パターン認識とは
教育心理学 学習と認知プロセス 伊藤 崇 北海道大学大学院教育学研究院.
Tokyo University of Technology Hiroyuki KAMEDA KE304 9:00~10:30
執筆者:市川伸一 授業者:寺尾 敦 atsushi [at] si.aoyama.ac.jp
「Self-Organizing Map 自己組織化マップ」 を説明するスライド
情報は人の行為に どのような影響を与えるか
「データ学習アルゴリズム」 第3章 複雑な学習モデル 3.1 関数近似モデル ….. … 3層パーセプトロン
グループ研究1班 第一章 経営戦略とは何か 雨森 彩 大嶋 健夫 小沢 博之.
遺伝アルゴリズムによる NQueen解法 ~遺伝補修飾を用いた解探索の性能評価~
情報科学1(G1) 2016年度.
エージェントアプローチ 人工知能 21章 B4 片渕 聡.
確率モデルによる 画像処理技術入門 --- ベイズ統計と確率的画像処理 ---
協調機械システム論 (04.11, 04,本郷) 協調機械システム論 東京大学 人工物工学研究センター 淺間 一.
CSP記述によるモデル設計と ツールによる検証
エージェントアプローチ 人工知能 7章・8章 B4 片渕 08/07/18.
高山建志 五十嵐健夫 テクスチャ合成の新たな応用と展開 k 情報処理 vol.53 No.6 June 2012 pp
エージェントについて 上杉裕也.
シミュレーション演習 G. 総合演習 (Mathematica演習) システム創成情報工学科
新ゲーム理論 第Ⅰ部 非協力ゲームの理論 第1章 非協力ゲームの戦略形
人工知能特論2007 東京工科大学 亀田弘之.
要約 きりん、まぐろ、PB.
プログラム実行時情報を用いたトランザクションファンクション抽出手法
シミュレーション論 Ⅱ 第14回 まとめ.
シミュレーション論 Ⅱ 第15回 まとめ.
協調機械システム論 ( ,本郷) 協調機械システム論 東京大学 人工物工学研究センター 淺間 一.
アルゴリズムとチューリングマシン 「もの」(商品)としてのコンピュータ 「こと」(思想)としてのコンピュータ アルゴリズム
高速剰余算アルゴリズムとそのハードウェア実装についての研究
ベイジアンネット混合モデルによる 強化学習エージェントの方策改善
思考支援ツールを用いた 情報処理技術知識の学習方式
人工知能特論2009 東京工科大学 亀田弘之 KE304.
米山研究室紹介 -システム制御工学研究室-
1DS05175M 安東遼一 1DS05213M 渡邉光寿 指導教員: 高木先生
あらまし アンサンブル学習の大きな特徴として,多数決などで生徒を組み合わせることにより,単一の生徒では表現できない入出力関係を実現できることがあげられる.その意味で,教師が生徒のモデル空間内にない場合のアンサンブル学習の解析は非常に興味深い.そこで本研究では,教師がコミティマシンであり生徒が単純パーセプトロンである場合のアンサンブル学習を統計力学的なオンライン学習の枠組みで議論する.メトロポリス法により汎化誤差を計算した結果,ヘブ学習ではすべての生徒は教師中間層の中央に漸近すること,パーセプトロン学習では
執筆者:伊東 昌子 授業者:寺尾 敦 atsushi [at] si.aoyama.ac.jp
卒論の書き方: 参考文献について 2017年9月27日 小尻智子.
TIME SIGNAL: 集合知を利用した赤信号点灯時間の取得手法
予測に用いる数学 2004/05/07 ide.
AIを用いたドローンの 新たな姿勢制御方法に関する研究
連続領域におけるファジィ制約充足問題の 反復改善アルゴリズムによる解法 Solving by heuristic repair Algorithm of the Fuzzy Constraint Satisfaction Problems with Continuous Domains 北海道大学.
ディジタル信号処理 Digital Signal Processing
(1)序論 人工知能とは 歴史 方法論 人工知能の基礎 問題解決 探索 推論 知識.
知能情報システム特論 Introduction
物体検出による視覚補助システム T215085 若松大仁 白井研究室.
背景 課題 目的 手法 作業 期待 成果 有限体積法による汎用CFDにおける 流体構造連成解析ソルバーの計算効率の検証
SIFTとGraph Cutsを用いた 物体認識及びセグメンテーション
シミュレーション論 Ⅱ 第1回.
情報基礎Ⅱ (第1回) 月曜4限 担当:北川 晃.
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
コンピュータアーキテクチャ 第 5 回.
クローン検出ツールを用いた ソフトウェアシステムの類似度調査
香川大学工学部 富永浩之 知識工学1 第1-1章 人工知能と知識工学 香川大学工学部 富永浩之
執筆者:難波和明 授業者:寺尾 敦 atsushi [at] si.aoyama.ac.jp
自然言語処理2015 Natural Language Processing 2015
コンピュータアーキテクチャ 第 5 回.
情報数理Ⅱ 第10章 オートマトン 平成28年12月21日.
自然言語処理2016 Natural Language Processing 2016
感覚運動期(誕生~2歳) 第1段階 反射の修正(出生~約1ヶ月) 第2段階 第1次循環反応(約1ヶ月~4ヶ月)
オブジェクト指向言語における セキュリティ解析アルゴリズムの提案と実現
情報処理の概念 #0 概説 / 2002 (秋) 一般教育研究センター 安田豊.
一問一答式クイズAQuAsにおける学習支援の方法
P2Pによる協調学習システム 唐澤 信介   北海道工業大学 電気工学専攻.
教師がコミティマシンの場合のアンサンブル学習 三好 誠司(神戸高専) 原 一之(都立高専) 岡田 真人(東大,理研,さきがけ)
Presentation transcript:

エージェントアプローチ 人工知能 1章・2章  M0 片渕 聡 08/07/02

目次 第1章:序論 第2章:知的エージェント

第1章:序論 目次 研究の背景 AIへのアプローチ 人工知能の基盤 人工知能に関する最新技術 1章まとめ  -人間のように行動する(チューリングテストアプローチ)  -人間のように考えるシステム(認知モデルアプローチ)  -合理的に考える(思考の法則によるアプローチ)  -合理的に行動する(合理エージェントアプローチ) 人工知能の基盤 人工知能に関する最新技術 1章まとめ

第1章:序論 目次 研究の背景 AIへのアプローチ 人工知能の基盤 人工知能に関する最新技術 1章まとめ  -人間のように行動する(チューリングテストアプローチ)  -人間のように考えるシステム(認知モデルアプローチ)  -合理的に考える(思考の法則によるアプローチ)  -合理的に行動する(合理エージェントアプローチ) 人工知能の基盤 人工知能に関する最新技術 1章まとめ

研究の背景 人間のような知的存在の理解・構築 -定義すら未だ曖昧な段階 -人類文明に大きな影響を与える 非常に興味深い分野  -定義すら未だ曖昧な段階  -人類文明に大きな影響を与える  非常に興味深い分野 現在のAI分野の領域  -汎用領域(認識、論理的推論)  -下位(専用)領域(チェス、病気診断etc)

第1章:序論 目次 研究の背景 AIへのアプローチ 人工知能の基盤 人工知能に関する最新技術 1章まとめ  -人間のように行動する(チューリングテストアプローチ)  -人間のように考えるシステム(認知モデルアプローチ)  -合理的に考える(思考の法則によるアプローチ)  -合理的に行動する(合理エージェントアプローチ) 人工知能の基盤 人工知能に関する最新技術 1章まとめ

AIのアプローチのカテゴリ分類 ・分岐1:思考に興味あるか行動に興味があるか ・分岐2:モデルの基準が人間か理想像か 人間のように 考えるシステム 合理的に 行動するシステム 行動する結果だけに興味がある 考える結果を導く過程にも興味がある

合理的とは 過ちを犯さないこと(⇔人間的) -例えば人間はいくら試験勉強をしても試験でミスを犯すことがある  -例えば人間はいくら試験勉強をしても試験でミスを犯すことがある 合理的であっても全能というわけではない  -例えば道路を渡る際いくら安全確認をしても突然隕石が直撃することは予測できない

チューリングテストアプローチ (人間のように行動する) ある計算機に知能があるのかを検証    1.質問者(人間)と質問のやりとりをする    2.質問者が人間か機械かを判別できなければ合格 ※質問者は物理的に機械を確認することは出来ない 質問者(人間) 回答者(機械) 相手は 人間?機械? いかにして この目標を達成するかの 研究が進められている

チューリングテストの成功 必要な(になるであろう)技術 自然言語処理  -日本語や英語を理解、処理する技術 知識表現  -今までに得た情報を格納する技術 自動推論  -蓄えられた情報を元に結論を導き出す技術 機械学習  -解析したデータを元にパターンを検出する技術

統合チューリングテスト 現実には物理環境を考慮する必要がある -視覚認識(機械が物体を認識するために必要)  -視覚認識(機械が物体を認識するために必要)  -ロボット工学(物体を操作するために必要) 人間 機械 答えは これですね

認知モデルアプローチ (人間のように考える) 人間がどのように考えているのかを知る  -内省  -心理実験 認知科学  -AIの計算機モデルと心理学の融合 人間の心理の理論的な構築を目指す

思考の法則によるアプローチ (合理的に考える) 「正しい思考」(反駁不可能な推論)の体系化  -思考の法則が心理を支配するという考え方 三段論法 鈴木君は 人間だ 全ての人間は いつか死ぬ 鈴木君は いつか死ぬ 形式論証によるアプローチ ↓ 論理主義アプローチ

論理主義アプローチへの障害 厳密に規定されていない知識の形式化が困難 -現在の論理式では全ての知識をカバーできない  -現在の論理式では全ての知識をカバーできない 論理的な問題と現実問題に大きな隔たりがある  -机上の空論になる可能性がある  -事実がわかってもその組合わせ方がわからない   ・事実A,B,Cがあったとしてそれらをどう組み合わせる?

合理エージェントアプローチ (合理的に行動する) 自己の信念を元に目標達成のために行動する  ・チューリングテスト+推論  -「思考の法則」アプローチと比べ一般的  -チューリングテストと比べ判断基準が明確    (人間の特殊な環境を考慮するのは今はまだ早い) 本書では合理的アプローチを主に扱う

第1章:序論 目次 研究の背景 AIへのアプローチ 人工知能の基盤 人工知能に関する最新技術 1章まとめ  -人間のように行動する(チューリングテストアプローチ)  -人間のように考えるシステム(認知モデルアプローチ)  -合理的に考える(思考の法則によるアプローチ)  -合理的に行動する(合理エージェントアプローチ) 人工知能の基盤 人工知能に関する最新技術 1章まとめ

人工知能の基盤 AIは様々な分野の概念や技術を継承している -哲学(唯物論) -数学(アルゴリズム) -心理学(行動主義、認知心理学)  -哲学(唯物論)  -数学(アルゴリズム)  -心理学(行動主義、認知心理学)  -計算機技術(プログラム言語、OS)  -言語学(計算言語学問、自然言語処理) AIの 概念 AIの 実装

第1章:序論 目次 研究の背景 AIへのアプローチ 人工知能の基盤 人工知能に関する最新技術 1章まとめ  -人間のように行動する(チューリングテストアプローチ)  -人間のように考えるシステム(認知モデルアプローチ)  -合理的に考える(思考の法則によるアプローチ)  -合理的に行動する(合理エージェントアプローチ) 人工知能の基盤 人工知能に関する最新技術 1章まとめ

人工知能に関する最新(?)技術 チェス世界チャンピオンを打ち破るプログラム(1989) 音声認識のミスを対話の成り行きの理解で修正する対話プログラム(1994) 宇宙船からの膨大なデータを処理し、重大な問題をアナリストに知らせるシステム(1992) 自律走行システム(1993) などなど・・・

第1章:序論 目次 研究の背景 AIへのアプローチ 人工知能の基盤 人工知能に関する最新技術 1章まとめ  -人間のように行動する(チューリングテストアプローチ)  -人間のように考えるシステム(認知モデルアプローチ)  -合理的に考える(思考の法則によるアプローチ)  -合理的に行動する(合理エージェントアプローチ) 人工知能の基盤 人工知能に関する最新技術 1章まとめ

1章まとめ AIへのアプローチは様々である  -興味は思考or行動  -モデルは人間or合理性 AIは様々な分野の概念や技術を継承

ここまでが1章です ここから2章になります

第2章:知的エージェント 目次 知的エージェントとは 理想的な合理的エージェント 理想的マッピング 知的エージェントの構造 エージェントプログラム 環境の特徴 まとめ

第2章:知的エージェント 目次 知的エージェントとは 理想的な合理的エージェント 理想的マッピング 知的エージェントの構造 エージェントプログラム 環境の特徴 まとめ

知的エージェントとは 環境をセンサで知覚 環境に対して手足(エフェクタ)を介して動作 センサ 環境 処理 エフェクタ エージェント

第2章:知的エージェント 目次 知的エージェントとは 理想的な合理的エージェント 理想的マッピング 知的エージェントの構造 エージェントプログラム 環境の特徴 まとめ

合理的とは(再掲) 過ちを犯さないこと(⇔人間的) -例えば人間はいくら試験勉強をしても試験でミスを犯すことがある  -例えば人間はいくら試験勉強をしても試験でミスを犯すことがある 合理的であっても全能というわけではない  -例えば道路を渡る際いくら安全確認をしても突然隕石が直撃することは予測できない

性能尺度・知覚列 性能尺度 エージェントのどれくらい正しく動作するかを 評価する基準 例:道路を渡る前に左右を見渡すと性能尺度は上昇 知覚列  エージェントのどれくらい正しく動作するかを  評価する基準  例:道路を渡る前に左右を見渡すと性能尺度は上昇  -全てのエージェントに適用できる基準はない 知覚列  エージェントが知覚した全ての情報の履歴

組込み知識・自律性 組込み知識 人間によって予めエージェントに組み込まれている知識 自律性  人間によって予めエージェントに組み込まれている知識 自律性  組込み知識に基づかずエージェント自身の経験に基づいて行動すること  -自律性に欠けるエージェントは適応性にも欠ける

理想的な合理的エージェント 知覚列とエージェント自身の持つ組込み知識に基づいて性能尺度を最大にする動作を選ぶ エージェント   エージェント 例:道路を渡るエージェントの場合    -安全を確認するため左右を見渡すetc 環境に関して知っていることも合理性には重要

第2章:知的エージェント 目次 知的エージェントとは 理想的な合理的エージェント 理想的マッピング 知的エージェントの構造 エージェントプログラム 環境の特徴 まとめ

知覚列から動作へのマッピング 知覚列と動作の対応付けでエージェントを表現 例:知覚xに対する平方根zのマッピング 知覚x 動作z 1.0 1.00000000 1.1 1.04880884 1.2 1.09544511 1.3 1.14017542

理想的マッピング どんな知覚列に対しても、それに応じてエージェントが取るべき動作を特定できるマッピング 先ほどの平方根の例も理想的マッピング 知覚x 動作z 1.0 1.00000000 1.1 1.04880884 1.2 1.09544511 1.3 1.14017542

第2章:知的エージェント 目次 知的エージェントとは 理想的な合理的エージェント 理想的マッピング 知的エージェントの構造 エージェントプログラム 環境の特徴 まとめ

知的エージェントの構造 エージェント=プログラム+アーキテクチャ ※(エージェント)プログラム 知覚から動作へマッピングする関数を設計  知覚から動作へマッピングする関数を設計 ※アーキテクチャ  プログラムを受け入れ実行する計算装置

第2章:知的エージェント 目次 知的エージェントとは 理想的な合理的エージェント 理想的マッピング 知的エージェントの構造 エージェントプログラム 環境の特徴 まとめ

エージェントプログラム 骨格プログラム 新たに知覚を得ると内部情報を更新(記憶) 知覚に基づき最良の動作を選択(マッピング) 選択した動作の情報も内部に記憶

エージェントのタイプ エージェントは以下の4つの要素に依存 -知覚(P) -動作(A) -ゴール(G) -環境(E) 性質に応じたプログラムを用いる必要がある

エージェントプログラムの種類 単純反射エージェント 内部状態を持つエージェント ゴール主導エージェント 効用主導エージェント 単純 低信頼 複雑 高信頼

単純反射エージェント 現在の状態に適合するルールを見つけてそのルールに見合う動作を行う -例:前の車が減速したブレーキを踏む  -例:前の車が減速したブレーキを踏む 現実世界においては適用できる範囲が狭い 条件(IF)-動作(THEN)ルール

単純反射エージェントの構造 環境 Agent Sensor 現在の環境状態 IF-THENルール 最善の動作選択 Effectors

内部状態を持つ反射エージェント 環境の状態を用いることで単純反射と比べて適用範囲を広げる -時間と共に内部状態は更新される  -時間と共に内部状態は更新される 例:車線変更の場合  -「信号が見えた車線変更する」では不十分  -「近くに車が無いか」という状態を保持  -その状態も考慮した上で車線変更するかを決定

内部状態を持つ反射エージェントの構造 環境 Agent Sensor 内部状態 現在の環境状態 IF-THENルール 最善の動作選択 Effectors

ゴール主導エージェント エージェントにはゴールに関する情報が必要 -例えば移動方向は目的地に依存する  -例えば移動方向は目的地に依存する 探索やプラニングにより動作を決定(3章以降) 未来に関する考慮を含む(IF-THENルールとの相違)  -「もしこの動作をしたら何が起きるのだろうか」       柔軟性・適応性が高い

ゴール主導エージェントの構造 環境 Agent Sensor 内部状態 現在の環境状態 未来への考慮 ゴール 最善の動作選択 Effectors

効用主導エージェント より性能尺度の高い動作列を決定するために 効用関数を用いる より性能尺度の高い動作列を決定するために 効用関数を用いる ※矛盾する目標(e.g.消費電力vs精度)がある時は適切なトレードオフを指定する ※確実に目標を達成する動作列が存在しない時、達成見込みを重み付けする方法をとる

効用主導エージェントの構造 環境 Agent Sensor 内部状態 現在の環境状態 未来への考慮 効用関数 効用の度合い 最善の動作選択 Effectors

第2章:知的エージェント 目次 知的エージェントとは 理想的な合理的エージェント 理想的マッピング 知的エージェントの構造 エージェントプログラム 環境の特徴 まとめ

環境の分類基準(1/2) 環境は幾つかの種類に分類可能 アクセス可能 vs アクセス不能 -センサが環境全体を見渡せるかどうか   -センサが環境全体を見渡せるかどうか 例:チェスは盤上(環境)を見渡せるのでアクセス可能 決定的 vs 非決定的   -環境の次の状態が現在の状態からの動作の選択によって確定できるかどうか 例:将棋は手によって次の環境が特定できるので決定的 

環境の分類基準(2/2) エピソード的 vs 非エピソード的 -前の動作が次の選択に影響を与えないかどうか   -前の動作が次の選択に影響を与えないかどうか 例:チェスは前の手が次の手に影響を与えるので非エピソード的 静的 vs 動的   -エージェントの思考中に環境が変化しないかするか 例:チェスは手を決めるまで環境が変わらないので静的 離散的 vs 連続的   -知覚と動作が有限個に区別できるかどうか 例:チェスは各手ごとに有限個の選択しかないから離散的

環境とその特徴の例 アクセス不能、非決定的、非エピソード的 動的、連続的な環境は複雑 現在の研究のほとんどがこの複雑な環境を想定しているらしい アクセス不能、非決定的、非エピソード的 動的、連続的な環境は複雑

環境(シミュレータ)プログラム 環境と動作を結びつけるプログラム 各エージェントに知覚を与える エージェントから動作を受け取り環境を更新

第2章:知的エージェント 目次 知的エージェントとは 理想的な合理的エージェント 理想的マッピング 知的エージェントの構造 エージェントプログラム 環境の特徴 まとめ

2章まとめ エージェントはセンサで知覚してエフェクタで環境に働きかける エージェント=プログラム+アーキテクチャ エージェントプログラムでは内部情報を更新しつつ知覚から動作にマッピングする関数を設計 エージェントは知覚、動作、ゴール、環境に依存 アクセス不能、非決定的、非エピソード的、動的、連続的な環境は複雑

第1章:序論(2+1)(13+5+1) 目次 研究の背景(1) AIへのアプローチ(2) 人工知能の基盤(1)  -人間のように行動する(チューリングテストアプローチ)(3)  -人間のように考えるシステム(認知モデルアプローチ)(1)  -合理的に考える(思考の法則によるアプローチ)(2)  -合理的に行動する(合理エージェントアプローチ)(1) 人工知能の基盤(1) 人工知能に関する最新技術(1) 1章まとめ(1)

第2章:知的エージェント 目次(24+7+1) 知的エージェントとは(1) 理想的な合理的エージェント(4) 理想的マッピング(2) 知的エージェントの構造(1) エージェントプログラム(11) 環境の特徴(4) 2章まとめ(1)