エージェントアプローチ人工知能　１章・２章　Ｍ０　片渕　聡 08/07/02.

Slides:

Advertisements

Similar presentations

キー・コンピテンシーと生きる力キー・コンピテンシー – 社会・文化的，技術的道具を相互作用的に活用する力 – 自律的に行動する力 – 社会的に異質な集団で交流する力生きる力 – 基礎・基本を確実に身に付け，いかに社会が変化しようと，自ら課題を見つけ，自ら学び，自ら考え，主体的に判断し，行動し，よりよく問題を解決する資質や能力.

Advertisements

ロボット制御のソフトウェア：シミュレータ試作情報理工学部情報知能学科 H ２０７０５１中谷聡太郎.

社会システム論第 1 回システムとは何か大野正英経済学部准教授. この授業のねらい現代社会をシステムという視点から捉える。社会の複雑さをシステムというツールを用いることによって、理解する。

プログラミング言語論第10回（演習）情報工学科　木村昌臣　篠埜　功.

心理測定論信号検出理論.

「わかりやすいパターン認識」第１章：パターン認識とは

教育心理学学習と認知プロセス伊藤　崇北海道大学大学院教育学研究院.

Tokyo University of Technology Hiroyuki KAMEDA KE304 9:00～10:30

執筆者：市川伸一授業者：寺尾敦 atsushi [at] si.aoyama.ac.jp

「Self-Organizing Map 自己組織化マップ」を説明するスライド

情報は人の行為にどのような影響を与えるか

「データ学習アルゴリズム」第３章複雑な学習モデル 3.1 関数近似モデル ….. … ３層パーセプトロン

グループ研究１班第一章　経営戦略とは何か雨森彩大嶋健夫小沢博之.

遺伝アルゴリズムによる NQueen解法 ~遺伝補修飾を用いた解探索の性能評価~

情報科学１（G1）２０１６年度.

エージェントアプローチ人工知能　21章 B4　片渕聡.

確率モデルによる画像処理技術入門 --- ベイズ統計と確率的画像処理 ---

協調機械システム論 (04.11, 04，本郷）協調機械システム論東京大学　人工物工学研究センター淺間　一.

CSP記述によるモデル設計とツールによる検証

エージェントアプローチ人工知能　７章・８章 B4　片渕 08/07/18.

高山建志五十嵐健夫テクスチャ合成の新たな応用と展開 k 情報処理 vol.53 No.6 June 2012 pp

エージェントについて上杉裕也.

シミュレーション演習 G. 総合演習（Mathematica演習）システム創成情報工学科

新ゲーム理論第Ⅰ部非協力ゲームの理論第1章非協力ゲームの戦略形

人工知能特論2007 東京工科大学亀田弘之.

要約きりん、まぐろ、ＰＢ.

プログラム実行時情報を用いたトランザクションファンクション抽出手法

シミュレーション論 Ⅱ 第１４回まとめ.

シミュレーション論 Ⅱ 第１５回まとめ.

協調機械システム論 ( ，本郷）協調機械システム論東京大学　人工物工学研究センター淺間　一.

アルゴリズムとチューリングマシン「もの」(商品)としてのコンピュータ「こと」(思想)としてのコンピュータアルゴリズム

高速剰余算アルゴリズムとそのハードウェア実装についての研究

ベイジアンネット混合モデルによる強化学習エージェントの方策改善

思考支援ツールを用いた情報処理技術知識の学習方式

人工知能特論2009 東京工科大学亀田弘之 KE304.

米山研究室紹介 -システム制御工学研究室-

1DS05175M 安東遼一 1DS05213M 渡邉光寿指導教員：高木先生

あらましアンサンブル学習の大きな特徴として，多数決などで生徒を組み合わせることにより，単一の生徒では表現できない入出力関係を実現できることがあげられる．その意味で，教師が生徒のモデル空間内にない場合のアンサンブル学習の解析は非常に興味深い．そこで本研究では，教師がコミティマシンであり生徒が単純パーセプトロンである場合のアンサンブル学習を統計力学的なオンライン学習の枠組みで議論する．メトロポリス法により汎化誤差を計算した結果，ヘブ学習ではすべての生徒は教師中間層の中央に漸近すること，パーセプトロン学習では

執筆者：伊東昌子授業者：寺尾敦 atsushi [at] si.aoyama.ac.jp

卒論の書き方：参考文献について 2017年9月27日小尻智子.

TIME SIGNAL: 集合知を利用した赤信号点灯時間の取得手法

予測に用いる数学 2004/05/07 ide.

AIを用いたドローンの新たな姿勢制御方法に関する研究

連続領域におけるファジィ制約充足問題の反復改善アルゴリズムによる解法 Solving by heuristic repair Algorithm of the Fuzzy Constraint Satisfaction Problems with Continuous Domains 北海道大学.

ディジタル信号処理 Digital Signal Processing

（１）序論人工知能とは歴史方法論人工知能の基礎問題解決探索推論知識.

知能情報システム特論 Introduction

物体検出による視覚補助システム T215085　若松大仁　白井研究室.

背景課題目的手法作業期待成果有限体積法による汎用CFDにおける流体構造連成解析ソルバーの計算効率の検証

SIFTとGraph Cutsを用いた物体認識及びセグメンテーション

シミュレーション論 Ⅱ 第1回.

情報基礎Ⅱ （第１回）月曜４限担当：北川晃.

東京工科大学コンピュータサイエンス学部亀田弘之

東京工科大学コンピュータサイエンス学部亀田弘之

コンピュータアーキテクチャ第 5 回.

クローン検出ツールを用いたソフトウェアシステムの類似度調査

香川大学工学部富永浩之知識工学１第1-1章人工知能と知識工学香川大学工学部富永浩之

執筆者：難波和明授業者：寺尾敦 atsushi [at] si.aoyama.ac.jp

自然言語処理2015 Natural Language Processing 2015

コンピュータアーキテクチャ第 5 回.

情報数理Ⅱ 第10章　オートマトン平成28年12月21日.

自然言語処理2016 Natural Language Processing 2016

感覚運動期（誕生～2歳）第1段階反射の修正（出生～約1ヶ月）第2段階第1次循環反応（約1ヶ月～4ヶ月）

オブジェクト指向言語におけるセキュリティ解析アルゴリズムの提案と実現

情報処理の概念 #0 概説 / 2002 (秋) 一般教育研究センター安田豊.

一問一答式クイズAQuAsにおける学習支援の方法

P2Pによる協調学習システム唐澤　信介　　北海道工業大学　電気工学専攻.

教師がコミティマシンの場合のアンサンブル学習三好誠司（神戸高専）原一之（都立高専）岡田真人（東大，理研，さきがけ）

Presentation transcript:

エージェントアプローチ人工知能　１章・２章　Ｍ０　片渕　聡 08/07/02

目次第１章：序論第２章：知的エージェント

第１章：序論目次研究の背景 AIへのアプローチ人工知能の基盤人工知能に関する最新技術１章まとめ　－人間のように行動する(チューリングテストアプローチ) 　－人間のように考えるシステム(認知モデルアプローチ) 　－合理的に考える(思考の法則によるアプローチ) 　－合理的に行動する(合理エージェントアプローチ) 人工知能の基盤人工知能に関する最新技術１章まとめ

第１章：序論目次研究の背景 AIへのアプローチ人工知能の基盤人工知能に関する最新技術１章まとめ　－人間のように行動する(チューリングテストアプローチ) 　－人間のように考えるシステム(認知モデルアプローチ) 　－合理的に考える(思考の法則によるアプローチ) 　－合理的に行動する(合理エージェントアプローチ) 人工知能の基盤人工知能に関する最新技術１章まとめ

研究の背景人間のような知的存在の理解・構築－定義すら未だ曖昧な段階－人類文明に大きな影響を与える 非常に興味深い分野　－定義すら未だ曖昧な段階　－人類文明に大きな影響を与える　非常に興味深い分野現在のAI分野の領域　－汎用領域(認識、論理的推論) 　－下位(専用)領域(チェス、病気診断etc)

第１章：序論目次研究の背景 AIへのアプローチ人工知能の基盤人工知能に関する最新技術１章まとめ　－人間のように行動する(チューリングテストアプローチ) 　－人間のように考えるシステム(認知モデルアプローチ) 　－合理的に考える(思考の法則によるアプローチ) 　－合理的に行動する(合理エージェントアプローチ) 人工知能の基盤人工知能に関する最新技術１章まとめ

AIのアプローチのカテゴリ分類・分岐１：思考に興味あるか行動に興味があるか・分岐２：モデルの基準が人間か理想像か人間のように考えるシステム合理的に行動するシステム行動する結果だけに興味がある考える結果を導く過程にも興味がある

合理的とは過ちを犯さないこと(⇔人間的) －例えば人間はいくら試験勉強をしても試験でミスを犯すことがある　－例えば人間はいくら試験勉強をしても試験でミスを犯すことがある合理的であっても全能というわけではない　－例えば道路を渡る際いくら安全確認をしても突然隕石が直撃することは予測できない

チューリングテストアプローチ (人間のように行動する) ある計算機に知能があるのかを検証　　　１．質問者(人間)と質問のやりとりをする　　　２．質問者が人間か機械かを判別できなければ合格 ※質問者は物理的に機械を確認することは出来ない質問者(人間) 回答者(機械) 相手は人間？機械？いかにしてこの目標を達成するかの研究が進められている

チューリングテストの成功必要な(になるであろう)技術自然言語処理　－日本語や英語を理解、処理する技術知識表現　－今までに得た情報を格納する技術自動推論　－蓄えられた情報を元に結論を導き出す技術機械学習　－解析したデータを元にパターンを検出する技術

統合チューリングテスト現実には物理環境を考慮する必要がある－視覚認識(機械が物体を認識するために必要) 　－視覚認識(機械が物体を認識するために必要) 　－ロボット工学(物体を操作するために必要) 人間機械答えはこれですね

認知モデルアプローチ (人間のように考える) 人間がどのように考えているのかを知る　－内省　－心理実験認知科学　－ＡＩの計算機モデルと心理学の融合人間の心理の理論的な構築を目指す

思考の法則によるアプローチ (合理的に考える) 「正しい思考」(反駁不可能な推論)の体系化　－思考の法則が心理を支配するという考え方三段論法鈴木君は人間だ全ての人間はいつか死ぬ鈴木君はいつか死ぬ形式論証によるアプローチ ↓ 論理主義アプローチ

論理主義アプローチへの障害厳密に規定されていない知識の形式化が困難－現在の論理式では全ての知識をカバーできない　－現在の論理式では全ての知識をカバーできない論理的な問題と現実問題に大きな隔たりがある　－机上の空論になる可能性がある　－事実がわかってもその組合わせ方がわからない　　・事実A,B,Cがあったとしてそれらをどう組み合わせる?

合理エージェントアプローチ (合理的に行動する) 自己の信念を元に目標達成のために行動する　・チューリングテスト＋推論　－「思考の法則」アプローチと比べ一般的　－チューリングテストと比べ判断基準が明確　　　(人間の特殊な環境を考慮するのは今はまだ早い) 本書では合理的アプローチを主に扱う

第１章：序論目次研究の背景 AIへのアプローチ人工知能の基盤人工知能に関する最新技術１章まとめ　－人間のように行動する(チューリングテストアプローチ) 　－人間のように考えるシステム(認知モデルアプローチ) 　－合理的に考える(思考の法則によるアプローチ) 　－合理的に行動する(合理エージェントアプローチ) 人工知能の基盤人工知能に関する最新技術１章まとめ

人工知能の基盤 AIは様々な分野の概念や技術を継承している－哲学(唯物論) －数学(アルゴリズム) －心理学(行動主義、認知心理学) 　－哲学(唯物論) 　－数学(アルゴリズム) 　－心理学(行動主義、認知心理学) 　－計算機技術(プログラム言語、OS) 　－言語学(計算言語学問、自然言語処理) AIの概念 AIの実装

第１章：序論目次研究の背景 AIへのアプローチ人工知能の基盤人工知能に関する最新技術１章まとめ　－人間のように行動する(チューリングテストアプローチ) 　－人間のように考えるシステム(認知モデルアプローチ) 　－合理的に考える(思考の法則によるアプローチ) 　－合理的に行動する(合理エージェントアプローチ) 人工知能の基盤人工知能に関する最新技術１章まとめ

人工知能に関する最新(?)技術チェス世界チャンピオンを打ち破るプログラム(1989) 音声認識のミスを対話の成り行きの理解で修正する対話プログラム(1994) 宇宙船からの膨大なデータを処理し、重大な問題をアナリストに知らせるシステム(1992) 自律走行システム(1993) などなど・・・

第１章：序論目次研究の背景 AIへのアプローチ人工知能の基盤人工知能に関する最新技術１章まとめ　－人間のように行動する(チューリングテストアプローチ) 　－人間のように考えるシステム(認知モデルアプローチ) 　－合理的に考える(思考の法則によるアプローチ) 　－合理的に行動する(合理エージェントアプローチ) 人工知能の基盤人工知能に関する最新技術１章まとめ

１章まとめ AIへのアプローチは様々である　－興味は思考or行動　－モデルは人間or合理性 AIは様々な分野の概念や技術を継承

ここまでが１章ですここから２章になります

第２章：知的エージェント目次知的エージェントとは理想的な合理的エージェント理想的マッピング知的エージェントの構造エージェントプログラム環境の特徴まとめ

第２章：知的エージェント目次知的エージェントとは理想的な合理的エージェント理想的マッピング知的エージェントの構造エージェントプログラム環境の特徴まとめ

知的エージェントとは環境をセンサで知覚環境に対して手足(エフェクタ)を介して動作センサ環境処理エフェクタエージェント

第２章：知的エージェント目次知的エージェントとは理想的な合理的エージェント理想的マッピング知的エージェントの構造エージェントプログラム環境の特徴まとめ

合理的とは(再掲) 過ちを犯さないこと(⇔人間的) －例えば人間はいくら試験勉強をしても試験でミスを犯すことがある　－例えば人間はいくら試験勉強をしても試験でミスを犯すことがある合理的であっても全能というわけではない　－例えば道路を渡る際いくら安全確認をしても突然隕石が直撃することは予測できない

性能尺度・知覚列性能尺度エージェントのどれくらい正しく動作するかを評価する基準例：道路を渡る前に左右を見渡すと性能尺度は上昇知覚列　エージェントのどれくらい正しく動作するかを　評価する基準　例：道路を渡る前に左右を見渡すと性能尺度は上昇　－全てのエージェントに適用できる基準はない知覚列　エージェントが知覚した全ての情報の履歴

組込み知識・自律性組込み知識人間によって予めエージェントに組み込まれている知識自律性　人間によって予めエージェントに組み込まれている知識自律性　組込み知識に基づかずエージェント自身の経験に基づいて行動すること　－自律性に欠けるエージェントは適応性にも欠ける

理想的な合理的エージェント知覚列とエージェント自身の持つ組込み知識に基づいて性能尺度を最大にする動作を選ぶエージェント　エージェント例：道路を渡るエージェントの場合　　　－安全を確認するため左右を見渡すetc 環境に関して知っていることも合理性には重要

第２章：知的エージェント目次知的エージェントとは理想的な合理的エージェント理想的マッピング知的エージェントの構造エージェントプログラム環境の特徴まとめ

知覚列から動作へのマッピング知覚列と動作の対応付けでエージェントを表現例：知覚xに対する平方根zのマッピング知覚x 動作z 1.0 1.00000000 1.1 1.04880884 1.2 1.09544511 1.3 1.14017542

理想的マッピングどんな知覚列に対しても、それに応じてエージェントが取るべき動作を特定できるマッピング先ほどの平方根の例も理想的マッピング知覚x 動作z 1.0 1.00000000 1.1 1.04880884 1.2 1.09544511 1.3 1.14017542

第２章：知的エージェント目次知的エージェントとは理想的な合理的エージェント理想的マッピング知的エージェントの構造エージェントプログラム環境の特徴まとめ

知的エージェントの構造エージェント＝プログラム＋アーキテクチャ ※(エージェント)プログラム知覚から動作へマッピングする関数を設計　知覚から動作へマッピングする関数を設計 ※アーキテクチャ　プログラムを受け入れ実行する計算装置

第２章：知的エージェント目次知的エージェントとは理想的な合理的エージェント理想的マッピング知的エージェントの構造エージェントプログラム環境の特徴まとめ

エージェントプログラム骨格プログラム新たに知覚を得ると内部情報を更新(記憶) 知覚に基づき最良の動作を選択(マッピング) 選択した動作の情報も内部に記憶

エージェントのタイプエージェントは以下の４つの要素に依存－知覚(P) －動作(A) －ゴール(G) －環境(E) 性質に応じたプログラムを用いる必要がある

エージェントプログラムの種類単純反射エージェント内部状態を持つエージェントゴール主導エージェント効用主導エージェント単純低信頼複雑高信頼

単純反射エージェント現在の状態に適合するルールを見つけてそのルールに見合う動作を行う－例：前の車が減速したブレーキを踏む　－例：前の車が減速したブレーキを踏む現実世界においては適用できる範囲が狭い条件(IF)－動作(THEN)ルール

単純反射エージェントの構造環境 Agent Sensor 現在の環境状態 IF-THENルール最善の動作選択 Effectors

内部状態を持つ反射エージェント環境の状態を用いることで単純反射と比べて適用範囲を広げる－時間と共に内部状態は更新される　－時間と共に内部状態は更新される例：車線変更の場合　－「信号が見えた車線変更する」では不十分　－「近くに車が無いか」という状態を保持　－その状態も考慮した上で車線変更するかを決定

内部状態を持つ反射エージェントの構造環境 Agent Sensor 内部状態現在の環境状態 IF-THENルール最善の動作選択 Effectors

ゴール主導エージェントエージェントにはゴールに関する情報が必要－例えば移動方向は目的地に依存する　－例えば移動方向は目的地に依存する探索やプラニングにより動作を決定(３章以降) 未来に関する考慮を含む(IF-THENルールとの相違) 　－「もしこの動作をしたら何が起きるのだろうか」　　　　　　柔軟性・適応性が高い

ゴール主導エージェントの構造環境 Agent Sensor 内部状態現在の環境状態未来への考慮ゴール最善の動作選択 Effectors

効用主導エージェントより性能尺度の高い動作列を決定するために効用関数を用いるより性能尺度の高い動作列を決定するために　効用関数を用いる ※矛盾する目標(e.g.消費電力vs精度)がある時は適切なトレードオフを指定する ※確実に目標を達成する動作列が存在しない時、達成見込みを重み付けする方法をとる

効用主導エージェントの構造環境 Agent Sensor 内部状態現在の環境状態未来への考慮効用関数効用の度合い最善の動作選択 Effectors

第２章：知的エージェント目次知的エージェントとは理想的な合理的エージェント理想的マッピング知的エージェントの構造エージェントプログラム環境の特徴まとめ

環境の分類基準(1/2) 環境は幾つかの種類に分類可能アクセス可能 vs アクセス不能－センサが環境全体を見渡せるかどうか　　－センサが環境全体を見渡せるかどうか例：チェスは盤上(環境)を見渡せるのでアクセス可能決定的 vs 非決定的　　－環境の次の状態が現在の状態からの動作の選択によって確定できるかどうか例：将棋は手によって次の環境が特定できるので決定的　

環境の分類基準(2/2) エピソード的 vs 非エピソード的－前の動作が次の選択に影響を与えないかどうか　　－前の動作が次の選択に影響を与えないかどうか例：チェスは前の手が次の手に影響を与えるので非エピソード的静的 vs 動的　　－エージェントの思考中に環境が変化しないかするか例：チェスは手を決めるまで環境が変わらないので静的離散的 vs 連続的　　－知覚と動作が有限個に区別できるかどうか例：チェスは各手ごとに有限個の選択しかないから離散的

環境とその特徴の例アクセス不能、非決定的、非エピソード的動的、連続的な環境は複雑現在の研究のほとんどがこの複雑な環境を想定しているらしいアクセス不能、非決定的、非エピソード的動的、連続的な環境は複雑

環境(シミュレータ)プログラム環境と動作を結びつけるプログラム各エージェントに知覚を与えるエージェントから動作を受け取り環境を更新

第２章：知的エージェント目次知的エージェントとは理想的な合理的エージェント理想的マッピング知的エージェントの構造エージェントプログラム環境の特徴まとめ

２章まとめエージェントはセンサで知覚してエフェクタで環境に働きかけるエージェント＝プログラム＋アーキテクチャエージェントプログラムでは内部情報を更新しつつ知覚から動作にマッピングする関数を設計エージェントは知覚、動作、ゴール、環境に依存アクセス不能、非決定的、非エピソード的、動的、連続的な環境は複雑

第１章：序論（２＋１）（１３＋５＋１）目次研究の背景（１） AIへのアプローチ（２）人工知能の基盤（１）　－人間のように行動する(チューリングテストアプローチ)（３）　－人間のように考えるシステム(認知モデルアプローチ)（１）　－合理的に考える(思考の法則によるアプローチ)（２）　－合理的に行動する(合理エージェントアプローチ)（１）人工知能の基盤（１）人工知能に関する最新技術（１）１章まとめ（１）

第２章：知的エージェント目次（２４＋７＋１）知的エージェントとは（１）理想的な合理的エージェント（４）理想的マッピング（２）知的エージェントの構造（１）エージェントプログラム（１１）環境の特徴（４）２章まとめ（１）