人間の対戦相手としての ゲームアルゴリズム, 話題提供

Slides:



Advertisements
Similar presentations
 C 川船 美帆.  強い人工知能の作成 o 「遺伝的アルゴリズム」  「どうぶつしょうぎ」のアプリケーショ ン作成 o スマートフォン向けアプリケーション.
Advertisements

2行+αチョンプに関する考察 京都大学 ○後藤順一 伊藤大雄.
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
プログラマのレベルアップ.
「わかりやすいパターン認識」 第1章:パターン認識とは
シミュレーション論Ⅰ 第13回 意思決定とシミュレーション.
コンピュータ囲碁の仕組み ~ 将棋との違い ~
ブロック運びゲーム.
データ構造とアルゴリズム論 第6章 探索のアルゴリズム
エージェントモデル シミュレーション.
5.チューリングマシンと計算.
5.チューリングマシンと計算.
生物統計学・第3回 全体を眺める(2) 主成分分析
An Algorithm for Enumerating Maximal Matchings of a Graph
標語を作って 中学生にネット・ケータイの 安全利用を呼びかけよう!
人 工 知 能 第3回 探索法 (教科書21ページ~30ページ)
ツッパリ生徒と泣き虫先生 〜伏見工業ラグビー部 ・日本一への挑戦〜
行動経済学による分析 ~なぜ人は「タダ」に翻弄されてしまうのか~ 古川ゼミ
ソースコード品質概論 なぜソースの品質を追求するのか
A班 ランダム選択に一言加えたら・・・ 成田幸弘 橋本剛 嶌村都.
第36課 頭と体を使うようにしています.
コンピュータープログラミング (C言語)(9) 1.これまでの復習
モンテカルロ法と囲碁・将棋ソフトの人知超え
データ構造とアルゴリズム論 第6章 探索のアルゴリズム
発表者 2011/01/08 楽しい256バイトイントロの 世界 発表者 2011/01/08.
UCB+ 法を用いた Big Two AI の研究
JAVAでつくるオセロ 伊東飛鳥、宮島雄一 長畑弘樹、ソギ原直人.
データ構造とアルゴリズム論 第7章 探索のアルゴリズム
第2回 FLIP FLOP杯 どうしてこの大会をひらくのか? 大会の目的はなにか?.
新ゲーム理論 第Ⅰ部 非協力ゲームの理論 第1章 非協力ゲームの戦略形
シミュレーション論Ⅰ 第11回 意思決定とシミュレーション.
●校内研修(自立型研修)での活用 自立型研修での活用について紹介します。 研修の中でも最も身近なものとして、校内研修があげられます。
定兼邦彦 今井浩 東京大学理学系研究科 情報科学専攻
教育工学を始めよう ~研究テーマの選び方から論文の書き方まで~ (第1章)
WEBアプリケーションの開発 2002年度春学期 大岩研究会2.
4人版リバーシYoninの解析 情報論理研究室 藤本 侑花
BLACK JACKの作成 ブラックジャックのルール 概要 勝敗の判定 開発中の問題点 Aの扱いについて 配り直し(DEAL) 工夫した点
G班メンバー リーダー 橋本望 SE 北本理紗と服部友哉 PPT作成 橋本望と山田侑加
意外と身近なゲーム理論 へなちょこ研究室 p.
~ゲームによる暴力性と社会性の変化はあるか~
一人暮らしの男性のための料理検索システムの設計
数独の解生成と 解に対する番号付け 理学部 情報科学科 渡辺研究室 戸神星也.
統計学の入門講義における 達成動機,自己効力感,およびテスト成績の関連
AI かどうか? 木下研究室 David Chen
モンテカルロ法を用いた 立体四目並べの対戦プログラム
『組織の限界』 第1章 個人的合理性と社会的合理性 前半
麻雀ゲームにおけるAIの開発    日高大地   近畿大学理工学部情報学科  
信頼の構造 原 謙治 2004/10/13.
★C++/オブジェクト指向実践企画★ Othelloゲーム作成
Introduction to Soft Computing
シミュレーション論 Ⅱ 第1回.
構造的類似性を持つ半構造化文書における頻度分析
データ構造とアルゴリズム論 第6章 探索のアルゴリズム
5.チューリングマシンと計算.
数値解析ⅡーI ~オセロゲームのプログラム~
業務5Sカイゼン ミーティングのしかた 開会宣言 カイゼンネタの確認 あらかじめカードを配って書いてきてもらう
プレゼンテーション-技能が必要な理由- 神奈川大学経済学部 経済情報処理I 平成25年度
プレゼンテーション-技能が必要な理由- 神奈川大学経済学部 経済情報処理I 平成18年度 第4回
「対人援助の方法」(対人援助学)としての応用行動分析の“応用”
F班 メンバー 班長 雨堤 智宏 アルゴリズム解析 角田 泰彬 竹林 秀高 ppt作成 清水 貴史
囲碁プログラム 彩の仕組み 山下 宏 2008年9月4日 FIT2008.
数値解析Ⅱ ~五目並べのプログラミング~ C班.
近畿大学理工学部情報学科 情報論理工学研究室 段野健太
第28回世界コンピュータ将棋選手権アピール文章 作成:井本 康宏 作成日:2018/3/吉日
アルゴリズム入門 (Ver /10/07) ・フローチャートとプログラムの基本構造 ・リスト ・合計の計算
参考:大きい要素の処理.
2010応用行動分析(3) 対人援助の方法としての応用行動分析
京都大学 情報学研究科 通信情報システム専攻 高田智史 joint work with 伊藤大雄 中村義作
ペンシルパズルの大道芸ステージショーへの応用
ペンシルパズル「一本線」のヒント数の扱いに関する解析
Presentation transcript:

人間の対戦相手としての ゲームアルゴリズム, 話題提供  3/3 組合せゲーム・パズル ミニ研究集会 池田 心 (京都大学)

自己紹介 学部は数学科 大学院は知能システム科学専攻 現在は京大学術情報メディアセンター助教 昔からゲーム好き,パズル好き,プログラム好き.囲碁五段.    →当然,最強の囲碁プログラムを目指すことに.

研究テーマ:エージェントと最適化 エージェント : 知的処理・制御・意志決定を行う主体 エージェントの,(遺伝アルゴリズムの技術に基づく) 構成・最適化・シミュレーション

何がしたいのか 賢い/速い/強いエージェントを作る ← 昔はこれが優先された 制御可能な強さのエージェントを作る 賢い/速い/強いエージェントを作る ← 昔はこれが優先された 制御可能な強さのエージェントを作る ミクロにリアルなエージェントを作る マクロにリアルなエージェント(群)を作る 人間ぽくない(リアルでない),多様なエージェントを作る 教師ができるエージェントを作る 【なぜ作りたいのか】 創造者的な気分? そこに山があるから? そういうエージェントが作れれば,システムを理解したと思えるから?羽生に勝てれば羽生より偉いから? 役に立つから?

賢い/速い/強いエージェント 比較的定量化しやすい指標(複数でも)について,それが優れていれば良い 目的1 賢い/速い/強いエージェント 比較的定量化しやすい指標(複数でも)について,それが優れていれば良い 勝負としてのゲーム,インフラ制御,投資など 多くの場合これが主流だった

制御可能な強さのエージェント 人間の相手をするAIプレイヤは,強ければ強いほどいいわけではない 目的2 制御可能な強さのエージェント 人間の相手をするAIプレイヤは,強ければ強いほどいいわけではない 遊びとしてのゲーム(特に対等なもの),職業訓練など 定説 「ゲームのAIはアホである」 麻雀 ドラクエIV (同期型コマンド選択戦闘ゲーム) ぷよぷよ (落ちものパズルゲーム) カルドセプト (カード・すごろくゲーム) Age of Empire (エージェントベースド戦争ゲーム) 強さは一軸ではない(例えば将棋AIは序盤と終盤が強い) 「このAIはあまりにもアホである」「このAIはズルをしてる」「このAIは手抜きをしている」「でもいい勝負」ではダメ

ミクロにリアルなエージェント 模擬したい対象(人間など)と,なんらかの意味で挙動が似ていること シミュレーション実験,ゲーム,ペット 目的3 ミクロにリアルなエージェント 模擬したい対象(人間など)と,なんらかの意味で挙動が似ていること シミュレーション実験,ゲーム,ペット たいていは,挙動が似ているほうが親しめる 高いリアルさを持つパラメータの最適化だけでなく,直接目標とする行動を入れ込める仕組みも必要 リアルさのためなら,バレなければズルしてもよいかも

マクロにリアルなエージェント 人工市場,交通規範,社会調査など 目的4 マクロにリアルなエージェント 人工市場,交通規範,社会調査など 着眼点: ミクロにリアルであることと,マクロにリアルであることはお互いに必要条件でも十分条件でない つまり,マクロにリアルなら,目的によってはミクロにリアルでなくてもよい 出展:http://provincie.overijssel.nl/beleid//verkeer_e n_vervoer/bereikbaarheid/knelpunten_in

人間ぽくないエージェント 「能力が近く(良く),挙動も似ている」 ではなく, 「能力は近い(良い)が,挙動は似てない」 を作る 目的5 人間ぽくないエージェント 「能力が近く(良く),挙動も似ている」 ではなく, 「能力は近い(良い)が,挙動は似てない」 を作る 戦法発見,ニッチ開拓,攻撃への予防,ロバスト性 崩珠の例(後述)

ネタ1 2次元版七五三(ニム) 小~中くらいでやるゲーム 七五三 連続した横n本の線を消せる.交互に消して最後の一本を消した人の勝ち ネタ1  2次元版七五三(ニム) 小~中くらいでやるゲーム 七五三 連続した横n本の線を消せる.交互に消して最後の一本を消した人の勝ち 数理:各行の本数を2進数表記し,各桁の合計が偶数になるようにすればよい 

2次元への拡張 縦・横に連続したn個を消せるようにする 一気に複雑になったように見える.しらみつぶしで探索するよりないか?

もっと簡単に考えられる 例えば曲がった3個は,まっすぐの3個と同じようなもの 0にも1にも2にもできるという特徴は同じ

数理: 実は整数へのマップがある 0からn-1まで(と等価なもの)にはできるが,n(と等価なもの)にはできないものはnと等価である 数理: 実は整数へのマップがある 0からn-1まで(と等価なもの)にはできるが,n(と等価なもの)にはできないものはnと等価である n個の丸でできたブロックは必ず0からnまでのどれかになり,2進数桁和の法則が使える デモ.これは受けなかった.

ネタ2: スクラブル 配られたアルファベットを並べ替えて単語を作り,点数を競うゲーム(2~人) ネタ2: スクラブル 配られたアルファベットを並べ替えて単語を作り,点数を競うゲーム(2~人) 盤面にあるアルファベットにくっつけて,縦か横に置く(挟むような位置でもよい)

普通の人間に勝つだけなら簡単 全配置パターンについて,辞書語が作れるか検索し,最も高い点数のものを選ぶ(数秒)だけでほぼ無敵 「強さを調整する」だけなら簡単,検索を確率的にスキップしたり,辞書を間引くなど → つまらない

改善の方向 人間ぽくする 教育的にする 「母音・子音のバランスをとる」「s,xなどを出し惜しみする」「ボーナスマスを気にする」などの戦術強化 人間が注目するような場所にしか注目しない 教育的にする プレイヤの単語レベルに合わせ,少しだけ難しい単語まで使う 戦術的に重要な単語(qi, za, joなど)を少しずつ使う プレイヤの手に文句を言う

ネタ3: 崩珠(ぷよぷよ改) ぷよぷよ(商標:セガ)というテレビゲームからアクション性を取り除いてパズルとして扱いやすくしたもの ネタ3: 崩珠(ぷよぷよ改) ぷよぷよ(商標:セガ)というテレビゲームからアクション性を取り除いてパズルとして扱いやすくしたもの ルールはデモで紹介 階段連鎖(5連鎖程度)は誰でもできる 折り返し(10連鎖程度)も慣れればできる どうすれば強いコンピュータが作れるか? 人間の模倣でもいいが,もっと力ずくで・・・

発射先送りの木探索 2手または3手先で発射する中で最も効果の高いルートを選び,「1手目だけ」従う 必要になるまで発射せず,ポテンシャルの高そうな組み方を選ぶ  → 予想もしない連鎖に(デモ)

反響 「力ずくの,人間とは似ても似つかないコンピュータ」は,つまらなかったか? → そうでもない  → そうでもない 結構強い(平均10連鎖程度) 連鎖の新境地である 読みの練習になる やっぱり人間ぽい敵も欲しい もっと強い敵も欲しい Vectorに公開したり,ネット対戦版を作ったりしたが,結構好評だった

まとめ 人間相手を考えるなら,「強ければいい」ではない.単に「強さが調整できればいい」でもない 10年前に比べて速度・メモリ・HDDとも飛躍的に向上しているのに,敵アルゴリズムが飛躍的に向上している気はしない 自分もゲーム好きなので,自分がやって楽しい敵を作りたい そしてそれは学問になりうると思う いつでもなんでもご連絡ください

現状のイメージ図