人間の対戦相手としてのゲームアルゴリズム，話題提供

Slides:

Advertisements

Similar presentations

 C 川船美帆.  強い人工知能の作成 o 「遺伝的アルゴリズム」  「どうぶつしょうぎ」のアプリケーション作成 o スマートフォン向けアプリケーション.

Advertisements

２行＋αチョンプに関する考察京都大学 ○後藤順一伊藤大雄.

第1回確率変数、確率分布確率･統計Ⅰ ここです！確率変数と確率分布確率変数の同時分布、独立性確率変数の平均確率変数の分散

プログラマのレベルアップ.

「わかりやすいパターン認識」第１章：パターン認識とは

シミュレーション論Ⅰ 第13回意思決定とシミュレーション.

コンピュータ囲碁の仕組み～将棋との違い～

ブロック運びゲーム.

データ構造とアルゴリズム論第６章探索のアルゴリズム

エージェントモデルシミュレーション.

5．チューリングマシンと計算.

5．チューリングマシンと計算.

生物統計学・第3回全体を眺める（２）主成分分析

An Algorithm for Enumerating Maximal Matchings of a Graph

標語を作って中学生にネット・ケータイの安全利用を呼びかけよう！

人工知能第3回探索法（教科書21ページ～30ページ）

ツッパリ生徒と泣き虫先生〜伏見工業ラグビー部・日本一への挑戦〜

行動経済学による分析～なぜ人は「タダ」に翻弄されてしまうのか～古川ゼミ

ソースコード品質概論なぜソースの品質を追求するのか

A班ランダム選択に一言加えたら･･･成田幸弘橋本剛嶌村都.

第３６課頭と体を使うようにしています.

コンピュータープログラミング（C言語）（９）１．これまでの復習

モンテカルロ法と囲碁・将棋ソフトの人知超え

データ構造とアルゴリズム論第６章探索のアルゴリズム

発表者 2011/01/08 楽しい２５６バイトイントロの世界発表者 2011/01/08.

UCB+ 法を用いた Big Two AI の研究

JAVAでつくるオセロ伊東飛鳥、宮島雄一長畑弘樹、ソギ原直人.

データ構造とアルゴリズム論第７章探索のアルゴリズム

第２回　FLIP FLOP杯どうしてこの大会をひらくのか？大会の目的はなにか？.

新ゲーム理論第Ⅰ部非協力ゲームの理論第1章非協力ゲームの戦略形

シミュレーション論Ⅰ 第11回意思決定とシミュレーション.

●校内研修（自立型研修）での活用自立型研修での活用について紹介します。研修の中でも最も身近なものとして、校内研修があげられます。

定兼邦彦今井浩東京大学理学系研究科情報科学専攻

教育工学を始めよう～研究テーマの選び方から論文の書き方まで～（第１章）

ＷＥＢアプリケーションの開発２００２年度春学期大岩研究会２.

４人版リバーシYoninの解析情報論理研究室藤本侑花

BLACK JACKの作成ブラックジャックのルール概要勝敗の判定開発中の問題点 Aの扱いについて配り直し（DEAL) 工夫した点

G班メンバーリーダー橋本望 SE 北本理紗と服部友哉 PPT作成橋本望と山田侑加

意外と身近なゲーム理論へなちょこ研究室 p.

～ゲームによる暴力性と社会性の変化はあるか～

一人暮らしの男性のための料理検索システムの設計

数独の解生成と解に対する番号付け理学部　情報科学科　渡辺研究室戸神星也.

統計学の入門講義における達成動機，自己効力感，およびテスト成績の関連

AI かどうか? 木下研究室 David Chen

モンテカルロ法を用いた立体四目並べの対戦プログラム

『組織の限界』第1章個人的合理性と社会的合理性前半

麻雀ゲームにおけるAIの開発　　日高大地　　近畿大学理工学部情報学科　　

信頼の構造原謙治 2004/10/13.

★C++/オブジェクト指向実践企画★ Othelloゲーム作成

Introduction to Soft Computing

シミュレーション論 Ⅱ 第1回.

構造的類似性を持つ半構造化文書における頻度分析

データ構造とアルゴリズム論第６章探索のアルゴリズム

5．チューリングマシンと計算.

数値解析ⅡーI ~オセロゲームのプログラム~

業務５Ｓカイゼンミーティングのしかた開会宣言カイゼンネタの確認あらかじめカードを配って書いてきてもらう

プレゼンテーション-技能が必要な理由- 神奈川大学経済学部経済情報処理I 平成25年度

プレゼンテーション-技能が必要な理由- 神奈川大学経済学部経済情報処理I 平成18年度第4回

「対人援助の方法」（対人援助学）としての応用行動分析の“応用”

Ｆ班メンバー班長雨堤智宏アルゴリズム解析角田泰彬竹林秀高 ppt作成清水貴史

囲碁プログラム彩の仕組み山下宏 2008年9月4日 FIT2008.

数値解析Ⅱ ～五目並べのプログラミング～Ｃ班.

近畿大学理工学部情報学科情報論理工学研究室段野健太

第28回世界コンピュータ将棋選手権アピール文章作成：井本康宏作成日：2018/3/吉日

アルゴリズム入門 (Ver /10/07) ・フローチャートとプログラムの基本構造・リスト・合計の計算

参考：大きい要素の処理.

2010応用行動分析（3）対人援助の方法としての応用行動分析

京都大学情報学研究科通信情報システム専攻高田智史 joint work with 伊藤大雄中村義作

ペンシルパズルの大道芸ステージショーへの応用

ペンシルパズル「一本線」のヒント数の扱いに関する解析

Presentation transcript:

人間の対戦相手としてのゲームアルゴリズム，話題提供　3/3 組合せゲーム・パズル　ミニ研究集会池田心（京都大学）

自己紹介学部は数学科大学院は知能システム科学専攻現在は京大学術情報メディアセンター助教昔からゲーム好き，パズル好き，プログラム好き．囲碁五段．　　　→当然，最強の囲碁プログラムを目指すことに．

研究テーマ：エージェントと最適化エージェント：知的処理・制御・意志決定を行う主体エージェントの，（遺伝アルゴリズムの技術に基づく）構成・最適化・シミュレーション

何がしたいのか賢い/速い/強いエージェントを作る ← 昔はこれが優先された制御可能な強さのエージェントを作る賢い/速い/強いエージェントを作る　←　昔はこれが優先された制御可能な強さのエージェントを作るミクロにリアルなエージェントを作るマクロにリアルなエージェント（群）を作る人間ぽくない（リアルでない），多様なエージェントを作る教師ができるエージェントを作る【なぜ作りたいのか】創造者的な気分？そこに山があるから？そういうエージェントが作れれば，システムを理解したと思えるから？羽生に勝てれば羽生より偉いから？役に立つから？

賢い/速い/強いエージェント比較的定量化しやすい指標（複数でも）について，それが優れていれば良い目的１賢い/速い/強いエージェント比較的定量化しやすい指標（複数でも）について，それが優れていれば良い勝負としてのゲーム，インフラ制御，投資など多くの場合これが主流だった

制御可能な強さのエージェント人間の相手をするAIプレイヤは，強ければ強いほどいいわけではない目的２制御可能な強さのエージェント人間の相手をするAIプレイヤは，強ければ強いほどいいわけではない遊びとしてのゲーム（特に対等なもの），職業訓練など定説「ゲームのＡＩはアホである」麻雀ドラクエＩＶ（同期型コマンド選択戦闘ゲーム）ぷよぷよ（落ちものパズルゲーム）カルドセプト（カード・すごろくゲーム） Age of Empire （エージェントベースド戦争ゲーム）強さは一軸ではない（例えば将棋ＡＩは序盤と終盤が強い）「このAIはあまりにもアホである」「このAIはズルをしてる」「このAIは手抜きをしている」「でもいい勝負」ではダメ

ミクロにリアルなエージェント模擬したい対象（人間など）と，なんらかの意味で挙動が似ていることシミュレーション実験，ゲーム，ペット目的３ミクロにリアルなエージェント模擬したい対象（人間など）と，なんらかの意味で挙動が似ていることシミュレーション実験，ゲーム，ペットたいていは，挙動が似ているほうが親しめる高いリアルさを持つパラメータの最適化だけでなく，直接目標とする行動を入れ込める仕組みも必要リアルさのためなら，バレなければズルしてもよいかも

マクロにリアルなエージェント人工市場，交通規範，社会調査など目的４マクロにリアルなエージェント人工市場，交通規範，社会調査など着眼点：ミクロにリアルであることと，マクロにリアルであることはお互いに必要条件でも十分条件でないつまり，マクロにリアルなら，目的によってはミクロにリアルでなくてもよい出展：http://provincie.overijssel.nl/beleid//verkeer_e n_vervoer/bereikbaarheid/knelpunten_in

人間ぽくないエージェント「能力が近く（良く），挙動も似ている」ではなく，「能力は近い（良い）が，挙動は似てない」を作る目的５人間ぽくないエージェント「能力が近く（良く），挙動も似ている」ではなく，「能力は近い（良い）が，挙動は似てない」を作る戦法発見，ニッチ開拓，攻撃への予防，ロバスト性崩珠の例（後述）

ネタ１２次元版七五三（ニム）小～中くらいでやるゲーム七五三連続した横ｎ本の線を消せる．交互に消して最後の一本を消した人の勝ちネタ１　　２次元版七五三（ニム）小～中くらいでやるゲーム　七五三連続した横ｎ本の線を消せる．交互に消して最後の一本を消した人の勝ち数理：各行の本数を２進数表記し，各桁の合計が偶数になるようにすればよい　

２次元への拡張縦・横に連続したｎ個を消せるようにする一気に複雑になったように見える．しらみつぶしで探索するよりないか？

もっと簡単に考えられる例えば曲がった３個は，まっすぐの３個と同じようなもの０にも１にも２にもできるという特徴は同じ

数理：実は整数へのマップがある 0からｎ-1まで（と等価なもの）にはできるが，ｎ（と等価なもの）にはできないものはｎと等価である数理：　実は整数へのマップがある 0からｎ-1まで（と等価なもの）にはできるが，ｎ（と等価なもの）にはできないものはｎと等価であるｎ個の丸でできたブロックは必ず0からnまでのどれかになり，2進数桁和の法則が使えるデモ．これは受けなかった．

ネタ２：スクラブル配られたアルファベットを並べ替えて単語を作り，点数を競うゲーム（２～人）ネタ２：　スクラブル配られたアルファベットを並べ替えて単語を作り，点数を競うゲーム（２～人）盤面にあるアルファベットにくっつけて，縦か横に置く（挟むような位置でもよい）

普通の人間に勝つだけなら簡単全配置パターンについて，辞書語が作れるか検索し，最も高い点数のものを選ぶ（数秒）だけでほぼ無敵「強さを調整する」だけなら簡単，検索を確率的にスキップしたり，辞書を間引くなど　→　つまらない

改善の方向人間ぽくする教育的にする「母音・子音のバランスをとる」「ｓ，ｘなどを出し惜しみする」「ボーナスマスを気にする」などの戦術強化人間が注目するような場所にしか注目しない教育的にするプレイヤの単語レベルに合わせ，少しだけ難しい単語まで使う戦術的に重要な単語（qi, za, joなど）を少しずつ使うプレイヤの手に文句を言う

ネタ３：崩珠（ぷよぷよ改）ぷよぷよ（商標：セガ）というテレビゲームからアクション性を取り除いてパズルとして扱いやすくしたものネタ３：　崩珠（ぷよぷよ改）ぷよぷよ（商標：セガ）というテレビゲームからアクション性を取り除いてパズルとして扱いやすくしたものルールはデモで紹介階段連鎖（５連鎖程度）は誰でもできる折り返し（１０連鎖程度）も慣れればできるどうすれば強いコンピュータが作れるか？人間の模倣でもいいが，もっと力ずくで・・・

発射先送りの木探索２手または３手先で発射する中で最も効果の高いルートを選び，「１手目だけ」従う必要になるまで発射せず，ポテンシャルの高そうな組み方を選ぶ　→　予想もしない連鎖に（デモ）

反響「力ずくの，人間とは似ても似つかないコンピュータ」は，つまらなかったか？ → そうでもない　→　そうでもない結構強い（平均１０連鎖程度）連鎖の新境地である読みの練習になるやっぱり人間ぽい敵も欲しいもっと強い敵も欲しい Vectorに公開したり，ネット対戦版を作ったりしたが，結構好評だった

まとめ人間相手を考えるなら，「強ければいい」ではない．単に「強さが調整できればいい」でもない１０年前に比べて速度・メモリ・ＨＤＤとも飛躍的に向上しているのに，敵アルゴリズムが飛躍的に向上している気はしない自分もゲーム好きなので，自分がやって楽しい敵を作りたいそしてそれは学問になりうると思ういつでもなんでもご連絡ください

現状のイメージ図