 C10-025 川船 美帆.  強い人工知能の作成 o 「遺伝的アルゴリズム」  「どうぶつしょうぎ」のアプリケーショ ン作成 o スマートフォン向けアプリケーション.

Slides:



Advertisements
Similar presentations
コンピュータ囲碁における Root 並列化について 発表者 副島 佑介. 目次 研究背景 – 囲碁の難しさ – モンテカルロ木探索について – 並列化手法の先行研究 提案手法 – Root 並列化における合議制 実験結果 まとめ.
Advertisements

三木 光範 (同志社大学工学部) 廣安 知之 (同志社大学工学部) 花田 良子 (同志社大学工学部学部 生) 水田 伯典 (同志社大学大学院) ジョブショップスケジューリング問 題への 分散遺伝的アルゴリズムの適用 Distributed Genetic Algorithm for Job-shop.
2行+αチョンプに関する考察 京都大学 ○後藤順一 伊藤大雄.
3次元nクイーン問題の 解に関する研究 論理工学研究室 伊藤精一
人工知能概論 第4回 探索(3) ゲームの理論.
Problem H: Queen’s case
ML 演習 第 8 回 2007/07/17 飯塚 大輔, 後藤 哲志, 前田 俊行
シミュレーション論Ⅰ 第13回 意思決定とシミュレーション.
近畿大学理工学部情報学科 情報論理工学研究室 滝口 直
コンピュータ囲碁の仕組み ~ 将棋との違い ~
遺伝的アルゴリズム  新川 大貴.
対話型遺伝的アルゴリズムを用いた室内レイアウトシステムの開発
四路の碁アプリ開発 情報論理工学研究所 高倉秀斗.
PCクラスタにおける2個体分散遺伝的アルゴリズムの高速化
将棋プログラム「激指」  鶴岡 慶雅.
リバーシの並列化 並列化するときに起こる問題を定義しろ おぷてぃまいざー SSAIとMSAIは比較しろ  前田昂寛.
Lispとは ゲーム理論 minimaxアルゴリズム αβアルゴリズム ソースコードの一部
人 工 知 能 第3回 探索法 (教科書21ページ~30ページ)
インタラクティブ・ゲーム制作 <プログラミングコース>
遺伝アルゴリズムによる NQueen解法 ~遺伝補修飾を用いた解探索の性能評価~
ゲームプレイング (Game Playing)
ゲームプレイング (Game Playing)
モンテカルロ法によるミニ囲碁 増井拓視 情報理論工学研究所.
コンピュータ将棋におけるカーネル法を用いた静的評価関数の学習
ゲームプレイング (Game Playing)
クロスワードゲームの 作り方を学ぼう/やってみよう ‐ボードゲームの動作機構‐
モンテカルロ法と囲碁・将棋ソフトの人知超え
単位 おねだり ☆オセロ おねだり隊☆D班.
碁石ゲームに関する考察 4目並べ講座 パターン生成ゲームの楽しみ 徳山 豪 (東北大学) .
近畿大学理工学部情報学科 情報論理研究室 井藤 雄太
モンテカルロ碁 電気通信大学 村松研究室 下川和也.
UCB+ 法を用いた Big Two AI の研究
JAVAでつくるオセロ 伊東飛鳥、宮島雄一 長畑弘樹、ソギ原直人.
情報論理工学 研究室 第6回: リバーシの合法手生成.
シャノンのスイッチングゲームにおけるペアリング戦略の複雑さについて
MPIを用いた並列処理 ~GAによるTSPの解法~
Bridge It と Connections の 必勝法について
情報論理工学 研究室 第10回 完全解析されたゲーム.
リーダー 亀山奈央 プレゼンター 橘貴志 アルゴリズム 古森愛美 プログラマー 中島宏基 パワーポイント 公文ゆい
強化学習を用いたバックギャモンプレイヤーの生成 TD-Gammon
4人版リバーシYoninの解析 情報論理研究室 藤本 侑花
遺伝的アルゴリズムを用いた 構造物の最適形状探索の プログラムの作成
G班メンバー リーダー 橋本望 SE 北本理紗と服部友哉 PPT作成 橋本望と山田侑加
Bridge It と Connections の 必勝法について
三次元チェスアプリケーションの開発 およびUIの機能向上
近畿大学理工学部情報学科 情報論理研究室 松浦 美里
近畿大学理工学部情報学科 情報論理工学研究室 赤井 隆純
JavaScript プログラミング演習 - じゃんけんゲーム - 「ホームページを動的に制御したい…」
モンテカルロ法を用いた 立体四目並べの対戦プログラム
情報論理工学 研究室 第7回: 強い手の選択.
研究背景と目的 局面対による学習の高速化 学習器の説明 今後 大規模な強化学習技術の実証と応用 一方で、 強化学習手法の台頭
麻雀ゲームにおけるAIの開発    日高大地   近畿大学理工学部情報学科  
遺伝アルゴリズムによる NQueen解法 ~問題特性に着目した突然変異方法の改善~
近畿大学 理工学部 情報学科 情報論理工学部研究室 潘小月
数値解析ⅡーI ~オセロゲームのプログラム~
指導教員 石水 隆 講師 情報論理工学研究室 木ノ下 翔大
飛び駒を考慮した逆算法に基づく詰将棋問題の列挙
リバーシ 06a1056 藤田将義.
飛び駒を考慮した逆算法に基づく詰将棋問題の列挙
F班 メンバー 班長 雨堤 智宏 アルゴリズム解析 角田 泰彬 竹林 秀高 ppt作成 清水 貴史
囲碁プログラム 彩の仕組み 山下 宏 2008年9月4日 FIT2008.
表紙 分散遺伝的アルゴリズムのための 新しい交叉法.
数値解析Ⅱ ~五目並べのプログラミング~ C班.
近畿大学理工学部情報学科 情報論理工学研究室 段野健太
第28回世界コンピュータ将棋選手権アピール文章 作成:井本 康宏 作成日:2018/3/吉日
Othello G班         山崎 木下 山本 上手      .
情報論理工学 研究室 第8回: ミニマックス法.
人工知能概論 第4回 探索(3) ゲームの理論.
各種荷重を受ける 中空押出形成材の構造最適化
京都大学 情報学研究科 通信情報システム専攻 高田智史 joint work with 伊藤大雄 中村義作
Presentation transcript:

 C 川船 美帆

 強い人工知能の作成 o 「遺伝的アルゴリズム」  「どうぶつしょうぎ」のアプリケーショ ン作成 o スマートフォン向けアプリケーション

 3×4 の計 12 マスの盤面  駒は 5 種類 o 「ひよこ」「にわとり」 o 「きりん」「ぞう」「ら いおん」  「キャッチ」もしくは「ト ライ」したら勝ち o キャッチ 相手のライオンの駒を取る o トライ 相手の陣の 1 番奥まで自分のラ イオンを進める

ボードゲームにおける人工知能のアルゴリズムで 主だったものは、  Min-Max 法 o 想定される被害が最小になるような手を打つ o しらみつぶしに探索を行う  Alpha-Beta 法 o Min-max 法を応用したアルゴリズム o 読む必要の無い手は探索を行わない  今回は計算量が少ないので 「 Min-Max 法」を選択

自分の手番の場合は評価が最大の手、 相手の手番の場合には評価が最小の手 を選んでいく方法 相手からの被害を最小にしながら、 良い手を指すことが出来る

現在の局面 自分の指し手 相手の指し手 相手の手番 自分の 手番 図 1 2 手先読みの場合のゲーム木( Min-Max 法) 1. 2 手先の局面を考え、そ の局面を評価関数によっ て評価する 2. 2 手目の評価値で 1 番値の 小さいものを 1 手目の評 価値とする 3. 1 手目の評価値の中で 1 番 値の大きなものを次の手 として選択する

 ゲームの局面の状態をある一定の基準に沿って 評価し、局面の優劣を値として出す  将棋 (もしくはどうぶつしょうぎ) だと o 駒得 駒それぞれに点数をつけて評価値を計算 o 利きの数 自分の駒と相手の駒、それぞれの利きの数を数え、それを評 価値にする o 王手と王手逃れ 王手になる手は良い手と評価し、逆に王手される手は悪手と して評価する

 3 種類の評価関数を作成 o ① 駒得 o ② 駒得 + 利き o ③ 駒得 + 利き + 王手( 200 点) + トライ( 300 点)  それぞれ 100 回ずつ対戦  「駒得 VS 駒得」の結果 o 先手 : 36 % o 後手 : 49 % o 引き分け : 15 %

第一世代の作成 適応度の評価 選択 交叉 突然変異 終了条件の判定 評価関数値が異なる人工知能を 5 つ作成 人工知能同士で対戦させた後、 順位を決める 1 位と 2 位の人工知能を選択 選択した人工知能同士を交叉させる 評価関数値を 3 %の割合で変化させる 過去 100 世代の評価関数値の 標準偏差が 30 以下であれば値を固定

 1100 世代で全ての値が収束  学習させる前の人工知能と 300 戦対戦 o 先手 : 勝率 28 % (引き分け 17 %) o 後手 : 勝率 56 % (引き分け 12 %) 後手側の勝率が上がった  学習させる前の人工知能同士での結 果 o 先手 : 36 % o 後手 : 49 % o 引き分け : 15 %

 遺伝的アルゴリズムを使い、 人工知能を自己対戦で学習させた結果、 後手側のときは強くなった  学習させた人工知能を搭載した スマートフォンアプリケーションを作成した

 ゲームの状態を簡易的に 表したもの  将棋やチェスなどで 用いられる  枝:指し手  節点:ゲームの盤面

 2 D ゲームフレームワーク  オープンソース( MIT ) o MIT ライセンス:非常に制限の緩いライセンス  使用できる言語: Javascript , Lua , C++  マルチプラットフォーム開発対応 o Android , iOS , Windows,Mac,Linux など 画像出典: x.org/wiki/About_Us

1. 現在の局面から着手可能な手を全て挙げる 2. 着手可能な手を指した場合の局面を評価関数で 評価する 3. 評価値が最大になる場合の手を次の手として選 択する

 開発言語: C++