6.大人数クラスの運営法 ゲーム理論 出席の取り方 まわし方(4通り) →出席表を2回まわす 1回目10:50~ 2回目11:20~

Slides:



Advertisements
Similar presentations
分散分析と誤差の制御 実験結果からできるだけ多くの情報を取り出すために 分散分析を利用する 主効果の大きさ 交互作用の大きさ 誤差の大きさ 採用した因子の効果の有無 の検定には,誤差の大きさ と比較するので誤差を小さ くできれば分散分析での検 出力が高まる どのようにしたら誤差を小さくできるか?
Advertisements

1 設計基礎コース もう一度学ぶ材料力学の基礎 座屈 ( Buckling ) 長軸に軸方向圧縮力を作用させると、ある荷 重で急に軸が曲がる。 この急に曲がる荷重条件を探る。 X の位置での曲げモーメントは たわみの微分方程式は.
2016 年度 計量経済学 講義内容 担当者: 河田 正樹
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
Probabilistic Method 7.7
新ゲーム理論 第Ⅰ部 非協力ゲームの理論 第2章 戦略形ゲームのナッシュ均衡
ゲーム理論・ゲーム理論Ⅰ(第2回) 第2章 戦略形ゲームの基礎
数当てゲーム (「誤り訂正符号」に関連した話題)
ミクロ経済学第10回 企業と費用3:費用関数.
ネットワーク理論講義補助資料 Text. 組合せ最適化とアルゴリズム 4.5 節 主・双対法 pp
第八回  シンプレックス表の経済的解釈 山梨大学.
© Yukiko Abe 2014 All rights reserved
上級価格理論II 第3回 2011年後期 中村さやか.
ゲーム理論・ゲーム理論Ⅰ (第6回) 第4章 戦略形ゲームの応用
Pattern Recognition and Machine Learning 1.5 決定理論
数楽(微分方程式を使おう!) ~第5章 ラプラス変換と総仕上げ~
土木計画学 第11回(12月21日) 土木計画と説明責任 計画における代替案の作成1 担当:榊原 弘之.
初級ミクロ経済学 -ゲーム理論入門- 2014年12月19日 古川徹也 2014/12/19.
法と経済学(file 6) ゲーム理論2 今日の講義の目的 (1)展開型ゲームという考え方を理解する (2)後方帰納法の考え方を理解する
政策決定のプロセス 政策過程論 公共選択 ゲームの理論.
「基礎OR」/「OR演習」 第3回 10/13/2009 森戸 晋.
初級ミクロ経済学 -ゲーム理論入門- 2014年12月15日 古川徹也 2014年12月15日 初級ミクロ経済学.
ランダムウォークに関するいくつかの話題 ・ランダムウォークの破産問題 ・ランダムウォークの鏡像原理 1 小暮研究会Ⅰ 11月12日
ゲーム理論・ゲーム理論Ⅰ(第3回) 第2章 戦略形ゲームの基礎
1章前半.
統計学 11/08(木) 鈴木智也.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
ストークスの定理と、 渦度・循環の関係を 直感で理解する方法
コンパイラ(9) 情報工学科5年 担当 河田 進.
計算量理論輪講 岩間研究室 照山順一.
新ゲーム理論 第Ⅰ部 非協力ゲームの理論 第1章 非協力ゲームの戦略形
パソコンでゲームの理論 第1,2章 ゼロ和2人ゲーム ゼミ合宿 東京理科大学理学部第2部数学科・統計学ゼミ
第Ⅱ部 協力ゲームの理論 第9章 シャープレイ値.
数学 ---> 抽象化、一般化 より複雑な関係ー>解析学 一次関数 y=ax+b より多くの要素ー>線形代数 x y f(x) y1 x1
第3回 確率変数の平均 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
独立成分分析 1.問題は何か:例:解法:全体の見通し 2007/10/17 名雪 勲.
第5章:特徴の評価とベイズ誤り確率 5・3:ベイズ誤り確率とは
混合ガウスモデルによる回帰分析および 逆解析 Gaussian Mixture Regression GMR
人工知能特論 9.パーセプトロン 北陸先端科学技術大学院大学 鶴岡 慶雅.
確率論の基礎 「ロジスティクス工学」 第3章 鞭効果 第4章 確率的在庫モデル 補助資料
変えるべきか ~ 確率 ~.
せん断力図(SFD)と 曲げモーメント図(BMD)
独立成分分析 5 アルゴリズムの安定性と効率 2007/10/24   名雪 勲.
Basic Tools B4  八田 直樹.
独立成分分析 (ICA:Independent Component Analysis )
証 明 本時のねらい 「仮定、結論の意味を理解し、図形の性質に基づいて、なぜそうなるのかを説明できる。」
図形の移動 穴吹中学校  磯村  淳.
変換されても変換されない頑固ベクトル どうしたら頑固になれるか 頑固なベクトルは何に使える?
第Ⅱ部 協力ゲームの理論 第16章 破産問題 2008/07/02(水) ゲーム理論合宿 M1 浦田淳司.
席替えシュミレーション.
所属集団の変更できる社会的ジレンマ実験について2
様々な情報源(4章).
中点連結定理 本時の目標 「中点連結定理を理解する。」
第Ⅱ部 協力ゲームの理論 第11章 仁(nucleolus) 2008/07/02(水) ゲーム理論合宿 M1 浦田淳司 nucleolus
確率と統計2009 第12日目(A).
ナップサック問題 クマさん人形をめぐる熱いドラマの結末.
Oligopoly Theory 5. Endogenous Timing in Mixed Oligopoly
第3章 線形回帰モデル 修士1年 山田 孝太郎.
クロス表とχ2検定.
第Ⅱ部 協力ゲームの理論 第7章 提携形ゲームと配分 2008/07/01(火) ゲーム理論合宿 M1 藤井敬士.
回帰分析(Regression Analysis)
第9章 学習アルゴリズムとベイズ決定側 〔3〕最小2乗法とベイズ決定側 発表:2003年7月4日 時田 陽一
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
2009/11/27 グラフ (1) 第9講: 平成21年11月27日 (金) 4限 E252教室 コンピュータアルゴリズム.
散らばり 本時の目標 資料の傾向をみるときは、代表値だけでなく散らばりを考える必要があることを理解する。
ここでは、歪エネルギーを考察することにより、エネルギー原理を理解する。
コストのついたグラフの探索 分枝限定法 A*アルゴリズム.
第Ⅰ部 非協力ゲームの理論 第6章 情報の価値 2008/07/01(火) ゲーム理論合宿 M2 渡辺美穂.
パターン認識特論 カーネル主成分分析 和田俊和.
アルゴリズム ~すべてのプログラムの基礎~.
Presentation transcript:

6.大人数クラスの運営法 ゲーム理論 出席の取り方 まわし方(4通り) →出席表を2回まわす 1回目10:50~ 2回目11:20~ 所要時間:40分 まわし方(4通り) T1(前,前),T2(前,後) T3(後,前),T4(後,後) 講義回数をN回とすると、N-1回以上の講義に出席すれば確実に単位を確保できる。 教授は、学生がサインをしたらすぐに教室を出て行ってしまうのを防ぐために、出席表を2回まわすことにする。 学生がa~eのどこに座ればいかに教室にいる時間を減らせるかを調べようとするもの。 前提として、学生は出席表に2回サインした後直ちに席を立つことにする。 a~eのそれぞれの位置で、何分滞在しているかを調べると・・・

滞在時間 T1 T2 T3 T4 a 35 75 45 b 55 c 50 d e T1(前,前) T2(前,後) T3(後,前) T4(後,後) T1 T2 T3 T4 b 35 55 c 50 d aとbを比較すると・・・aに座るよりbに座ったほうがどんな場合でも滞在時間が少ない dとeを比較すると・・・eに座るよりdに座ったほうがどんな場合でも滞在時間が少ない →aとeは削除できる⇒右の表 もし教授がサイコロを振って出席表の回し方を決めるとすると、T1,T2,T3,T4はそれぞれ1/4の確率で実現する。 b,dは分散100 cは分散0 →スリルを好む人:b,d 安定を好む人:c ⇒教授が、もしサイコロを使わずにゲーム理論、ここでは最も単純なゼロ和2人ゲームを取り上げるが、その前に・・・

前提 取り得る手の集合 S1=bに座る S2=cに座る S3=dに座る T1=(前,前) T2=(前,後) T3=(後,前) T4=(後,後) 学生がSj、教授がTkを 選んだときの 学生の利得(教授の損失)ajkを 学生が教室に座っていないで済む時間(分)   とする T1 T2 T3 T4 S1 55 35 S2 40 S3 講義時間は90分とする 90-滞在時間=学生が教室に座わっていないですむ時間

ゼロ和2人ゲーム 教授から学生への支払い行列は 学生の選ぶべき手(行:横を見ればよい) S2:最悪でも40の利得(40分は居なくてもよい) S1,S3:運が悪いと35しか利得が得られない(居なくてもよい時間が35分しかない) ∴S2 教授の選ぶ手(列:縦を見ればよい) T1とT3,T2とT4は全く同一であることがわかる →“2回目の出席表を前から回すか、後ろから回すか”だけが本質的 ⇒T3,T4を削除できる 教授はどちらの手を選んでも、損失55なので、どちらも差がない。仮にT1を選ぶとする。 →学生は「教授がT1を選ぶ」ことが分かると40から50に利得を増やそうとしてS1に変更する。 →教授が「学生がS1を選ぶ」ことがわかると55から35に損失を減らそうとしてT2に変更する。 →それを知った学生はS3に変更→それを知った教授はT1に変更 ⇒このようにして、堂堂巡りをしてしまう ⇒混合戦略の考え方を導入することで、均衡解が得られる

混合戦略 学生のミニマクス戦略 学生がS1,S2,S3を選ぶ確率 →それぞれχ1,χ2,χ3とする 教授が T1を選んだ時の平均的利益→z1    →それぞれχ1,χ2,χ3とする 教授が   T1を選んだ時の平均的利益→z1   T2を選んだ時の平均的利益→z2  とする 学生はz1とz2の最悪のケースを想定して   小さい方を最大にするχ1,χ2,χ3を選ぶ 混合戦略はどの戦略を確率を用いて決定する戦略のこと。 この場合は必ず均衡が存在する。 ゼロ和2人ゲーム(純粋戦略の1つ)は混合戦略の特殊なケースといえる。 混合戦略でχ=(1,0,0)のような場合が純粋戦略である 「小さい方を最大にする」→このような作戦はミニマクス戦略と呼ばれている

定式化 目的関数:z=min{z1,z2} →最大化 制約条件: χ1+χ2+χ3=1 ・・・① 目的関数:z=min{z1,z2}  →最大化 制約条件: χ1+χ2+χ3=1       ・・・①  z1=55χ1+40χ2+35χ3   ・・・②     z2=35χ1+40χ2+55χ3   ・・・③  χ1≧ 0,χ2≧ 0,χ3≧0 ①:確率は足すと1 ⇒①よりχ3=1-χ1-χ2と変形し、②,③に代入し、χ3を消去する z1=35+20χ1+5χ2,z2=55-20χ1-15χ2

変形後 目的関数:35+20χ1+5χ2 →最大化 制約条件: 2χ1+χ2=1 χ1+χ2≦1 χ1≧0,χ2≧0 目的関数:35+20χ1+5χ2 →最大化 制約条件:  2χ1+χ2=1 χ1+χ2≦1 χ1≧0,χ2≧0 ⇒χ1*=  ,χ2*=0,χ3*=  ,z*=45 暫定的にz1=z2という条件を追加 目的関数:z1 →35+20χ1+5χ2 35+20χ1+5χ2=kとするとχ2=-4χ1+1/5k-7 制約条件: z1=z2より、2χ1+χ2=1:線分PQ χ3=1-χ1-χ2≧0より、χ1+χ2≦1 χ1≧0,χ2≧0 χ1=1/2,χ3=1/2より、コインを投げて表が出ればb,裏が出ればdに座ればよいことがわかる

混合戦略 教授のマクシミン戦略 教授がT1,T2を選ぶ確率 →それぞれy1,y2とする   →それぞれy1,y2とする 学生がS1,S2,S3を選んだ時の平均損失 →それぞれw1,w2,w3とする 教授はw1,w2,w3の中で最大のものを   最小とするy1,y2を選ぶ 「最大のものを最小にする」→このような作戦をマクシミン戦略という

定式化 目的関数:w=max{w1,w2,w3} →最小化 制約条件: y1+y2=1 ・・・① w1=55y1+35y2 ・・・② 目的関数:w=max{w1,w2,w3} →最小化 制約条件:  y1+y2=1       ・・・①  w1=55y1+35y2   ・・・②  w2=40y1+40y2   ・・・③  w3=35y1+55y2   ・・・④  y1≧0,y2≧0 ⇒①よりy2=1-y1として、②~④に代入し、y2を消去すると・・・

変形後 w1=20y1+35 w2=40 w3=-20y1+55 最大値を0≦y1≦1のもとで 最小化 ⇒y1* =  ,y2* =  ,w* =45 y1≧0,y2=1-y1≧0より0≦y1≦1 y1=1/2,y2=1/2より、 2回目の際にコインを投げて、 表が出たら前から、裏が出たら後ろから配れば、平均して45の損失で済む。

均衡点 学生の平均利益 (y1 ,y2 )=(1/2,1/2) 教授の平均損失(χ1 ,χ2,χ3 ) =(1/2,0,1/2) 学生の平均利益  (y1 ,y2 )=(1/2,1/2) →45よりも増加できない 教授の平均損失(χ1 ,χ2,χ3 ) =(1/2,0,1/2) →45よりも減少できない 平均利益:χ1,χ2,χ3をどのように選んでも、45以上にはならない 平均損失:y1,y2を他の値に変更しても、45よりも減少させることはできない よってもし相手の戦略を知ったとしても、自分の戦略を変える必要が無く、解は均衡する。 ミニマクス戦略→(χ1 *,χ2 *,χ3 *)のこと マクシミン戦略→(y1 *,y2 *)のこと

均衡点 学生,教授のどちらも自分の戦略は変えない 学生のミニマクス戦略(χ1*, χ2*,χ3*) 教授のマクシミン戦略(y1*,y2*,y3*) を、出席ゲームの“均衡解”という 平均利益:χ1,χ2,χ3をどのように選んでも、45以上にはならない 平均損失:y1,y2を他の値に変更しても、45よりも減少させることはできない よってもし相手の戦略を知ったとしても、自分の戦略を変える必要が無く、解は均衡する。 ミニマクス戦略→(χ1 *,χ2 *,χ3 *)のこと マクシミン戦略→(y1 *,y2 *)のこと

一般化(ミニマクス戦略) としたとき z=min{z1,・・・,zn}を最大化する 確率ベクトル(χ1,・・・,χm)を選択                       としたとき z=min{z1,・・・,zn}を最大化する 確率ベクトル(χ1,・・・,χm)を選択 これは線形計画問題に定式化できる。1次等式・不等式の制約条件の下で1次式を最大化する線形計画問題になるので、単体法を使って解くことができる。

線形計画問題に定式化 目的関数: z →最大化 制約条件: z≦a11χ1+・・・+am1χm z≦a1nχ1+・・・+amnχm 目的関数: z →最大化 制約条件:  z≦a11χ1+・・・+am1χm  z≦a1nχ1+・・・+amnχm  χ1+・・・+χm=1  χ1≧0,・・・,χm≧0

一般化(マクシミン戦略)                    としたとき w=max{w1,・・・,wm}を最小化する 確率ベクトル(y1,・・・,yn)を選択

線形計画問題に定式化 目的関数: w →最小化 制約条件: w≧ a11y1+・・・+a1nyn w≧ am1y1+・・・+amnyn 目的関数: w →最小化 制約条件:  w≧ a11y1+・・・+a1nyn  w≧ am1y1+・・・+amnyn  y1+・・・+yn=1  y1≧ 0,・・・,yn≧ 0

ミニマクス定理 線形計画問題に変形した2つの問題の 最適解をそれぞれ (χ1*,・・・,χm*,z*),(y1*,・・・,yn*,w*) とする ⇒w* =z*  が成立  (χ1* ,・・・,χm* ),(y1* ,・・・,yn* )が          それぞれの“均衡戦略”となる これら2つの線形計画問題は双対問題である