博士たちの愛する確率 徳山 豪 東北大学 Probability that professors love

Slides:



Advertisements
Similar presentations
効率的に計算可能な 加法的誤りの訂正可能性 安永 憲司 九州先端科学技術研究所 SITA 2012 @ 別府湾ロイヤルホテル
Advertisements

G 問題 コードアート オンライン 原案:西出 ライタ:伊藤 テスタ:西出. 問題概要 0 大きさのさまざまな n 個の円に多角形 m 個を入れら れるか判定する問題 0 ただし、同じ円に複数の多角形を入れることはでき ない 0 もし、入れられる場合は、辞書順最小の入れ方を出 力 ① ② ③ ① ②.
データベース. レシートを見てみよう コンビニやスーパーで買物をするときの レシートを見てみよう – 何がかいてあるだろうか? – レジで全部打ち込んでいる? – なぜ、打ち込まないのにレシートには商品名 や価格が出てくるの?
数理統計学(第ニ回) 期待値と分散 浜田知久馬 数理統計学第2回.
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
『基礎理論』 (C)Copyright, Toshiomi KOBAYASHI,
シミュレーション論Ⅰ 第6回 待ち行列のシミュレーション.
データ構造と アルゴリズム 第十二回 知能情報学部 知能情報学科 新田直也.
豊中高校土曜講座「数学セミナー2003」 プラトン多面体の数学 なぜ正多面体は5種類しかないのか 大阪府立豊中高等学校 深川 久.
アルゴリズムイントロダクション第2章 主にソートに関して
統計解析 第7回 第6章 離散確率分布.
黒澤 馨 (茨城大学) 情報セキュリティ特論(4) 黒澤 馨 (茨城大学) 2017/3/4 confidential.
近似アルゴリズム 第10章 終了時刻最小化スケジューリング
第11回 整列 ~ シェルソート,クイックソート ~
データ構造とアルゴリズム論 第5章 整列(ソート)のアルゴリズム
独自ルールを用いた “ハノイの塔”の拡張 立命館高校 3年9組 馬部 由美絵.
統計学  第7回 西 山.
統計学 11/13(月) 担当:鈴木智也.
黒澤 馨 (茨城大学) 情報セキュリティ特論(6) 黒澤 馨 (茨城大学) 2017/3/13 confidential.
アルゴリズムイントロダクション第5章( ) 確率論的解析
Reed-Solomon 符号と擬似ランダム性
Object Group ANalizer Graduate School of Information Science and Technology, Osaka University OGAN visualizes representative interactions between a pair.
A班 ランダム選択に一言加えたら・・・ 成田幸弘 橋本剛 嶌村都.
 Combinations(2)        古川 勇輔.
統計学 11/19(月) 担当:鈴木智也.
アルゴリズムとデータ構造 補足資料7-3 「単純選択ソートselsort.c」
データベース.
統計解析 第10回 12章 標本抽出、13章 標本分布.
計算量理論輪講 岩間研究室 照山順一.
第11回 整列 ~ シェルソート,クイックソート ~
理論試験速報 理論問題部会長 鈴木 亨 先生 (筑波大学附属高等学校) にインタビュー.
データからいろんなことを学ぼう! このスライドでは、順に、こんなことを説明します。 「データ」って、どんなもの? 「データ」を集めてみよう
博士たちの愛する幾何 徳山 豪 東北大学 Geometry that professors love
博士たちの愛する素数 徳山 豪 東北大学 Prime numbers that professors love
思考力・表現力を高める 学習の流れ 本時のねらい 「数学的活動を通して思考力・表現力を高める」 ↓
数学のかたち 暗号を作ろう Masashi Sanae.
独立成分分析 1.問題は何か:例:解法:全体の見通し 2007/10/17 名雪 勲.
確率・統計Ⅰ 第3回 確率変数の独立性 / 確率変数の平均 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
佐藤のゲーム とその仲間たち (完全可解ゲームの話) 関西学院大学  川中 宣明 数理科学研究センター談話会    2011年6月29日.
情報セキュリティ  第11回 デジタル署名.
人工知能特論 9.パーセプトロン 北陸先端科学技術大学院大学 鶴岡 慶雅.
モデルの逆解析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
超感覚的知覚の一つである テレパシー能力(者)の存在性 についての統計学的検証
7.4 Two General Settings D3 杉原堅也.
5.RSA暗号 素因数分解の困難性を利用した暗号.
東北大学大学院情報科学研究科 教授 西関 隆夫
インタラクティブ・ゲーム制作 プログラミングコース 補足資料
アルゴリズムとプログラミング (Algorithms and Programming)
第Ⅱ部 協力ゲームの理論 第16章 破産問題 2008/07/02(水) ゲーム理論合宿 M1 浦田淳司.
Q q 情報セキュリティ 第6回:2007年5月25日(金) q q.
情報とコンピュータ 静岡大学工学部 安藤和敏
データ構造とアルゴリズム論 第5章 整列(ソート)のアルゴリズム
モンテカルロ法を用いた 立体四目並べの対戦プログラム
生物情報ソフトウェア特論 (2)たたみ込みとハッシュに 基づくマッチング
「情報セキュリティ論」 2-4 公開鍵暗号の原理とRSA暗号
数値解析   大富豪 佐藤玲子 堀智恵実 高山明秀 西田直毅 春田常典.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
代数体上で定義された楕円曲線の 素因数分解への応用
Diffie-Hellman 鍵共有 ElGamal 暗号 楕円曲線暗号,量子コンピュータ
本当は消去できていない!? ~データを完全消去する方法~
本当は消去できていない!? ~データを完全消去する方法~
博士たちの愛する円周率 徳山 豪 東北大学 “PI” that professors love
情報工学概論 (アルゴリズムとデータ構造)
アルゴリズム入門 (Ver /10/07) ・フローチャートとプログラムの基本構造 ・リスト ・合計の計算
コストのついたグラフの探索 分枝限定法 A*アルゴリズム.
博士たちの愛する組合せ論 徳山 豪 東北大学 Combinatorics that professors love
Q q 情報セキュリティ 第6回:2005年5月26日(金) q q.
Q q 情報セキュリティ 第8回:2004年5月28日(金) の補足 q q.
情報生命科学特別講義III (3)たたみ込みとハッシュに 基づくマッチング
Q q 情報セキュリティ 第7回:2005年5月27日(金) q q.
Presentation transcript:

博士たちの愛する確率 徳山 豪 東北大学 Probability that professors love Mathematics that the professor loved 徳山 豪 東北大学 Probability that professors love 博士たちの愛する確率

内容 数学の定理の面白さと証明アイデアの紹介 組み合わせ数学と確率 カードのシャッフル ランダムネスの利用と、その難しさ カードのシャッフル   何回カードを『切れば』ランダムに混ざるか?  いろいろな確率の考え方  順列とその上の確率空間  確率状態の「距離」   挿入シャッフルの解析  リッフルシャッフルの解析 ランダムネスの利用と、その難しさ

確率論と組合せ 日本シリーズ(7回戦、先に4勝した方が勝ち) で、第7戦を仙台に誘致するとしよう。 誘致コスト(たとえゲームがなくても)が5百万円、開催したときの利益が二千万円だとする。  あなたは誘致しますか? (いろいろな落とし穴がある問題) 注意: 統計と確率は違う

組合せ数学 (Combinatorics): データの分割と組み立ての数学 1 1, 1 1, 2, 1 1, 3, 3, 1 1, 4, 6, 4, 1 1, 5, 10, 10, 5, 1 1, 6, 15, 20, 15, 6, 1 Pascal’s triangle 6C2 = 15 = (6×5)÷2 6人の生徒から2人を選ぶ組合せ数は15通り 6枚のカードを2枚と4枚に分ける方法は15通り ゲームやギャンブル(ブリッジ、マージャン,バカラ、クラップスなど)、 情報処理に必須

1 1, 1 1, 2, 1 1, 3, 3, 1 1, 4, 6, 4, 1 1, 5, 10, 10, 5, 1 1, 6, 15, 20, 15, 6, 1 綺麗だと思いません? パスカルとフェルマのギャンブルに関する文通 算法統宗(16世紀の中国の本) どこでも見出せる恋人  数学、化学、物理、哲学、情報、経済学、建築学… 高校で習う確率 = 場合の数 = 組合せ数 でも、ちょっと数が大きいと、組合せ数は莫大になる。 だから、もう少し賢い確率論を考えよう

バースデートリック 確率と期待値の両方でアタックしてみよう クラスにn人の生徒が居る。 全員が違う誕生日である確率はどのくらいだろうか? クラスにn人の生徒が居る。 全員が違う誕生日である確率はどのくらいだろうか? 30人のクラスだと、同じ誕生日が居る確率はどのくらい? 確率と期待値の両方でアタックしてみよう

2つの有名な確率論の道具 クーポンコレクタ定理 n枚のポケモンカードがある。 チョコレートを買うとどれか1枚のカードが(等確率で)はいっている。 全部のカードを揃えるのに、何個のチョコレートを買えばいいだろうか?

カードのシャッフル トランプゲームでは52枚のカードを使います。 「シャッフル」するので、いつでもカードは十分良く混ざっていると仮定しています 本当でしょうか? 何回シャッフルすれば十分にランダムに混ざるでしょうか?

「定式化」:現実問題を数学にする道 カードの並び全体を数学的に捉えよう シャッフルとは数学的に何か 『よく混ざる』とは数学的に何か 数学的に解析できるような簡単なモデルを作る それと現実のモデルの比較を行う 『よく混ざる』とは数学的に何か データを順番に並べかえる(ソーティング)は情報科学では定番の概念  混ぜる方が並べかえるのより易しそうに見えるが、『よく混ぜる』のはそんなに易しくない 『よく混ぜる』ことは、統計やアルゴリズムでは必須の技術

シャッフルとは順列を変更する基本操作 ゲームや手品でよくやるシャッフル 数学的には順列の置換操作  カットシャッフル: トランプのデックを二分して、上下を入れ替える  中抜きシャッフル: デックの中央部を適当に抜いて、上部に移動する  リッフルシャッフル: デックを上下に分け、両手で持って、ぱらぱらと交互に混ぜる。  素人リッフルとプロフェッショナルリッフル トップインシャッフル: 一番上の札を、好きな場所に入れる 数学的には順列の置換操作

4 1 5 2 6 3 7 4 8 5 6 1 7 2 8 3 カットシャッフル

1 4 2 5 3 1 4 2 5 3 6 6 7 7 8 8 中抜きシャッフル

1 2 2 3 3 1 4 4 5 5 6 6 7 7 8 8 トップインシャッフル

カードの並びと置換 1からnまでの数を並べた、長さnの順列 総数はnの階乗。超巨大な数。 Ω: 長さnの順列全体の集合  j をσjに移す  順列に置換を施す: σ(π)  順列の σj 番目の要素を j 番目に移す   (2,3,4,1,5,6,7)はどんな置換?

シャッフルの条件 無限にシャッフルすると、全ての順列が生成される 無限にシャッフルすると、順列の分布が「収束する」 シャッフルの条件  無限にシャッフルすると、全ての順列が生成される 無限にシャッフルすると、順列の分布が「収束する」  一様分布: 全ての順列が等確率で生成される 確率論の言葉では「エルゴード性」と呼ぶ  少ない回数で、一様に近い分布になる

中抜きシャッフル 中抜きシャッフルの解析はなかなか面倒 中抜きシャッフルの逆操作  上から何枚かのところで2つに分け、上半分をカードデックにまとめて差し込む 「何枚か」を『1枚』に限定すると、トップインシャッフルになる トップインシャッフルを解析してみよう

トップインランダムシャッフル カードデッキの一番上のカードを取り、ランダムな位置に入れる (2,3,4,…, 1, …,n-2,n-1,n) という形の置換 何回シャッフルすれば『十分ランダムに混ざる』 だろうか? 第i 番目

1 2 2 3 3 1 4 4 5 5 6 6 7 7 8 8 トップインシャッフル

2つの確率分布の距離 『一様に近い』とは何か? 確率分布に距離を入れよう (確率空間の考え方)  『一様に近い』とは何か? 確率分布に距離を入れよう (確率空間の考え方) 一様分布 U: 全ての順列πが、確率1/n! で出現する分布 二つの分布Q1とQ2の『距離』 分布Q1で順列πが出現する確率

分布の混ざり方と、距離 一様分布 U: 全ての順列πが、確率1/n! で出現する分布 分布の「混ざり方」の尺度

完全に一様になる瞬間の判定 全てのカードが表向きだとしよう トップインランダムシャッフルをしていて、ある時点で、『完全に混ざった』と判定できる瞬間がある それはどのような瞬間か? そのような瞬間は(期待値として)何回目のシャッフルで起きるだろうか クーポンコレクタ問題を用いて解析しよう

カジノオーナーの停止ルール 全てのカードが『見える』とすると、 最初に一番下にあったカードが一番上に来て、それがランダムな位置に入れられた瞬間に『ストップ』と叫ぼう カードは完全にランダムにシャッフルされている それはなぜか? ストップと叫ぶまでのシャッフル回数は、クーポンコレクタ問題の答えと同じである。それはなぜか?

トップインシャッフルの回数 完全にランダムになるまでのシャッフルの期待値はn H(n) H(n): 調和数、大体ln n n ln n + cn 回のシャッフルでストップが掛からない確率はe-c 未満 同じ回数での分布Qと一様分布Uに対して  ||Q- U|| < e –c

リッフルシャッフル リッフルシャッフルで、2組に分けた後での混ぜ合わせがランダムになると仮定しよう 何回リッフルシャッフルすればよいか? 5回では駄目 (52枚のカードの場合) 8回やれば大体大丈夫 なぜでしょう? 『ストップ』を叫ぶための条件はなんでしょうか? リッフルシャッフルの逆操作を考えるのがミソ

1 1 4 2 5 3 2 4 5 6 6 3 7 7 8 8 ランダムリッフルシャッフル

1 1 2 4 3 6 4 2 3 5 5 6 7 7 8 8 逆リッフルシャッフル

1 1(0) 2 4(0) 3 6(0) 4 2(1) 3(1) 5 5(1) 6 7(1) 7 8(1) 8 逆リッフルシャッフルでの履歴ビット

1(00) 1(0) 1 4(00) 4(0) 2 2(10) 6(0) 3 8(10) 2(1) 4 6(01) 3(1) 5 3(11) 5(1) 6 5(11) 7(1) 7 7(11) 8(1) 8 逆リッフルシャッフルでの履歴ビット

4(000) 1(00) 1(0) 1 2(001) 4(00) 4(0) 2 5(011) 2(01) 6(0) 3 1(100) 8(01) 2(1) 4 8(101) 6(10) 3(1) 5 6(110) 3(11) 5(1) 6 3(111) 5(11) 7(1) 7 7(111) 7(11) 8(1) 8 履歴ビットが全部異なったらSTOP

リッフルシャッフルの解析原理 ストップが掛かったら完全にランダムにシャッフルされている ストップが掛かる時間の解析:  バースデートリックと類似  なぜでしょうか?

乱数とアルゴリズム 素敵な発明をした。これから開発を行う 発明の内容: 1000ビットのデータ = x 発明の秘密登録はどうすればよいか?  発明をしたことを登録したい  発明の内容は秘密にしたい  発明していたことを証明できるようにしたい 発明の内容: 1000ビットのデータ = x 発明の秘密登録はどうすればよいか? 

離散対数を用いた暗号 xより大きい素数pを選ぶ p未満の数gを取る (原始根条件あり) gのx乗をpで割った剰余をyとする。 (p, g, y) を公開する。  x を知っていることを証明することは簡単  公開データからxを計算するのは難しい

離散対数とバースデートリック (p, g, y) からxを計算しよう gz をz=1,2,..,p-1まで計算すればいい  もっといい方法はないか?

素数生成と乱数 素数pの生成 素数の判定は? 適当な数を取り、素数かどうか判定する 素数分布定理から、1%程度の確率で素数にあたる  素数の判定は?  フェルマテスト  p が素数なら、すべての数a < p について ap-1 –1 はpで割り切れる 普通の数だと、確率1/2以下でしか成り立たない  素数とカーマイケル数  ラビンテスト: 素数のみを選び出す

素数判定アルゴリズム ランダムにa<p を100個選ぶ。 ラビンテストをおのおののaで行う すべてのa でパスすれば、素数 乱数を使わないと  一般化リーマン予想を仮定すると、小さいほうから桁数(今の場合100個)選べばOK  仮定しないアルゴリズム: 2003年に発明