情報学習理論 最後までご聴講いただきありがとうございました。 渡辺澄夫 東京工業大学.

Slides:



Advertisements
Similar presentations
生物統計学・第 5 回 比べる準備をする 標準偏差、標準誤差、標準化 2013 年 11 月 7 日 生命環境科学域 応用生命科学 類 尾形 善之.
Advertisements

統計解析第 11 回 第 15 章 有意性検定. 今日学ぶこと 仮説の設定 – 帰無仮説、対立仮説 検定 – 棄却域、有意水準 – 片側検定、両側検定 過誤 – 第 1 種の過誤、第 2 種の過誤、検出力.
関西学院大学オープンセミナー 2010年6月12日.  決定論的現象 天体の運動のように未来が現在により決 まっている現象  偶然的現象 偶然的な要素が加わり、未来の予測が不可 能な現象 気象、地震、災害、事故、宝くじ 株価、寿命、 … … … … … … … ….
計量的手法入門 人材開発コース・ワークショップ (IV) 2000 年 6 月 29 日、 7 月 6 ・ 13 日 奥西 好夫
2006 年度 統計学講義内容 担当者 河田正樹
2016 年度 計量経済学 講義内容 担当者: 河田 正樹
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
第11章 プレゼンテーションの基本スキル 1 プレゼンテーションとは 2 プレゼンテーションの種類と特徴 3 プレゼンテーションツール
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
近似アルゴリズム 第10章 終了時刻最小化スケジューリング
確率・統計Ⅰ 第11回 i.i.d.の和と大数の法則 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
実証分析の手順 経済データ解析 2011年度.
Pattern Recognition and Machine Learning 1.5 決定理論
京進ランゲージアカデミー京都駅前校 イルワン・エフェンディ・ラウディン 上級クラス
日本語統語論:構造構築と意味 No.1 統語論とは
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
「データ学習アルゴリズム」 第3章 複雑な学習モデル 3.1 関数近似モデル ….. … 3層パーセプトロン
私たちはどうして虐待をしてしまうのか? 誰もが利用者の生活が豊かになることや社会参加を願って福祉の仕事に就いていると 思います。初めから虐待しようなんて思って仕事に就いている人はいないはずです。 ○愛情というエネルギーはとても大きい →自分の思うようにいかないと怒りになります。 ○自己欲・支配欲のエネルギーはとても大きい.
研修1 組織の規範について 東京コンサル株式会社 担当:事変.
イントロダクション.
新しい環境行動のスタイル 環境市民「グリーンコンシューマーガイド」から
データ構造と アルゴリズム 第二回 知能情報学部 新田直也.
統計リテラシー教育における 携帯端末の利用
「データ学習アルゴリズム」 第2章 学習と統計的推測 報告者 佐々木 稔 2003年5月21日 2.1 データと学習
数理論理学 第1回 茨城大学工学部情報工学科 佐々木 稔.
二項分布 大きさ の標本で,事象Eの起こる確率を とするとき, そのうち 個にEが起こる確率 は二項分布に従う 例
メディア学部 2011年9月29日(木) 担当教員:亀田弘之
統計リテラシー育成のための数学の指導方法に関する実践的研究
~私たちはことばを使って何をしているか~ 学びLIVE2006/6/18 東洋大学 三宅和子
編入学体験談 5M02 上田誠也.
社会統計学Ic・統計科学I 第六回 ~仮説検証~
理論試験速報 理論問題部会長 鈴木 亨 先生 (筑波大学附属高等学校) にインタビュー.
シミュレーション論 Ⅱ 第15回 まとめ.
データからいろんなことを学ぼう! このスライドでは、順に、こんなことを説明します。 「データ」って、どんなもの? 「データ」を集めてみよう
情報通信システム(13) plala. or 情報通信システム(13) 年7月24日 火曜日  午後4時10分~5時40分 NTT-TX Corp. 加藤 洋一.
情報の信頼性・信憑性 震災の情報から考える
ニューラルネットは、いつ、なぜ、どのようにして役立つか?
Statistical Physics and Singularity Theory
教師なしデータ 学習データ  X1, X2, …, Xn   真の情報源 テストデータ  X  .
P3-12 教師が真の教師のまわりをまわる場合のオンライン学習 三好 誠司(P)(神戸高専) 岡田 真人(東大,理研,さきがけ)
あらまし アンサンブル学習の大きな特徴として,多数決などで生徒を組み合わせることにより,単一の生徒では表現できない入出力関係を実現できることがあげられる.その意味で,教師が生徒のモデル空間内にない場合のアンサンブル学習の解析は非常に興味深い.そこで本研究では,教師がコミティマシンであり生徒が単純パーセプトロンである場合のアンサンブル学習を統計力学的なオンライン学習の枠組みで議論する.メトロポリス法により汎化誤差を計算した結果,ヘブ学習ではすべての生徒は教師中間層の中央に漸近すること,パーセプトロン学習では
執筆者:伊東 昌子 授業者:寺尾 敦 atsushi [at] si.aoyama.ac.jp
訓練データとテストデータが 異なる分布に従う場合の学習
初回授業オリエンテーション 理科(生物) 大野 智久.
(昨年度のオープンコースウェア) 10/17 組み合わせと確率 10/24 確率変数と確率分布 10/31 代表的な確率分布
第4回目「これからの生涯学習推進の方向を探る」
統計学の入門講義における 達成動機,自己効力感,およびテスト成績の関連
社会の情報化と人間 京都教育大学 理科領域専攻 3回生   林 絵莉香.
確率と統計2009 第12日目(A).
コンピュータにログイン 第1章 コンピュータにログイン 啓林館 情報A最新版 (p.6-13)
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
生物情報ソフトウェア特論 (2)たたみ込みとハッシュに 基づくマッチング
第4章 識別部の設計 4-5 識別部の最適化 発表日:2003年5月16日 発表者:時田 陽一
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
シミュレーション論 Ⅱ 第1回.
第5回 確率変数の共分散 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
第9章 学習アルゴリズムとベイズ決定側 〔3〕最小2乗法とベイズ決定側 発表:2003年7月4日 時田 陽一
構造的類似性を持つ半構造化文書における頻度分析
人工知能特論II 第8回 二宮 崇.
ガウス分布における ベーテ近似の理論解析 東京工業大学総合理工学研究科 知能システム科学専攻 渡辺研究室    西山 悠, 渡辺澄夫.
情報の授業 アプリ等を活用した勉強方法の改善(計画) ・R-PDCAサイクル ・アプリを活用した勉強方法の改善 計画書
栗原正純 UEC Tokyo 電気通信大学 情報通信工学科 2007/5/2(修正2008/08/21)
第13回(通算29回) 福祉対象者への相談援助 合意形成
  情報に関する技術       情報モラル授業   .
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年8月1日 3.2 競合学習
確率的フィルタリングを用いた アンサンブル学習の統計力学 三好 誠司 岡田 真人 神 戸 高 専 東 大, 理 研
確率的フィルタリングを用いた アンサンブル学習の統計力学 三好 誠司 岡田 真人 神 戸 高 専 東 大, 理 研
2008年度 情報数理 ~ 授業紹介 ~.
2012年度 情報数理 ~ 授業紹介 ~.
Presentation transcript:

情報学習理論 最後までご聴講いただきありがとうございました。 渡辺澄夫 東京工業大学

Mathematical Learning Theory 学習とは 講義・第1回目のあるページ。 概念とは? 概念1 概念2 … 概念3 学習モデル 世界には例があふれている。例から世界の構造を知る。 2017/3/16 Mathematical Learning Theory

競合学習 自己組織化 ボルツマンマシン 教師なし学習 深層学習 ニューラルネットワーク 教師あり学習 サポートベクタマシン

Birational probability theory 最後の問題 それで、学習の結果は正しいのか?  真の情報源がわからないから学習を行う。  ⇒ 真の情報源が不明だから     学習モデルが正しいかどうかわからない。  ⇒ 学習の結果を信じていいのかわからない ⇒ 最初に戻る 統計学: 謎の螺旋 「分からぬことこそ統計学の真実」 なのか? 3/16/2017 Birational probability theory

Mathematical Learning Theory 真の分布が明確な場合もある 背後にある自然法則が確実にわかっている場合には 学習モデルを定めることができる。 (例)コインを振る問題(表=1、裏=0)を考える場合         p(x|a) = ax(1-a)1-x (例)半減期 log 2/l の一個の原子が時刻 t に崩壊する確率          p(t|l) =le-lt モデルが正しいと考えられる場合には、統計的推測の 誤差はデータ揺らぎ(バリアンス)だけになる。 2017/3/16 Mathematical Learning Theory

Mathematical Learning Theory 真の分布が明確でないことは多い 法則が明確でない問題では、学習モデルは仮のものである。 (例)1000人の(算数・国語・理科・社会・英語)の テスト結果から成績の分布を推測する。 (例)手書き数字を認識するソフトウエアを作る。 (例)テレビCMの売り上げへの影響を調べる。 (例)人工知能をつくる。 データ科学では、学習モデルは仮のものであることの方が多い。 仮のモデルを使って得られた結論は「正しい」のだろうか? 2017/3/16 Mathematical Learning Theory

Mathematical Learning Theory 初めての人が陥りやすい誤りかた (1) 1.正しい推論は、真の命題を確率1でつなぐ場合だけに得られる。 2.絶対に正しい学習モデルが分かるまでは何もできない。 3.絶対に正しい学習モデルは決してわからないのだから、    統計的学習はすべて嘘である。 (注意)学習は、絶対に正しいものだけを積み上げる方法ではありません。 (注意)世の中には嘘モデルを使って人をだます人もあるので慎重に      なるのはわかります。また「検定すれば必ず正しい結論が得られる」      というわけではありません。 2017/3/16 Mathematical Learning Theory

Mathematical Learning Theory 初めての人が陥りやすい誤りかた (2) 1.絶対に正しい学習モデルがわかることはないのだから   統計的学習は、それぞれ好みで決めてよい。 2.統計的学習は、ひとごとに違っていてよい。   それが個性というものだからすばらしい。 3.人はみな世界でひとつだけの統計的学習を持っている。 (注意) 統計的学習は、科学あるいは技術であり       人生観ではありません。 (注意) 結果が絶対に正しくはないからと言って       誤ることを個性だと考えるのは・・・ですね。 2017/3/16 Mathematical Learning Theory

Mathematical Learning Theory 統計学は・・・ ○ データからわかることは「絶対に正しいこと」ではない。 ○ データから何もわからないということはない。 ○ 「絶対に正しいこと」がわからないからといって、    個人の好みで結論を選んでよいということではない。 ひとは、知らないことに対しては<0か1か>のような極端な意見に陥りやすい ので注意しましょう。「統計学こそ大正義」、「統計は全て嘘だらけ」などの本は 昔からたくさんあります。(←統計学者は、そういう主張はしません。) 深層学習とデータサイエンスの発達は、これからの経済社会、芸術文化、私たちの 日々の暮らしに大きな影響を与えるようになるでしょう。統計学と学習理論についての 正しい理解は、その世界を生きていくあなたの支えのひとつになると思います。 → 平凡であるけれど、「何がどこまでわかるのか」を  知っておくのも悪くないかな(学習理論への出発)。 2017/3/16 Mathematical Learning Theory

Mathematical Learning Theory 学習理論で何がわかるか(予測編) 学習理論は 予測を 当てることが 責務である。 2017/3/16 Mathematical Learning Theory

Mathematical Learning Theory 学習理論で何がわかるか(予測編) 真の分布 データ 各点の適切さ 学習モデルの集合 2017/3/16 Mathematical Learning Theory

Mathematical Learning Theory 学習理論で何がわかるか(予測編) 不明な真の分布 学習の結果 学習アルゴ    リズム 各点の 適切さ 学習モデルの集合 2017/3/16 Mathematical Learning Theory

Mathematical Learning Theory 学習理論で何がわかるか(予測編) 不明な真の分布 真の分布が不明でも 汎化誤差が従う 数学的法則が導出 できるので 推測することができる。 汎化 誤差 学習の結果 学習モデルの集合 2017/3/16 Mathematical Learning Theory

Mathematical Learning Theory 学習理論で何がわかるか(予測編) 真の分布が不明でも 異なるモデルの 汎化誤差の 大小を比較する ことができる。 → 予測が正確な モデルを選べる。 不明な真の分布 汎化 誤差2 汎化 誤差1 学習の結果1 学習の結果2 学習モデル1 学習モデル2 2017/3/16 Mathematical Learning Theory

Mathematical Learning Theory 学習理論で何がわかるか(確率編) 学習理論は 真の構造を 見つけることが 責務である。 2017/3/16 Mathematical Learning Theory

Mathematical Learning Theory 学習理論で何がわかるか(確率編) データ 学習モデルが与えられたとき 「そのモデルからデータが  発生する確率」を計算できる 学習モデルの集合 2017/3/16 Mathematical Learning Theory

Mathematical Learning Theory 学習理論で何がわかるか(確率編) それぞれのモデルからデータが 発生された確率を比較して、 確率の大きいほうを選ぶ。    → 真の分布を実現できる    モデルがあるときは、その    中で一番小さいモデルが    選ばれる。 データ 学習モデル1 学習モデル2 2017/3/16 Mathematical Learning Theory

Mathematical Learning Theory 学習理論で何がわかるか(確率編) データ 学習モデルが与えられた とき、「そのモデルから データが発生する確率」は 学習モデルの集合上の積分 になるので計算は一般に 困難(統計力学における 分配関数と数学的に同値)。 学習モデルに応じて適切な 計算法が必要になる。 統計力学や純粋数学が 役立つときがある。 学習モデルの集合 2017/3/16 Mathematical Learning Theory

Mathematical Learning Theory 学習理論への出発 「予測精度の解明」および「構造の発見」は学習理論において 中心的に重要な課題であり、上記のことについては    数式を用いた定義    定理の記述    定理の証明 を行うことができます。将来、必要になったら勉強してみてください。 2017/3/16 Mathematical Learning Theory

Mathematical Learning Theory 「小鳥が歌う」と「春が来る」 2017/3/16 Mathematical Learning Theory

例 log(1+医療福祉で働く人の数) log(1+製造業で働く人の数) 政府統計の総合窓口(e-Stat)のデータを使わせて頂きました。 http://www.estat.go.jp/SG1/estat/eStatTopPortal.do 経済センサス-町丁・大字別集計・神奈川県横浜市の一部分 「○町○丁目」で働く人の数を調べたもの。 log(1+医療福祉で働く人の数) 2017/3/16 log(1+製造業で働く人の数)

Mathematical Learning Theory 例 X から Y を多項式回帰したら、多項式の次数によって 結果がまったく異なることが分かった。 log(1+医療福祉で働く人の数) 1次 2次 0次 2017/3/16 Mathematical Learning Theory log(1+製造業で働く人の数)

Mathematical Learning Theory 問1 横浜市で「○町○丁目」で働く人の数を調査した。 X = log(1+製造業で働く人の数) Y = log(1+医療福祉で働く人の数) において、多項式を用いて二乗誤差を最小にするように 学習すると、その結果は用いたモデルによって変化する。 0次: X は Y に影響しない。 1次: X が大きいほど Y は大きい。 2次-4次: X がある値より大きいと Y は減少する。 5次以上: Y はいったん減少したあと、また上昇する。 モデルが違うと結論が違うから「何もわからない」のだろうか。 予測精度および確率の観点から、この問題について論ぜよ。 2017/3/16 Mathematical Learning Theory

Mathematical Learning Theory いつかまた  数学と 出会ってね 最後まで 学んでくれて ありがとう 実社会で 役立つかな 2017/3/16 Mathematical Learning Theory

Mathematical Learning Theory 学習理論と社会 学習理論は、もともと人工知能を作るため、すなわち音声・画像の認識や 自然言語・時系列の理解に用いることを目的として研究されてきました。 今日では、膨大データ、巨大ネットワーク、深い学習モデルが実現され、 社会経済、自然科学、芸術文化のありかたを変革し始めています。 学習理論は科学あるいは技術なので、みんなの幸せに役立つかどうかは、 使い方しだいです。 今度こそ人類は、科学あるいは技術を、賢く正しく使って欲しいと思います。 皆さんの時代です。 2017/3/16 Mathematical Learning Theory

Mathematical Learning Theory 問2 次の中で30年後にそうなっていると思うものに○、そうでないものに×をつけましょう。 1.自動英会話できるスマホがあるので、TOEICを受けなくて良い。 2.就職活動は、深層学習が代行してくれる。 3.あなたの脳波と遺伝子からあなただけの修士論文が自動生成。 4.映画も流行歌もお笑い番組も、コンピュータが作っている。 5.人間にできる仕事が少なくなり、失業者があふれて社会危機。 6.会社は社長ひとり。データ分析してAIに指示するだけ。 7.人口減少から抜け出すための深層学習の政策が実行されている。 8.西森先生の量子コンピュータが実現され「パスワード」はもうない。 9.全ての人の全ての行動が記録されている。 10.学問がなくなっている。 2017/3/16 Mathematical Learning Theory