数理手法IV 「統計的機械学習入門」 数理情報学専攻 中川裕志.

Slides:



Advertisements
Similar presentations
専門教科「情報」(2) 6/1/07. 各科目(続き) 課題研究 課題研究(1) 目標 情報に関する課題を設定し,その課題の解決 を図る学習を通して,専門的な知識と技術の 深化,総合化を図るとともに,問題解決の能 力や自発的,創造的な学習態度を育てる.
Advertisements

新設科目:応用数学 イントロダクション 情報工学科 2 年前期 専門科目 担当:准教授 青木義満.
音声翻訳における機械翻訳・音声合成の 性能評価および分析 ☆橋本佳 ,山岸順一 , William Byrne , Simon King ,徳田恵一 名工大 University of Edinburgh Cambridge University
大規模コーパスから獲得した 名詞の出現パターンを用いた 事態名詞の項構造解析
法とコンピュータ 場所 慶大法学部(三田校舎教室) 期間 2004/4/ /1/30 講師 吉野一.
経済統計学 担当者:張 南.
  個人投資家向け株式分析   と予測システム A1グループ  劉 チュン.
補章 時系列モデル入門 ー 計量経済学 ー.
環境教育用E-Learningシステム の開発 平成19年度環境教育実践専修構想発表会 環境教育実践専修 鵜川研究室 彭艶萍
研究集会 「超大規模行列の数理的諸問題とその高速解法」 2007 年 3 月 7 日 完全パイプライン化シフト QR 法による 実対称三重対角行列の 固有値並列計算 宮田 考史  山本 有作  張 紹良   名古屋大学 大学院工学研究科 計算理工学専攻.
Tokyo University of Technology Hiroyuki KAMEDA KE304 9:00~10:30
「データ学習アルゴリズム」 第3章 複雑な学習モデル 3.1 関数近似モデル ….. … 3層パーセプトロン
時空間データからのオブジェクトベース知識発見
ラーニング・ウェブ・プロジェクト(Learning Web Project) -自立・共愉的な学習ネットワークの形成に向けて-
Bias2 - Variance - Noise 分解
Bias2 - Variance - Noise 分解
状況の制約を用いることにより認識誤りを改善 同時に野球実況中継の構造化
「データ学習アルゴリズム」 第2章 学習と統計的推測 報告者 佐々木 稔 2003年5月21日 2.1 データと学習
クラスター変分法と確率的情報処理 --Belief Propagation と画像処理アルゴリズム--
確率モデルによる 画像処理技術入門 --- ベイズ統計と確率的画像処理 ---
固有空間における コンピュータシステムの障害検知
ベイズ基準によるHSMM音声合成の評価 ◎橋本佳,南角吉彦,徳田恵一 (名工大).
法とコンピュータ 場所 慶大法学部(三田校舎教室) 期間 2005/4/ /1/30 講師 吉野一.
【小暮研究会2】 「ベイズのアルゴリズム」:序章 【1,2:計量経済分析と統計分析】 【 3:ベイズ定理】
1DS04169K 太田睦美 1DS04185K 高田将平 1DS04206E 森根光春
補章 時系列モデル入門 ー 計量経済学 ー.
人工知能特論2007 東京工科大学 亀田弘之.
パターン認識とニューラルネットワーク 栗田多喜夫 2018/11/8 早稲田大学大学院理工学研究科講義.
サポートベクターマシン によるパターン認識
協調機械システム論 ( ,本郷) 協調機械システム論 東京大学 人工物工学研究センター 淺間 一.
大規模データによる未知語処理を統合した頑健な統計的仮名漢字変換
ベイジアンネット混合モデルによる 強化学習エージェントの方策改善
人工知能特論2009 東京工科大学 亀田弘之 KE304.
米山研究室紹介 -システム制御工学研究室-
モデルの逆解析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
第11回 継続的監査.
只見町 インターネット・エコミュージアムの「キーワード」検索の改善
深層学習を用いた音声認識システム 工学部 電気電子工学科 白井研究室 T213069 林健吉.
数量分析 第2回 データ解析技法とソフトウェア
3. 論理ゲート の 実現 五島 正裕.
2009年12月4日 ○ 前田康成(北見工業大学) 吉田秀樹(北見工業大学) 鈴木正清(北見工業大学) 松嶋敏泰(早稲田大学)
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
Webコミュニティ概念を用いた Webマイニングについての研究 A study on Web Mining Based on Web Communities 清水 洋志.
(1)序論 人工知能とは 歴史 方法論 人工知能の基礎 問題解決 探索 推論 知識.
知能情報システム特論 Introduction
早稲田大学大学院 基幹理工学研究科 情報理工学専攻 後藤研究室 修士1年 魏 元
シミュレーション論Ⅰ 第14回 シミュレーションの分析と検討.
シミュレーション論 Ⅱ 第1回.
クロスバリデーションを用いた ベイズ基準によるHMM音声合成
「ICAによる顔画像特徴量抽出とSVMを用いた表情認識」
過学習を考慮した IS1-60 AAMパラメータの選択と回帰分析による 顔・視線方向同時推定 顔・視線同時推定 研究背景
ヒューマン・インターフェースとしてのGIS —空間データ変換から地図表現へ—
HMM音声合成における 変分ベイズ法に基づく線形回帰
構造的類似性を持つ半構造化文書における頻度分析
科学研究費補助金 特定領域研究 確率的情報処理への 統計力学的アプローチ 平成14年度研究成果発表会
ベイズ音声合成における 事前分布とモデル構造の話者間共有
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
ポッツスピン型隠れ変数による画像領域分割
香川大学工学部 富永浩之 知識工学1 第1-1章 人工知能と知識工学 香川大学工学部 富永浩之
1ーQー18 音声特徴量抽出のための音素部分空間統合法の検討
ベイジアンネットワーク概説 第3章 ベイジアンネットワークモデルの 数学的基礎 3.1 ベイジアンネットワークモデルの概要
領域ベースの隠れ変数を用いた決定論的画像領域分割
確率的フィルタリングを用いた アンサンブル学習の統計力学 三好 誠司 岡田 真人 神 戸 高 専 東 大, 理 研
知識ベースの試作計画 ●●●研究所 ●●●技術部 稲本□□ 1997年1月.
確率的フィルタリングを用いた アンサンブル学習の統計力学 三好 誠司 岡田 真人 神 戸 高 専 東 大, 理 研
グラフ-ベクトル変換を用いたグラフ構造表現による一般物体認識
アップデート.
分子生物情報学(0) バイオインフォマティクス
北大MMCセミナー 第100回 附属社会創造数学センター主催 Date: 2019年7月11日(木) 16:30~18:00
Presentation transcript:

数理手法IV 「統計的機械学習入門」 数理情報学専攻 中川裕志

機械学習小史:計算機以前 井筒俊彦「イスラーム思想史」 アベロエスが有名 人間の知能に関する研究は言語を媒体とし、言語を分析することによって古代から進んできた。 ソクラテスの以降の言語名称目録説(モノが始めにあって、それに名前を付けるという考え) アリストテレスの論理学 アンダルシアの西方イスラムを経てパリに伝わる 近世、計算を知能と考え始めた。 ライプニッツ etc etc 論理至上主義 ヴィトゲンシュタイン ソシュールの革命 言語名称目録説から脱却し、言語を閉じたシステムとして、その構造を分析する方向を示した。(現代のテキスト処理の基礎)

機械学習小史:計算機以後 計算機の発明:1940年代 人工知能の開花 計算の道具(弾道計算に使った) 言語を分析する道具:1950年代には既に文書要約のアルゴリズムが研究されていた。 人工知能の開花 数値を計算するマシンから記号計算をするマシンへ 人工知能は人間を模倣する方向で研究された。 言語処理、パタン認識、記号処理 こういった背景の下に人間が知能や知識を獲得していく過程である学習を計算機で実現しようとした 機械学習

機械学習小史:1980年代以前 与えられたアルゴリズムを変換して効率の良いアルゴリズムを導出 溜め込んだ事実の集合から機能的推論で知識を獲得 人工知能の時代の機械学習 与えられたアルゴリズムを変換して効率の良いアルゴリズムを導出 効率の悪いプログラムを一定の方法でプログラム変換するソフト技術として定着 溜め込んだ事実の集合から機能的推論で知識を獲得 死ぬ(ソクラテス) & 人間(ソクラテス) &   死ぬ(アリストテレス) & 人間(アリストテレス) 死ぬ(X) & 人間(X) つまり、同じ属性を持つ定数を変数化して一般的知識とする。なんだか学習した気がしない! 少数のタネ知識を組み合わせて知識ベースを自動構築 数学の知識体系を人工知能で再構築しようという試み Automatic Mathematician などというシステムが作られたが、実用的な結果には至らず。 ユーザとのインタラクションで言語能力を計算機が獲得しようとする試み

機械学習小史:前世紀終盤 人工知能の時代の機械学習 全て失敗した 当時(1970年代から80年代)の弱体な計算機では無理 そもそも方法論的に間違った目標設定? 計算機能力の飛躍的向上 90年代の計算機能力の向上:ディスク容量、CPU性能、インターネット、対象となるデータ量の増大と多様化がある種の臨界点に達した 人工知能の時代とは違った機械学習の出現 いわゆるデータマイニングとして注目を集めた。 スーパーの売り上げデータから、赤ちゃん用の粉ミルクを買う客は同時にスポーツ紙を買うという傾向を発見し、商品の並べ方を工夫 Amazon などで、ある本を買おうとすると、「この本を買った方は、こういう本も買っています」などとrecommendしてくる

機械学習小史:今世紀 大規模かつ多様なデータから、新規のデータの性質や振る舞いを予測する統計モデルを機械学習 大規模データの処理統計学の利用:統計的機械学習 大規模なデータの背後にある数理的構造の認識と利用 P)背後に潜む数理的構造を事前知識として利用しない手はない。 A)取得したデータと事前知識を統合してより確かな数理モデルへ:事後知識 P)+A)を可能にする数理モデルベイズ統計 ベイズ統計に基づく機械学習の応用 パタン認識(画像認識、音声認識) 文書分類 スパムメールフィルタ、フィッシング対策ソフト ユーザの行動に適応して進化するモデル インターネットのrecommendation データマイニング 構造をもつデータベースからの知識マイニング テキストマイニング 半構造データからの知識獲得、評判分析

機械学習小史:近未来 実際の対象は、大規模データ、ストリームデータ 教師データ作成の手間が膨大。 しかも、教師データはタスク依存的 環境問題、省エネ+問題の大規模化 大容量メモリで長時間の機械学習を行う場合は、消費エネルギーが大きい。 それでも、実用規模に十分なスケールでの学習は困難 従来のバッチ学習は全データをメモリに乗せて繰り返し計算で学習した  省エネ、実用性の点で苦しくなってきた しかも、改善幅は1%とか0.1%.... 実際の対象は、大規模データ、ストリームデータ 小さなメモリで学習  オンライン学習  バッチ学習と同程度の精度を目指す ストリームデータ(時系列)をone-pathで処理(小さなメモリ) ストリームマイニング 教師データ作成の手間が膨大。   しかも、教師データはタスク依存的 教師ではない大量の生データも利用  半教師あり学習

授業の内容 導入 数学のおさらい Bayes推論 線形回帰と識別 学習データと性能予測 カーネル法とサポートベクターマシン 最適化と学習アルゴリズム オンライン学習 クラスタリング モデル推定 マルコフ連鎖モンテカルロ法