SlothLib.LinearAlgebra.FeatureVector 特徴ベクトル. SlothLib.LinearAlgebra.FeatureVector でできること ► 特徴ベクトル  次元は可変に増やすことができる  次元としてあらゆるデータ型が利用可能 ► string 型がよく使われる=文書の特徴ベクトル.

Slides:



Advertisements
Similar presentations
ゲームプログラミング講習 第2章 関数の使い方
Advertisements

公共財 公共経済論 II no.3 麻生良文.
VTX alignment D2 浅野秀光 2011年12月15日  放射線研ミーティング.

認知症を理解し 環境の重要性について考える
フッ化ナトリウムによる洗口 2010・9・13 宮崎市郡東諸県郡薬剤師会 学校薬剤師  日高 華代子.
平成26年8月27日(水) 大阪府 健康医療部 薬務課 医療機器グループ
平成26年度 呼吸器学会からの提案結果 (オレンジ色の部分が承認された提案) 新規提案 既収載の変更 免疫組織化学染色、免疫細胞化学染色
自動吸引は 在宅を変えるか 大分協和病院 院長         山本 真.
2010度 民事訴訟法講義 補論 関西大学法学部教授 栗田 隆.
腫瘍学概論 埼玉医科大学国際医療センター 包括的がんセンター 緩和医療科/緩和ケアチーム 奈良林 至
“企業リスクへの考え方に変化を求められています。 トータルなリスクマネジメント・サービスをプロデュースします。“
情報漏えい 経済情報学科 E  西村 諭 E  釣 洋平.
浜中 健児 昭和42年3月27日生まれ 東京都在住 株式会社ピー・アール・エフ 代表取締役 (学歴) 高 校:千葉県立東葛飾高校 卒業
COPYRIGHT(C) 2011 KYUSHU UNIVERSITY. ALL RIGHTS RESERVED
記入例 JAWS DAYS 2015 – JOB BOARD 会社名 採用職種 営業職/技術職/その他( ) 仕事内容 待遇 募集数
g741001 長谷川 嵩 g740796 迫村 光秋 g741000 西田 健太郎 g741147 小井出 真聡
自然独占 公共経済論 II no.5 麻生良文.
Autonomic Resource Provisioning for Cloud-Based Software
ハイブリッドクラウドを実現させるポイントと SCSKのOSSへの取組み
寺尾 敦 青山学院大学社会情報学部 第12回 情報デザイン(4) 情報の構造化と表現 寺尾 敦 青山学院大学社会情報学部
公益社団法人日本青年会議所 関東地区埼玉ブロック協議会 JCの情熱(おもい)育成委員会 2011年度第1回全体委員会
次世代大学教育研究会のこれまでの活動 2005年度次世代大学教育研究大会 明治大学駿河台校舎リバティタワー9階1096教室
子どもの本の情報 大阪府内の協力書店の情報 こちらをクリック 大阪府内の公立図書館・図書室の情報
広東省民弁本科高校日語専業骨幹教師研修会 ①日本語の格助詞の使い分け ②動詞の自他受身の選択について   -日本語教育と中日カルチャーショックの観点から- 名古屋大学 杉村 泰.
『ワタシが!!』『地域の仲間で!!』 市民が始める自然エネルギー!!
ポイントカードの未来形を形にした「MUJI Passport」
コンピュータの構造2 (OSとアプリケーション)
エックス線の発見(1895) 3日後、妻をつかまえて 第一回ノーベル物理学賞 100日後! 既に京都(島津製作所)でも 光と影.
ニュージーランドの人気チョコレート「ウィッタカー」 とても可愛らしいクリスマスパッケージングがおすすめ!
移動体通信の経済分析 ミクロ事例研究2015 通信班 石崎亜由美、萩原慎.
熱・仕事・温度の関係 熱を仕事に変換する エネルギーの変換と保存 第17講 熱力学の第一法則 教科書P.142~145
教育意識と社会階層 ESSM2013データを用いた潜在クラス多項ロジットモデル
クロマグロ漁獲規制による消費者余剰の変化
数論システムNZMATHに於ける素因数分解法MPQSの性能評価
精度、再現率 順位付き評価 学習と評価 評価者の一致性の評価
これまでのあらすじ chapter 1: 情報を測る エントロピー,情報量,情報源の性質 chapter 2: 情報をコンパクトに表現する
第11回演習課題の解説.
早稲田大学大学院 国際情報通信研究科 修士2年 樋口 太祐 佐藤研究室(旧富永研究室)
Shibata lab. TAMORI Midori
講義の計画と進め方 章タイトル 授業概要 事業内容と ディスカッションポイント テキストの図表一覧 学習目標
第8章 参考資料 赤外線天文衛星の概観 Overview of Infrared Astronomical Satellites
Graham Neubig 奈良先端科学技術大学院大学(NAIST) 2013年1月17日
Yuuki Fujii 16M00650 Shibata Lab. May 18th ,2016 e+ e−
ハッシュ関数を用いた安全なnチャネルメッセージ伝送
第4章補足 分散分析法入門 統計学 2013年度.
プログラミング演習3 李 亜民クラス 第4回 シェーディング.
第4章 波としての光(1) 基礎 13T5041H 髙木 治也.
2015年春学期 「企業のしくみ」 第11回 損益分岐点分析
生物統計学・第7回 全体を眺める(4) 主成分分析-2 (各種グラフの描き方と解釈)
CsI結晶シンチレータを用いた コンプトンカメラγI(ガンマアイ)の開発
自然言語処理プログラミング勉強会1 - 1-gram言語モデル
前回の演習問題の答え 問題1(章末問題30) 次のデータは1972年春刊行の医学雑誌New England Journal of Medicineで,数人の医師が報告した論文から引用したものである.   この研究は,55人の非喫煙者,31人のパイプまたは葉巻きの常用者,および401人の紙巻きタバコの常用者のそれぞれにつて,各人の肺気腫の程度を調べたもので,被験者はすべて60歳未満の人々である.60歳以上の喫煙者は別の研究で取り上げられた.
九州大学 理学部 物理学科 情報理学コース 久保 浩平 2013年1月26日 13:00~14:00
ブラックホールによる光子の 軌道角運動量の生成2
前回の(後半の)ポイント
講義の進め方 板書とPower Pointの二本立て P.P.主に教科書の図や式、定義などの表示に使用する
本日の内容(10/16~) 前回の続き: ファイル形式(WAV, SMF) 音の基本事項 音律・音階 物理的な性質、生理・心理的な性質
物質移流スキームにおいて 使用される 格子点データの内挿法
回帰分析 重回帰(3).
データモデリング 推薦のための集合知プログラミング.
情報爆発A01支援班 マイサーチエンジン開発環境支援グループ 中村聡史, 大島裕明, 田中克己, 喜連川優
テキストの類似度計算
湘南工科大学 2013年12月10日 プログラミング基礎1 湘南工科大学情報工学科 准教授 小林 学.
情報工学Ⅱ (第9回) 月曜4限 担当:北川 晃.
定兼邦彦 今井浩 東京大学理学系研究科 情報科学専攻
構造的類似性を持つ半構造化文書における頻度分析
アルゴリズムとプログラミング (Algorithms and Programming)
情報工学Ⅱ (第8回) 月曜4限 担当:北川 晃.
計算機プログラミングI 第5回 2002年11月7日(木) 配列: 沢山のデータをまとめたデータ どんなものか どうやって使うのか
Presentation transcript:

SlothLib.LinearAlgebra.FeatureVector 特徴ベクトル

SlothLib.LinearAlgebra.FeatureVector でできること ► 特徴ベクトル  次元は可変に増やすことができる  次元としてあらゆるデータ型が利用可能 ► string 型がよく使われる=文書の特徴ベクトル ► 特徴ベクトルの作成  配列を与えて出現回数を数える ► 特徴ベクトルの計算  特徴ベクトルの足し算、掛け算、 log の計算など  コサイン類似度、ユークリッド距離計算など

特徴ベクトルのインターフェー ス ► IVector ► IVector  全ての特徴ベクトルクラスのインタフェース ► IVector ► IVector  次元が文字列の特徴ベクトル  double this[string key] ► 次元 key のベクトルの重み  string[] GetSortedKeyList() ► 重みが大きい順にソートされた次元の配列を取得

BasicVector クラス ► 基本となる特徴ベクトルのクラス ► 0 ベクトルを作るコンストラクタ  IVector v = new BasicVector (); ► ある次元に値を設定  v[ “ 京都大学 ” ] = 5.0; ► ある次元の値を取得  double val = v[ “ 京都大学 ” ]; ► ベクトルのコピーを行うコンストラクタ  IVector v2 = new BasicVector (v);

FrequencyVector クラス ► BasicVector を継承するクラス ► コンストラクタで配列を受け取り出現回数を数え る  string[] array = { “ 京都 ”, “ 京都 ”, “ 東京 ”, “ 大阪 ” };  IVector v = new FrequencyVector (array); ► 「京都」は配列に 2 度出現  Console.Write(v[ “ 京都 ” ].ToString()); // 2 と表示 ► 「神戸」は配列に 2 度出現  Console.Write(v[ “ 神戸 ” ].ToString()); // 0 と表示

ベクトルの計算 ► 足し算 : AddVector クラス  IVector va = new AddVector (v1, v2);  IVector vb = new AddVector (v1, v2, v3); ► 掛け算 : MultiplyVector クラス  IVector vc = new MultiplyVector (v1, v2);  IVector vd = new MultiplyVector (5, v2, v3); ► 対数 : LogVector クラス  IVector ve = new LogVector (v1);

ベクトルの正規化 ► 長さを 1 : CosNormVector クラス  IVector vf = new CosNormVector (v1); ► 最大の重みを 1 : MaxNormVector クラス  IVector vg = new MaxNormVector (v1); ► 重みの合計を 1 : SumNormVector クラ ス  IVector vh = new SumNormVector (v1); ► 最大の重みを 1 、最小の重みを 0.5 : AugNormVector クラス  IVector vi = new AugNormVector (v1);

DocumentFrequencyVector<T> ► 要するに文書頻度 (DF) を求める  IDocumentFrequencyVector インターフェース ► VectorCount プロパティ : もとのベクトル数 ► IDF ベクトルの作成法  IDocumentFrequencyVector df = new DocumentFrequencyVector (vecList);  IVector idf = new InverseDFVector(df); ► TF-IDF ベクトルの作成  IVector tfidf = new MultiplyVector(tf, idf);

距離や類似度 ► VectorOperator クラス  各種計算用のクラス ► GetEuclideanDistance : ユークリッド距離 ► GetCosine : コサイン類似度 ► その他  p- ノルム、 Max ノルム  内積、マンハッタン距離、 Jaccard 係数、 Dice 係数、  ベクトルの和、ベクトルの差  負  ベクトルの整数倍