論文紹介: “Joint Embedding of Words and Labels for Text Classification”

Slides:



Advertisements
Similar presentations
はじめてのパターン認識 第1章 第4グループ 平田翔暉. パターン認識 パターン認識 o 観測されたパターンを、あらかじめ定められ たクラスに分類すること クラス o 硬貨: 1 円玉、 5 円玉、 10 円玉、 50 円玉、 100 円玉、 500 円玉 o アルファベット: 26 種類 o 数字:
Advertisements

『わかりやすいパターン認 識』 第 5 章 特徴の評価とベイズ誤り確率 5.4 ベイズ誤り確率と最近傍決定則 発表日: 5 月 23 日(金) 発表者:時田 陽一.
音声翻訳における機械翻訳・音声合成の 性能評価および分析 ☆橋本佳 ,山岸順一 , William Byrne , Simon King ,徳田恵一 名工大 University of Edinburgh Cambridge University
Building text features for object image classification
整数計画法を用いたフレーズ対応最適化による翻訳システムの改良
形態素周辺確率を用いた 分かち書きの一般化とその応用
「データ学習アルゴリズム」 第3章 複雑な学習モデル 3.1 関数近似モデル ….. … 3層パーセプトロン
Bias2 - Variance - Noise 分解
雑音重み推定と音声 GMMを用いた雑音除去
TextonBoost:Joint Appearance, Shape and Context Modeling for Multi-Class Object Recognition and Segmentation 伊原有仁.
PSOLA法を用いた極低ビットレート音声符号化に関する検討
「データ学習アルゴリズム」 第2章 学習と統計的推測 報告者 佐々木 稔 2003年5月21日 2.1 データと学習
テキストの類似度計算
ランダムプロジェクションを用いた 音声特徴量変換
ベイズ基準によるHSMM音声合成の評価 ◎橋本佳,南角吉彦,徳田恵一 (名工大).
Semi-Supervised QA with Generative Domain-Adaptive Nets
顧客生涯価値 TexPoint fonts used in EMF.
自閉症スペクトラム障害児と定型発達児の識別に関する音響特徴量選択の検討
スペクトル・時系列データの前処理方法 ~平滑化 (スムージング) と微分~
大規模データによる未知語処理を統合した頑健な統計的仮名漢字変換
複数の言語情報を用いたCRFによる音声認識誤りの検出
7. 音声の認識:高度な音響モデル 7.1 実際の音響モデル 7.2 識別的学習 7.3 深層学習.
Deep Learningを用いたタンパク質のコンタクト残基予測
ベイジアンネット混合モデルによる 強化学習エージェントの方策改善
決定木とランダムフォレスト 和田 俊和.
モデルの適用範囲 モデルの適用領域 Applicability Domain (AD)
Entity-Centricな述語項構造解析・ 共参照解析の同時学習
確率的学習アルゴリズムを用いた有限状態オートマトンの抽出に関する研究
混合ガウスモデルによる回帰分析および 逆解析 Gaussian Mixture Regression GMR
人工知能特論 9.パーセプトロン 北陸先端科学技術大学院大学 鶴岡 慶雅.
利用関係に基づく類似度を用いたJavaコンポーネント分類ツールの作成
人工知能を動かしてみる(Keras を用いたニューラルネットワークの定義,コンパイル,学習,評価,予測)
第14章 モデルの結合 修士2年 山川佳洋.
確率的学習アルゴリズムを用いた有限状態オートマトンの抽出に関する研究
顧客維持に関するモデル.
音響伝達特性を用いた単一マイクロホンによる話者の頭部方向の推定
構造情報に基づく特徴量を用いた グラフマッチングによる物体識別 情報工学科 藤吉研究室  EP02086 永橋知行.
1-R-19 発話に不自由のある聴覚障害者の発話音声認識の検討
深層学習を用いた音声認識システム 工学部 電気電子工学科 白井研究室 T213069 林健吉.
情報検索技術に基づくベクトル表現と 深層学習を用いたコード片の類似性判定法
2018/9/10 ACL読み会 名古屋大学大学院 M2 佐藤・松崎研 土居裕典.
決定木 Decision Tree DT 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
Data Clustering: A Review
1-Q-9 SVMとCARTの組み合わせによる AdaBoostを用いた音声区間検出
Nightmare at Test Time: Robust Learning by Feature Deletion
Number of random matrices
第4章 識別部の設計 4-5 識別部の最適化 発表日:2003年5月16日 発表者:時田 陽一
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年6月25日 3.1 関数近似モデル
第3章 線形回帰モデル 修士1年 山田 孝太郎.
Data Clustering: A Review
クロスバリデーションを用いた ベイズ基準によるHMM音声合成
AdaBoostを用いた システムへの問い合わせと雑談の判別
ブースティングとキーワードフィルタリング によるシステム要求検出
HMM音声合成における 変分ベイズ法に基づく線形回帰
ベイズ基準による 隠れセミマルコフモデルに基づく音声合成
``Exponentiated Gradient Algorithms for Log-Linear Structured Prediction’’ A.Globerson, T.Y.Koo, X.Carreras, M.Collins を読んで 渡辺一帆(東大・新領域)
ベイズ音声合成における 事前分布とモデル構造の話者間共有
1ーQー18 音声特徴量抽出のための音素部分空間統合法の検討
パターン認識特論 ADA Boosting.
ICML読む会資料 (鹿島担当) 教師ナシ の 構造→構造 マッピング 読んだ論文: Discriminative Unsupervised Learning of Structured Predictors Linli Xu (U. Waterloo) , … , Dale Schuurmans.
パターン認識特論 ADA Boosting.
音響伝達特性を用いた単一チャネル 音源位置推定における特徴量選択の検討
Webページタイプによるクラスタ リングを用いた検索支援システム
自己縮小画像と混合ガウス分布モデルを用いた超解像
CSP係数の識別に基づく話者の 頭部方向の推定
グラフ-ベクトル変換を用いたグラフ構造表現による一般物体認識
Normalized Web Distanceを用いた音声認識の誤り訂正法 301-4in
ランダムプロジェクションを用いた音響モデルの線形変換
1-P-2 フィッシャー重みマップに基づく不特定話者音素認識の検討
混合ガウスモデル Gaussian Mixture Model GMM
Presentation transcript:

論文紹介: “Joint Embedding of Words and Labels for Text Classification” ACL読み会2018@名大 論文紹介: “Joint Embedding of Words and Labels for Text Classification” Guoyin Wang, Chunyuan Li, Wenlin Wang, Yizhe Zhang, Dinghan Shen, Xinyuan Zhang, Ricardo Henao, Lawrence Carin Duke University 紹介者: 藤岡和弥(名古屋大学・外山研究室) 2019/4/18

SWEM: 入力単語ベクトルに 対する単純な演算(平均、max等)によりテキストベクトルを構成するモデル テキスト分類 using 単語ベクトル Word2Vec SLP X: 単語列 V: 単語ベクトル列 z: テキストベクトル y: テキストのクラス確率分布 SWEM  [Shen et al., 2018] < CNN SWEM: 入力単語ベクトルに 対する単純な演算(平均、max等)によりテキストベクトルを構成するモデル クラスラベルについて説明 図は論文より引用 2019/4/18

目的 シンプルなモデル 高い分類性能 クラスラベルによるアテンション 2019/4/18

クラスラベルによるアテンション アテンション: 入力列への重み付けの一種 思想: 同じ単語でもその重要度は文脈により変化 各単語の重要度を文脈から学習 単語ごとの重み 図は論文より引用 2019/4/18

Label-Embedding Attentive Model  SLP (重みW2, バイアスb2, Softmax) 入力単語と各クラスとの適合度 全クラスの ラベルベクトル 列ベクトルの正規化 図は論文より引用 2019/4/18

βの計算 β Softmax Max-Pooling W1  SLP (重みW1, バイアスb1, ReLU) r r 2019/4/18

モデルの学習 学習パラメータ V, C, W1, b1, W2, b2 目的関数: 正則化 図は論文より引用 ラベルも正しく識別できる ように調整 単一ラベルの場合のみ ※Multi Label の場合は省略 2019/4/18

モデルの複雑性 CNN, LSTMはパラメータ数、複雑性共に高い 提案手法は低いパラメータ数と複雑性 m, h >> K SWEMと同レベル 表は論文より引用 2019/4/18

実験 実験タスク: テキストクラス分類 データセット Accuracyによって評価 (Topic) (Sentiment) (Ontology) (Topic) 2019/4/18

実験結果: Accuracy 表は論文より加工して引用 2019/4/18

その他の検証 図表は論文より引用 2019/4/18

ラベルベクトルとテキストベクトル 図は論文より引用 2019/4/18

まとめ ラベルベクトルを用いたテキスト分類を提案 小さい計算コスト・パラメータ数でSOTAを達成 ラベルベクトルの学習成功を確認 2019/4/18