論文紹介: “Joint Embedding of Words and Labels for Text Classification”

Slides:

Advertisements

Similar presentations

はじめてのパターン認識第１章第４グループ平田翔暉. パターン認識パターン認識 o 観測されたパターンを、あらかじめ定められたクラスに分類することクラス o 硬貨： 1 円玉、 5 円玉、 10 円玉、 50 円玉、 100 円玉、 500 円玉 o アルファベット： 26 種類 o 数字：

Advertisements

『わかりやすいパターン認識』第 5 章特徴の評価とベイズ誤り確率 5.4 ベイズ誤り確率と最近傍決定則発表日： 5 月 23 日（金）発表者：時田陽一.

音声翻訳における機械翻訳・音声合成の性能評価および分析 ☆橋本佳，山岸順一， William Byrne ， Simon King ，徳田恵一名工大 University of Edinburgh Cambridge University

Building text features for object image classification

整数計画法を用いたフレーズ対応最適化による翻訳システムの改良

形態素周辺確率を用いた分かち書きの一般化とその応用

「データ学習アルゴリズム」第３章複雑な学習モデル 3.1 関数近似モデル ….. … ３層パーセプトロン

Bias2 - Variance - Noise 分解

雑音重み推定と音声ＧＭＭを用いた雑音除去

TextonBoost:Joint Appearance, Shape and Context Modeling for Multi-Class Object Recognition and Segmentation 伊原有仁.

PSOLA法を用いた極低ビットレート音声符号化に関する検討

「データ学習アルゴリズム」第2章学習と統計的推測報告者佐々木稔 2003年5月21日 2.1 データと学習

テキストの類似度計算

ランダムプロジェクションを用いた音声特徴量変換

ベイズ基準によるHSMM音声合成の評価 ◎橋本佳，南角吉彦，徳田恵一（名工大）.

Semi-Supervised QA with Generative Domain-Adaptive Nets

顧客生涯価値 TexPoint fonts used in EMF.

自閉症スペクトラム障害児と定型発達児の識別に関する音響特徴量選択の検討

スペクトル・時系列データの前処理方法～平滑化 (スムージング) と微分～

大規模データによる未知語処理を統合した頑健な統計的仮名漢字変換

複数の言語情報を用いたCRFによる音声認識誤りの検出

7. 音声の認識：高度な音響モデル 7.1 実際の音響モデル 7.2 識別的学習 7.3 深層学習.

Deep Learningを用いたタンパク質のコンタクト残基予測

ベイジアンネット混合モデルによる強化学習エージェントの方策改善

決定木とランダムフォレスト和田　俊和.

モデルの適用範囲モデルの適用領域 Applicability Domain (AD)

Entity-Centricな述語項構造解析・共参照解析の同時学習

確率的学習アルゴリズムを用いた有限状態オートマトンの抽出に関する研究

混合ガウスモデルによる回帰分析および逆解析 Gaussian Mixture Regression GMR

人工知能特論９．パーセプトロン北陸先端科学技術大学院大学　鶴岡慶雅.

利用関係に基づく類似度を用いたJavaコンポーネント分類ツールの作成

人工知能を動かしてみる（Keras を用いたニューラルネットワークの定義，コンパイル，学習，評価，予測）

第14章　モデルの結合修士２年山川佳洋.

確率的学習アルゴリズムを用いた有限状態オートマトンの抽出に関する研究

顧客維持に関するモデル.

音響伝達特性を用いた単一マイクロホンによる話者の頭部方向の推定

構造情報に基づく特徴量を用いたグラフマッチングによる物体識別情報工学科藤吉研究室　EP02086　永橋知行.

1-R-19 発話に不自由のある聴覚障害者の発話音声認識の検討

深層学習を用いた音声認識システム工学部　電気電子工学科　白井研究室 T213069　林健吉.

情報検索技術に基づくベクトル表現と深層学習を用いたコード片の類似性判定法

2018/9/10 ACL読み会名古屋大学大学院　M２佐藤・松崎研土居裕典.

決定木 Decision Tree DT 明治大学理工学部応用化学科データ化学工学研究室金子弘昌.

Data Clustering: A Review

1-Q-9 SVMとCARTの組み合わせによる AdaBoostを用いた音声区間検出

Nightmare at Test Time: Robust Learning by Feature Deletion

Number of random matrices

第4章識別部の設計 4－5 識別部の最適化発表日：2003年5月16日発表者：時田陽一

「データ学習アルゴリズム」第3章複雑な学習モデル報告者佐々木稔 2003年6月25日 3.1 関数近似モデル

第3章　線形回帰モデル修士1年山田　孝太郎.

Data Clustering: A Review

クロスバリデーションを用いたベイズ基準によるHMM音声合成

AdaBoostを用いたシステムへの問い合わせと雑談の判別

ブースティングとキーワードフィルタリングによるシステム要求検出

HMM音声合成における変分ベイズ法に基づく線形回帰

ベイズ基準による隠れセミマルコフモデルに基づく音声合成

``Exponentiated Gradient Algorithms for Log-Linear Structured Prediction’’ A.Globerson, T.Y.Koo, X.Carreras, M.Collins を読んで渡辺一帆（東大・新領域）

ベイズ音声合成における事前分布とモデル構造の話者間共有

１ーQー１８音声特徴量抽出のための音素部分空間統合法の検討

パターン認識特論 ADA Boosting.

ICML読む会資料（鹿島担当）教師ナシの構造→構造マッピング読んだ論文： Discriminative Unsupervised Learning of Structured Predictors Linli Xu (U. Waterloo) , … , Dale Schuurmans.

パターン認識特論 ADA Boosting.

音響伝達特性を用いた単一チャネル音源位置推定における特徴量選択の検討

Webページタイプによるクラスタリングを用いた検索支援システム

自己縮小画像と混合ガウス分布モデルを用いた超解像

CSP係数の識別に基づく話者の頭部方向の推定

グラフ-ベクトル変換を用いたグラフ構造表現による一般物体認識

Normalized Web Distanceを用いた音声認識の誤り訂正法 301-4in

ランダムプロジェクションを用いた音響モデルの線形変換

1-P-2 フィッシャー重みマップに基づく不特定話者音素認識の検討

混合ガウスモデル Gaussian Mixture Model GMM

Presentation transcript:

論文紹介: “Joint Embedding of Words and Labels for Text Classification” ACL読み会2018@名大論文紹介: “Joint Embedding of Words and Labels for Text Classification” Guoyin Wang, Chunyuan Li, Wenlin Wang, Yizhe Zhang, Dinghan Shen, Xinyuan Zhang, Ricardo Henao, Lawrence Carin Duke University 紹介者: 藤岡和弥（名古屋大学・外山研究室） 2019/4/18

SWEM: 入力単語ベクトルに対する単純な演算（平均、max等）によりテキストベクトルを構成するモデルテキスト分類 using 単語ベクトル Word2Vec SLP X: 単語列 V: 単語ベクトル列 z: テキストベクトル y: テキストのクラス確率分布 SWEM　 [Shen et al., 2018] < CNN SWEM: 入力単語ベクトルに対する単純な演算（平均、max等）によりテキストベクトルを構成するモデルクラスラベルについて説明図は論文より引用 2019/4/18

目的シンプルなモデル高い分類性能クラスラベルによるアテンション 2019/4/18

クラスラベルによるアテンションアテンション: 入力列への重み付けの一種思想: 同じ単語でもその重要度は文脈により変化各単語の重要度を文脈から学習単語ごとの重み図は論文より引用 2019/4/18

Label-Embedding Attentive Model 　SLP (重みW2, バイアスb2, Softmax) 入力単語と各クラスとの適合度全クラスのラベルベクトル列ベクトルの正規化図は論文より引用 2019/4/18

βの計算 β Softmax Max-Pooling W1 　SLP (重みW1, バイアスb1, ReLU) r r 2019/4/18

モデルの学習学習パラメータ V, C, W1, b1, W2, b2 目的関数: 正則化図は論文より引用ラベルも正しく識別できるように調整単一ラベルの場合のみ ※Multi Label の場合は省略 2019/4/18

モデルの複雑性 CNN, LSTMはパラメータ数、複雑性共に高い提案手法は低いパラメータ数と複雑性 m, h >> K SWEMと同レベル表は論文より引用 2019/4/18

実験実験タスク: テキストクラス分類データセット Accuracyによって評価 (Topic) (Sentiment) (Ontology) (Topic) 2019/4/18

実験結果: Accuracy 表は論文より加工して引用 2019/4/18

その他の検証図表は論文より引用 2019/4/18

ラベルベクトルとテキストベクトル図は論文より引用 2019/4/18

まとめラベルベクトルを用いたテキスト分類を提案小さい計算コスト・パラメータ数でSOTAを達成ラベルベクトルの学習成功を確認 2019/4/18