歌詞による楽曲の印象分類 情報理工学部 情報知能学科 H207025 加藤 里奈.

Slides:



Advertisements
Similar presentations
Software Engineering Laboratory, Department of Computer Science, Graduate School of Information Science and Technology, Osaka University 1 ソフトウェア部品推薦のための.
Advertisements

コーパス言語学実践 2006 年度 2 学期 第 2 回. 2 本日の内容 前半の作業について – 語彙調査の演習 – 用語の説明 語彙,単位語,延べ語,異なり語,見出し 語 作成作業 その1 – データ収集開始.
嗜好ベクトルの近似による サービス享受条件の自動設定 立命館大学大学院 理工学研究科 データ工学研究室 ◎川成宗剛,山原裕之, 原田史子, 島川博光 2007 年 9 月 6 日.
コンピュータプラクティ スⅠ アンケート 水野嘉明 1. 本日の予定 「アンケート」  人間的な要因を評価するための 一手段として、アンケートの方 法について学ぶ  実験では、アンケートの集計を 行う 2.
株式投資とは 2013 年 6 月 27 日 そうへい. 目次  株式とは  投資方法  株式投資の良いところ  投資方法  注意点  考察  参考文献.
日本語 WWW 情報を用いた COCET3300 英単語学習支援に関する研究 情報・知能工学専攻 博士前期課程2年 渡邉 雄大 指導教員 河合 和久.
電子書籍の検索機能の改善 木下研究室 201002713 鴫原 善寿. 背景 スマートフォンなどの携帯端末の普及と ともに電子書籍に注目が浴びた。中でも amazon の kindle など電子書籍の専用端末も 現れた。 電子書籍はデータなので本棚もいらず、 持ち運びも容易になるなど様々な恩恵を もたらした。
大規模コーパスから獲得した 名詞の出現パターンを用いた 事態名詞の項構造解析
遺伝的アルゴリズムにおける ランドスケープによる問題のクラス分類
最大エントロピーモデルに基づく形態素解析と辞書による影響
パネル型クエリ生成インタフェース画像検索システムの改良
ヘルスケア連動型 市販薬検索システム 研究者 : 加納 えり 指導教員 : 越田 高志.
日本大学文理学部 情報システム解析学科 山本広大
コーパス言語学実践 2006年度2学期 第10回.
言語体系とコンピュータ 第5回.
卒業論文 スマートフォンのプロモーションの 提案と分析
国内線で新千歳空港を利用している航空会社はどこですか?
J-POPの歌詞の分析 諸橋ゼミ 3年 須田 勇大.
知識情報演習Ⅲ(後半第1回) 辻 慶太(水)
参照共起分析の Webディレクトリへの適用
圧縮類似度を用いた方言の自動分類 ~ライス符号を用いた前処理~ ~連結クラスタリング法~ ~余弦類似度を用いた方言分類木の評価~
オンライン英単語・リスニング 学習ソフト 佐々木研究室 N02k1114 北隅 麻実.
テキストマイニング, データマイニングと 社会活動のトレース
1.自然言語処理システム 2.単語と形態素 3.文節と係り受け
4Y-4 印象に残りやすい日本語パスワードの合成法
総合科目「学生による授業評価 アンケート」(マークシート方式)
大学での講義中の スマートフォンの私的使用 ―その頻度と内容-
経営学部 経営学科 ITビジネスコース 菊地真実子
形態素解析および係り受け解析・主語を判別
日本大学 文理学部 情報システム解析学科 谷研究室 益田真太郎
J-POPの歌詞の分析 諸橋ゼミ 3年 須田 勇大.
 パワーポイントによる教材作成    校内研修提示資料.
自動車レビューにおける検索と分析 H208032 松岡 智也 H208060 中西 潤 H208082 松井泰介.
動詞の共起パターンを用いた 動作性名詞の述語項構造解析
情報管理論 2018/11/9 情報分析の道具 2018/11/9 情報分析の道具 情報分析の道具.
効果的な ポスターの分析 経営学部経営学科 木村 光佑.
識別子の命名支援を目的とした動詞-目的語関係の辞書構築
定兼邦彦 今井浩 東京大学理学系研究科 情報科学専攻
卒業研究中間発表 社会情報システム学講座 高橋義昭.
クローンセットに対する主要編集者の分析法の提案と調査
社会シミュレーションのための モデル作成環境
コードクローン検出ツールを用いた ソースコード分析システムの試作と プログラミング演習への適用
当事者研究の記述の構造分析:向谷地・浦河べてるの家『安心して絶望できる人生』を対象として
商品開発企画 ~実家と寮と私たち~ 定森・川俣・須藤.
移動エントロピーによる 動的ネットワーク化を用いた SNSと商品購買の相互関係の分析
一人暮らしの男性のための料理検索システムの設計
じんもんこん2017 KH Coderチュートリアル
Webコミュニティ概念を用いた Webマイニングについての研究 A study on Web Mining Based on Web Communities 清水 洋志.
自動車レビュー簡潔化の手法の提案 情報理工学部・情報知能学科 4年 H206010 内輪健一 H206036 鈴木貴裕.
母音[i]のF1, F2平均値の分析.
テキストマイニング, データマイニングと 社会活動のトレース
ブラウザを快適に操作するツールの開発 藤村研究室 1DS04179M 阪上 翔伍.
コードクローン分類の詳細化に基づく 集約パターンの提案と評価
コーディングパターンの あいまい検索の提案と実装
ストリートダンスの上手さの 要因について ━アンケート調査に基づく考察━
Data Clustering: A Review
人工知能をゲームに応用する 有限会社ムームー 森川幸人  .
設計情報の再利用を目的とした UML図の自動推薦ツール
岩手県立大学ソフトウエア情報学部 3年 鈴木研究室所属 井ノ上 憲司
メソッドの同時更新履歴を用いたクラスの機能別分類法
A-17 検索履歴のプライバシーを秘匿した ユーザクラスタリング
データベース第3回目 意味ごとにテーブルを分ける
ソフトウェア理解支援を目的とした 辞書の作成法
第10回 質問(3) メール講座 Next Stage:翻訳力アップ自己トレ(1)
シソーラス情報を用いた童話文章登場人物の 感情情報読み取りシステム
Webページタイプによるクラスタ リングを用いた検索支援システム
USEDセレクトショップにおける 新規顧客獲得のための広告に関する研究
識別子の読解を目的とした名詞辞書の作成方法の一試案
Presentation transcript:

歌詞による楽曲の印象分類 情報理工学部 情報知能学科 H207025 加藤 里奈

研究目的 人は音楽を聴いたとき、「明るい」「暗い」などの印象を 持つ 大きな要因:曲調 曲調と歌詞には関係性がある 人が楽曲から受ける印象を歌詞から推測できないだ ろうか

研究概要 アンケートによる楽曲のカテゴリ分類 歌詞中の単語による楽曲のカテゴリ分類の試み 歌詞中の単語の共起ネットワークによる楽曲の分析 歌詞中の係り受けによる楽曲の分析

楽曲の印象を尋ねる アンケートの実施 協力者: 方法: 18~28歳 男性52名 女性14名 合計66名 楽曲の印象を尋ねる アンケートの実施 協力者: 18~28歳 男性52名 女性14名 合計66名 方法: 各楽曲(計50曲)の題名・アーティスト名・出だしの歌詞を見て、 その楽曲の印象を7つから選ぶ 知らない楽曲の場合、出だしの歌詞だけを見て楽曲の印象 を推測をしない 提示した印象に当てはまらない場合は8、楽曲を知らない場 合は9を選択する

印象カテゴリ 印象カテゴリは7つとする 印象語を用いてユーザに適切な楽曲推薦を行うシス テム(市川ら,2006) 23種類の楽曲を表わす印象語でグループ化を行う 「印象語の数が多すぎて選ぶのに困る」という被験者の意見 があった 印象カテゴリ 「明るい」曲 「激しい」曲 「落ち着いた」曲 「リラックスできる」曲 「暗い」曲 「悲しい」曲 「軽快な」曲

分析対象 オリコンCD年間シングルランキング2007年の上位 50曲 アンケートを行う際に楽曲を知っていることが前提 アンケート協力者の大半を占める18~20歳が頻繁に音楽を 聴いていた年だと判断した

楽曲リスト

アンケート結果 知らないと回答した数が全回答の半数を占める 番号 印象カテゴリ 分類曲数 1 「明るい」曲 15曲 2 「落ち着いた」曲 18曲 3 「暗い」曲 1曲 4 「軽快な」曲 8曲 5 「激しい」曲 6曲 6 「リラックスできる」曲 7 「悲しい」曲

単語のみで印象カテゴリに分ける 歌詞中に現れる単語で印象カテゴリに分ける KH Coderのコーディングを使用する コーディング テキストマイニングのためのフリーソフトウエア コーディング データをいくつかの種類に分類すること KH Coderでは、コーディングルールを記述すればこのルー ルに基づくコーディングを行う

コーディングルールの作成 コーディングルール:7つの印象語を類語辞典で引 いた結果 類語辞典:オンライン辞書サービス『Weblio類語辞 典』 ルールにある語が最も多く出現しているコードをそ の楽曲のコードとする

単語による分類結果 印象カテゴリ 分類曲数 「明るい」曲 0曲 45語 「落ち着いた」曲 8曲 41語 「暗い」曲 10曲 108語 コーディングルールの語数 「明るい」曲 0曲 45語 「落ち着いた」曲 8曲 41語 「暗い」曲 10曲 108語 「軽快な」曲 3曲 16語 「激しい」曲 5曲 185語 「リラックスできる」曲 1曲 51語 「悲しい」曲 6曲 50語 コードなし 26曲 --

アンケートとの比較 印象カテゴリ アンケート コーディング 適合 精度 再現率 「明るい」曲 15曲 0曲 - 「落ち着いた」曲 18曲 「落ち着いた」曲 18曲 8曲 4曲 0.5 0.2 「暗い」曲 1曲 10曲 0.1 1.0 「軽快な」曲 3曲 0.3 「激しい」曲 6曲 5曲 「リラックスできる」曲 「悲しい」曲

結果・評価 カテゴリに分けることができたのは半分 精度・再現率が低い 印象語によって歌詞をカテゴリに分けることは有効で はなさそう

アンケート結果を 共起ネットワーク図にする アンケート結果を 共起ネットワーク図にする アンケートで分類された楽曲の歌詞を、印象カテゴリ 毎に共起ネットワーク図に表わす KH Coderの共起ネットワークコマンドを使用 「明るい」、「落ち着いた」、「軽快な」、「激しい」 共起ネットワークとは 出現パターンの似通った語を線で結ぶ 線で結ばれた語は強い共起関係があるといえる 語が近くにあっても線で結ばれていなければ、共起関係があ るわけではない 色分けは自動で行うため、色に意味はない

作成した共起ネットワーク図より 共起ネットワーク上:約90語 すべての含まれる語:2語 3つのカテゴリに含まれる語:10語 2つのカテゴリに含まれる語:22語 同じ語が異なるカテゴリの歌詞に現れていることが多 い 語と語の繋がりはどうか

共起ネットワーク:語と語の繋がり 「落ち着いた」 「明るい」 「激しい」 「軽快な」

印象によって語間の繋がりが違う 共起関係を用いて各印象カテゴリの特徴ができる 数値化が困難 共起ネットワーク図の考察 印象によって語間の繋がりが違う 共起関係を用いて各印象カテゴリの特徴ができる 数値化が困難 係り受け解析

係り受け解析で特徴を調べる CaboCha(係り受け解析器)を用いて、各印象カテ ゴリの歌詞の係り受けを求め、頻度を出す 「明るい」「落ち着いた」「軽快な」「激しい」 使用する品詞:名詞・形容詞・副詞 「明るい」曲の頻度表   出現回数

頻度表を用いた分類方法 頻度表に含まれる係り受けが、分類したい楽曲の係 り受けに含まれていれば、ポイントを付ける ポイントは、頻度表を作った際の出現回数を使用した ポイントの最も高いカテゴリに楽曲を分類する

頻度表によるカテゴリ分けと アンケートによる印象の比較(1) 協力者:20~23歳 男性5名 女性5名 計10名 対象楽曲:頻度表を作る際に用いていない10曲 各楽曲(計10曲)を「明るい」「落ち着いた」「激しい」「軽 快な」「該当なし」の5つに分類してもらう

頻度表によるカテゴリ分けと アンケートによる印象の比較(2) タイトル アーティスト 印象:アンケート アンケートの一致率 印象:頻度表 ポイント TSUNAMI サザンオールスターズ 落ち着いた 0.9 明るい 3 SMILY 大塚愛 1 羞恥心 0.6 該当なし 桜坂 福山雅治 1.0 らいおんハート SMAP マツケンサンバ 松平健 軽快な キセキ GReeeeN 0.4 5 Jupiter 平原綾香 *~アスタリスク ~ オレンジレンジ 0.5 月光花 Janne Da Arc

考察 アンケートと係り受けによる分類結果の一致率:0.3 ポイントの高い楽曲は、アンケートの結果と異なって いる 歌詞を係り受け解析で印象カテゴリに分けることは難 しい

まとめ・課題 楽曲の歌詞だけで、印象カテゴリに分けることは困難 分析対象の追加 アンケート方法の再検討 知らない曲の軽減

ありがとうございました。

既研究 印象語のグループ化を用いた楽曲推薦システム 8つのジャンルごとにユーザが選んだ印象語に最適 な楽曲を推薦する 印象語は23種類 市川裕也、田村哲嗣、速水悟 8つのジャンルごとにユーザが選んだ印象語に最適 な楽曲を推薦する 印象語は23種類

KH Coderについて テキストマイニングのためのフリーソフトウエアで、さ まざまな日本語テキスト型データを計量的に分析する ことができる

英語の扱い KH Coderでは英語を未知語として扱う 日本語の楽曲の場合、英語表現は単語や短い文 これにより、英語は分析対象から外す 分析対象から外される 日本語の楽曲の場合、英語表現は単語や短い文 あまり意味をなさないことが多い これにより、英語は分析対象から外す

係り受けの頻度

共起ネットワーク図 KH Codreには5種類の色分けの設定がある サブグラフ検出 同じサブグラフに含まれる語は実線 互いに異なるサブグラフに含まれる語は波線 背景が白色で丸囲み枠が黒色の語は、ほかの語とグループ を形成していない 色分けは自動で行うため、色分けに意味はない

共起ネットワーク(2) 「落ち着いた」曲 「激しい」曲

共起ネットワーク(1) 「明るい」曲 「軽快な」曲