大規模時系列ウェブコーパスを用いた 新造語の盛衰のダイナミズムの分析

Slides:



Advertisements
Similar presentations
メンタルレキシコン4: ことばの意味を言語データから 探る. コーパス言語学とは? コーパス言語学とは、コーパス ( テキスト の総体 ) をつかった、言語の科学的研究の ことです。
Advertisements

日本語 WWW 情報を用いた COCET3300 英単語学習支援に関する研究 情報・知能工学専攻 博士前期課程2年 渡邉 雄大 指導教員 河合 和久.
大規模コーパスから獲得した 名詞の出現パターンを用いた 事態名詞の項構造解析
自然言語処理:第3回 1.前回の確認 2.構文解析 3.格文法.
最大エントロピーモデルに基づく形態素解析と辞書による影響
ことばとコンピュータ 2007年度1学期 第13回.
パネル分析について 中村さやか.
言語体系とコンピュータ 第5回.
パレスチナ人の越境移動に関する意識と経験
レポートの作成 効果的な発表の仕方.
情報学類 吉田光男 アドバイザー教官: 山本幹雄 先生
日本語教育における 発音指導の到達目標を考える
動詞 スライドショウを実行し、左クリック(一回)しながら読んでください。
言語の統計 統計の対象量 単語 NグラムとKWIC HMMと形態素解析への応用.
言語体系とコンピュータ 第6回.
日本語を考える Introduction to Japanese Linguistics
日本語統語論:構造構築と意味 No.1 統語論とは
実験 関数・記号付き文型パターンを用いた機械翻訳の試作と評価 石上真理子 水田理夫 徳久雅人 村上仁一 池原悟 (鳥取大) ◎評価方法1
東京工科大学 コンピュータサイエンス学部 亀田弘之
動詞と格要素の共起と 名詞の出現パターンを用いた 事態性名詞の項構造解析
テキストマイニング, データマイニングと 社会活動のトレース
1.自然言語処理システム 2.単語と形態素 3.文節と係り受け
研究の背景 コードクローン ソースコード中に存在する一致または類似したコード片
12月08日 構文解析 入力文(記号列)が与えられたとき,文法によってその文を解析し,その構造を明らかにする.
新聞の中で「優遇」「委託」「しかし」「問題」のうち頻度が一番高いものはどれか。
DixChange プロジェクト ~辞書共通化の試み~
自動車レビューにおける検索と分析 H208032 松岡 智也 H208060 中西 潤 H208082 松井泰介.
TYPO Writer ヒトはどのように打ち間違えるのか?
日本語解析済みコーパス管理ツール 「茶器」
動詞の共起パターンを用いた 動作性名詞の述語項構造解析
1月19日 辞書 自然言語処理における辞書の役割 機械辞書設計の要点 辞書の種類と用途.
第34回応用言語学講座公開講演会 講師:金水 敏先生(大阪大学大学院教授) 直示とは何か:日本語を例に、その体系と歴史について
意味分析の方法.
脳活動に関するデータ データの種類 データの特徴 脳波・脳磁図・fMRI画像 脳活動とパフォーマンスの関係はきわめて冗長。
音韻論⑤ ----.
音韻論② pp
言語学 語のかたち① pp
情報管理論 2018/11/9 情報分析の道具 2018/11/9 情報分析の道具 情報分析の道具.
自然言語処理及び実習 第11回 形態素解析.
大規模データによる未知語処理を統合した頑健な統計的仮名漢字変換
複数の言語情報を用いたCRFによる音声認識誤りの検出
識別子の命名支援を目的とした動詞-目的語関係の辞書構築
雑音環境下における 非負値行列因子分解を用いた声質変換
助動詞カードを使って 活用型を整理しよう はじめに ・このスライドは 黒板に直接投影することも考え、黒字に黄色の文字に してあります。
大規模データによる未知語処理を統合したスケーラブルな仮名漢字変換
深層学習を用いた音声認識システム 工学部 電気電子工学科 白井研究室 T213069 林健吉.
当事者研究の記述の構造分析:向谷地・浦河べてるの家『安心して絶望できる人生』を対象として
移動エントロピーによる 動的ネットワーク化を用いた SNSと商品購買の相互関係の分析
知識情報演習Ⅲ(後半第2回) 辻 慶太
言語学 語のかたち② p.p
<日本語教育とAI:研究実践例と今後の課題 > 読解支援システムへのAI活用の可能性と留意点
形態素解析ドライバモデルの実装と コーパスの品詞体系変換への応用
言語学の基礎 ④ 教科書 pp. 40−52.
テキストマイニング, データマイニングと 社会活動のトレース
東京工科大学 コンピュータサイエンス学部 亀田弘之
超大規模ウェブコーパスを用いた 分布類似度計算
データベースの作り方  リサーチカンファレンス.
東京工科大学 コンピュータサイエンス学部 亀田弘之
意味・談話解析勉強会 チュートリアル 小町守.
東京工科大学 コンピュータサイエンス学部 亀田弘之
言語表現と 視覚表現の比較 関西大学社会学部 雨宮俊彦.
記憶の仕組みを知って 記憶力を上げよう!.
クローン検出ツールを用いた ソフトウェアシステムの類似度調査
呂 雷寧 RO, Rainei (上海財経大学 外語学院・ 常勤講師)
デザイン行為における 思考プロセスの視覚化方法の提案: 時系列に着目した 単語の連想関係の結合
ソフトウェア理解支援を目的とした 辞書の作成法
第7回 Q&A メール講座 Next Stage:翻訳力アップ自己トレ(1)
シソーラス情報を用いた童話文章登場人物の 感情情報読み取りシステム
識別子の読解を目的とした名詞辞書の作成方法の一試案
東京工科大学 コンピュータサイエンス学部 亀田弘之
Presentation transcript:

大規模時系列ウェブコーパスを用いた 新造語の盛衰のダイナミズムの分析 鍜治伸裕 宇野良子 kaji@tkl.iis.u-tokyo.ac.jp ryoko@sacral.c.u-tokyo.ac.jp  言語学者による大規模時系列   ウェブコーパスの利用を支援 言語学の先行研究との比較 Tsujimura & Davis (2008) (a)分類 外来語由来、漢語由来、 オノマトペ由来、固有名由来 (b)特徴   音韻・形態的      五段活用     二モーラ以上     アクセント(*)  語用論的        playfulness, ノリ [米川、2002] (c)新造語動詞はconstruction (意味と形の特殊な結びつき、Goldberg [1995])  ウェブコーパスの 利用によって (a) 新たなカテゴリーを指摘 (b) 検証・時間変化に関わる特徴の指摘 (c) 形と意味の特殊な結びつきの出現を分析 * …(C)V(C)V-C]- | /r/  新造語(動詞)の分類と位置づけ 辞書未登録語の自動抽出 *以下片仮名語幹のものに関して ・語種による分類    外来語由来: バモる   オノマトペ由来: モフる    間違い由来: ハラシマる ・通時的変化(1999-2006) による分類 ゆるやかに増える語: ググる ファブる 急激に増える語: ドリボる バルビる 人為的に急激に増える語: ゴッゴる 増減を繰り返す語: ムソる 変わらない語: コダワる デニる 文脈情報の利用 ファブる ドリボる 通常の動詞に近付いているものと新造語のまま終わるもの。それぞれについて分析が必要となる。 なる 溶ける 着く ファブる             ドリボる 単語の認定 デニる 新造語(動詞)の意味と構文 事例研究:「ファブる」における構文交替の出現 ・「 ファブる」と「ファブリーズする」の相関 ・ファブリーズをかける対象がとる格の変化 布団、部屋、カーテン、人‥ 2006年データ を に ファブリーズをする  1 41 全184例 ファブリーズする 27 93 全2246例中1000例 ファブる 53 36 全1459例中1000例 参考 :壁塗り交替 John sprayed paint on the wall./ John sprayed the wall with paint.