Download presentation
Presentation is loading. Please wait.
1
Qiwi: テキスト中の 数値表現マイニング
吉田 稔、 中川裕志 東京大学情報基盤センター
2
数値表現とは テキスト中に出てくる数字 陽に数値データベースとしては与えられていないが、データベースとして使えるとうれしい
(例)「上昇中、15,000ftにて被雷した。」 「入場料:大人2000円、子供1000円」 「社長に就任。富山県出身、58歳」 陽に数値データベースとしては与えられていないが、データベースとして使えるとうれしい 抽出トピックを限定しない情報抽出
3
動機1:数値的意味獲得 数値と言語の関係を捉えたい (例) 年齢と呼称 (例) 位置とイベント (例) 典型的な値段
(例) 年齢と呼称 同じ人間でも、3歳→男児(女児) 20歳→若者 45歳→中年男性 80歳→老人 (例) 位置とイベント 1,000ft→「離陸」 8,000ft→「落雷」 12,000ft→「揺れ」 25,000ft→「巡航」 (例) 典型的な値段 「コーヒー」→200円 「サラダ」→500円 「ランチ」→1000円 「ディナー」→3000円
4
数値検索 「数値の範囲」を、単語のようにして扱える (例)「20~40歳」⇒「21歳」「25歳」…等をまとめた表現 検索クエリとして使える
検索結果もまとめて表示される
5
応用検索 Number-Kiwi Number-Synonym 文字列を入れると、それに連接しやすい数値を返す
数値を入れると、それに連接しやすい言葉を返す Number-Synonym 数値を入れると、それに類似した言葉を返す
6
検索例1:Num-Kiwi 文字列と、それに連接しやすい数値
7
検索例2: Num-Kiwi 数値と、それに連接しやすい言葉
Similar presentations
© 2024 slidesplayer.net Inc.
All rights reserved.