Presentation is loading. Please wait.

Presentation is loading. Please wait.

Qiwi: テキスト中の 数値表現マイニング

Similar presentations


Presentation on theme: "Qiwi: テキスト中の 数値表現マイニング"— Presentation transcript:

1 Qiwi: テキスト中の 数値表現マイニング
吉田 稔、 中川裕志 東京大学情報基盤センター

2 数値表現とは テキスト中に出てくる数字 陽に数値データベースとしては与えられていないが、データベースとして使えるとうれしい
(例)「上昇中、15,000ftにて被雷した。」 「入場料:大人2000円、子供1000円」 「社長に就任。富山県出身、58歳」 陽に数値データベースとしては与えられていないが、データベースとして使えるとうれしい 抽出トピックを限定しない情報抽出

3 動機1:数値的意味獲得 数値と言語の関係を捉えたい (例) 年齢と呼称 (例) 位置とイベント (例) 典型的な値段
(例) 年齢と呼称 同じ人間でも、3歳→男児(女児)  20歳→若者   45歳→中年男性   80歳→老人 (例) 位置とイベント 1,000ft→「離陸」  8,000ft→「落雷」  12,000ft→「揺れ」  25,000ft→「巡航」 (例) 典型的な値段 「コーヒー」→200円  「サラダ」→500円  「ランチ」→1000円  「ディナー」→3000円

4 数値検索 「数値の範囲」を、単語のようにして扱える (例)「20~40歳」⇒「21歳」「25歳」…等をまとめた表現 検索クエリとして使える
検索結果もまとめて表示される

5 応用検索 Number-Kiwi Number-Synonym 文字列を入れると、それに連接しやすい数値を返す
数値を入れると、それに連接しやすい言葉を返す Number-Synonym 数値を入れると、それに類似した言葉を返す

6 検索例1:Num-Kiwi 文字列と、それに連接しやすい数値

7 検索例2: Num-Kiwi 数値と、それに連接しやすい言葉


Download ppt "Qiwi: テキスト中の 数値表現マイニング"

Similar presentations


Ads by Google