Qiwi: テキスト中の 数値表現マイニング

Slides:



Advertisements
Similar presentations
アプリケーションターム ワークショップについての解説 rg-coordinator 12/11. 今回のワークショップのテーマ  アプリケーションにおける個人情報の取り 扱い 利用者やその属性を特定できる「個人情報」 インターネットでは利用者が意図しない個人 情報も利用できる  単に保護し、流さないようにするのではな.
Advertisements

データベースの基礎知識 ACEESS の基本操作. データベースの基礎知識 データベース  特定のテーマや目的に毎のデータの集合体 データベースソフトウェア  データベースを作成、管理するソフトウェアの総 称 Oracle(Oracle) IBM(DB2) Microsoft(SQL Server)
表計算ソフトウェア 関数の利用(応用編) Excel VLOOKUP (列方向の照 合) VLOOKUP (列方向の照 合) HLOOKUP (行方向の照 合) HLOOKUP (行方向の照 合) INDEX (行列の検索) INDEX (行列の検索) RANK (順位付け) RANK.
第6回 JavaScript ゼミ セクション3-6 発表者 直江 宗紀. 組み込み関数  JavaScript に予め用意された関数  特定のオブジェクトに依存していない  単に関数名で呼び出すことが可能.
IBMユーザ研究会九州研T3 5章 Webの発展可能性. WWWの発展が企業に与えるもの 顧客・ユーザのリテラシー向上 顧客・ユーザの操作的な ” 常識 ” の変化 システム開発プロジェクトでの応用 ウェブの発展を、企業はどう捉えて、 自らをどう変えていく必要があるか? 新しいプラットフォームをより深く理解することで、
プログラミング言語論 第10回(演習) 情報工学科 木村昌臣   篠埜 功.
【事例演習5】  字句解析     解 説  “ハッシュを用いた字句解析の方法”.
最大エントロピーモデルに基づく形態素解析と辞書による影響
情報理工学部 情報システム工学科 ラシキアゼミ 3年 H 井奈波 和也
ヘルスケア連動型 市販薬検索システム 研究者 : 加納 えり 指導教員 : 越田 高志.
PowerPointについて 総合大学総合学部 情報太郎.
情報処理の基礎 私たちとコンピュータの扱うデータの違い 明治学院大学 法学部消費情報環境法学科 鶴貝 達政
SPA 報告
コーパス言語学 第1回.
岩村雅一 知能情報工学演習I 第9回(C言語第3回) 岩村雅一
テキストマイニング, データマイニングと 社会活動のトレース
情報科学1(G1) 2016年度.
UMLの概要と オブジェクト指向の 基本概念
形態素解析および係り受け解析・主語を判別
テキストの類似度計算
精密工学科プログラミング基礎 第9回資料 (12/11 実施)
 データベースによる並列処理 情報論理工学研究室  三宅健太.
(B2) 親: minami, kazuki 多様な認証機器に対応する 認証システム (B2) 親: minami, kazuki.
情 報 A ー ディジタル化のしくみ ー.
マイクロソフト Access を使ってみよう 第1回
マイクロソフト Access での SQL 演習 第1回 SQL問い合わせ(クエリ)
日本語解析済みコーパス管理ツール 「茶器」
情報コミュニケーション入門b 第5回 プレゼンテーション支援ツール入門
自然言語処理及び実習 第11回 形態素解析.
計算物理学基礎 第1回 UNIXの基礎 C言語の基本.
表計算 Excel 演習 4.検索,条件付き書式設定,並べ替え.
大規模データによる未知語処理を統合した頑健な統計的仮名漢字変換
ちょっとした練習問題① 配列iroを['R', 'W', 'R', 'R', 'W' , 'W' , 'W']を宣言して、「W」のときの配列の番号をprintfで表示するようなプログラムを記述しなさい。
余談 ドラクエのパラメーターの上限、マリオの残機など、255が多く、 ドラクエの経験値の上限などに65535が出てくるワケ 1.コンピュータは2進数で動く。 例:2進数 = 10進数173 2.16進数1桁(0~9, A, B, ~F)が2進数4桁に対応する。 例.
岩村雅一 知能情報工学演習I 第9回(後半第3回) 岩村雅一
東京大学OPAC Plus “言選Web” -関連学術用語による日本語文献情報への 簡易ナビゲーションシステム-
前回の練習問題.
情報検索(6) メディア検索の仕組み 教員 岩村 雅一
深層学習を用いた音声認識システム 工学部 電気電子工学科 白井研究室 T213069 林健吉.
2016年度 植物バイオサイエンス情報処理演習 第6回 情報処理(4) データを加工する・2
Ibaraki Univ. Dept of Electrical & Electronic Eng.
12. 意味・意図の解析 12.1 意味表現とは 12.2 規則による意味解析処理 12.3 統計的な意味解析処理 12.4 スマートフォンでの音声サービス ニューラルネットワークによる意味解析.
DynaMed 新しい検索インターフェースについて support.ebsco.com.
情報処理概論Ⅰ 2007 第5回 2019/4/7 情報処理概論Ⅰ 第5回.
Fortranについて 高エネルギー加速器研究機構 平山 英夫.
テキストマイニング, データマイニングと 社会活動のトレース
精密工学科プログラミング基礎Ⅱ 第4回資料 今回の授業で習得してほしいこと: 文字列の扱い ファイル入出力の方法 コマンドライン引数の使い方
岩村雅一 知能情報工学演習I 第9回(C言語第3回) 岩村雅一
先輩チューター ○○エリア 名前 (○○大学 ○○部 ○年)
アルゴリズム論 (第12回) 佐々木研(情報システム構築学講座) 講師 山田敬三
文書分類モデルの統計的性質に関する一考察
岩村雅一 知能情報工学演習I 第12回(C言語第6回) 岩村雅一
3.リレーショナルデータベース,主キー, SQL
コーディングパターンの あいまい検索の提案と実装
岩村雅一 知能情報工学演習I 第9回(後半第3回) 岩村雅一
第6回レポート解説 条件1 条件2 条件3 月の入力 月、日、曜日の表示 日の入力 曜日の入力
計算の理論 I -数学的概念と記法- 火曜 12:50~14:20 大月 美佳 2004年4月20日.
構造的類似性を持つ半構造化文書における頻度分析
第6回:得点を表示しよう! (文字の表示、乱数)
なぜ演算子をオーバーロードするの? 演算子に新しい役割をもたせたいから << 演算子 左オペランドが出力ストリーム
計算の理論 I -数学的概念と記法- 月曜3校時 大月 美佳.
欠陥検出を目的とした類似コード検索法 吉田則裕,石尾隆,松下誠,井上克郎 大阪大学 大学院情報科学研究科
容易に使用可能な grep風コードクローン検索ツール
2019/6/6 リストを格納する変数 配列と連想配列.
情報処理Ⅱ 2007年12月3日(月) その1.
イラストで学ぶ 音声認識 荒木雅弘 著 講談社 2015.
コンパイラ 2012年10月11日
プログラミング 4 文字列.
JSONの概要, Cloud FireStore で JSON を扱う
岩村雅一 知能情報工学演習I 第9回(C言語第3回) 岩村雅一
Presentation transcript:

Qiwi: テキスト中の 数値表現マイニング 吉田 稔、 中川裕志 東京大学情報基盤センター

数値表現とは テキスト中に出てくる数字 陽に数値データベースとしては与えられていないが、データベースとして使えるとうれしい (例)「上昇中、15,000ftにて被雷した。」 「入場料:大人2000円、子供1000円」 「社長に就任。富山県出身、58歳」 陽に数値データベースとしては与えられていないが、データベースとして使えるとうれしい 抽出トピックを限定しない情報抽出

動機1:数値的意味獲得 数値と言語の関係を捉えたい (例) 年齢と呼称 (例) 位置とイベント (例) 典型的な値段 (例) 年齢と呼称 同じ人間でも、3歳→男児(女児)  20歳→若者   45歳→中年男性   80歳→老人 (例) 位置とイベント 1,000ft→「離陸」  8,000ft→「落雷」  12,000ft→「揺れ」  25,000ft→「巡航」 (例) 典型的な値段 「コーヒー」→200円  「サラダ」→500円  「ランチ」→1000円  「ディナー」→3000円

数値検索 「数値の範囲」を、単語のようにして扱える (例)「20~40歳」⇒「21歳」「25歳」…等をまとめた表現 検索クエリとして使える 検索結果もまとめて表示される

応用検索 Number-Kiwi Number-Synonym 文字列を入れると、それに連接しやすい数値を返す 数値を入れると、それに連接しやすい言葉を返す Number-Synonym 数値を入れると、それに類似した言葉を返す

検索例1:Num-Kiwi 文字列と、それに連接しやすい数値

検索例2: Num-Kiwi 数値と、それに連接しやすい言葉