Presentation is loading. Please wait.

Presentation is loading. Please wait.

Vanessa Lopez, Michele Pasin, and Enrico Motta

Similar presentations


Presentation on theme: "Vanessa Lopez, Michele Pasin, and Enrico Motta"— Presentation transcript:

1 AquaLog: An Ontology-Portable Question Answering System for the Semantic Web
Vanessa Lopez, Michele Pasin, and Enrico Motta Knowledge Media Institute, The Open University, United Kingdom 発表者: 村上 明子 日本アイ・ビー・エム(株)東京基礎研究所

2 概要 a portable question answering system Why portable? 自然言語 → クエリ
自然言語 → クエリ オントロジ(semantic markupされたもの) → クエリ、結果 Why portable? 既存のNLPを使っている あるオントロジーに対するconfiguration timeは無視できるほど少ない

3 AKT: Advanced Knowledge Technologies

4

5

6

7 Related Work Close-Domain Natural Language Interfaces
対象となるドメインの知識をデータベース化し、質問を何らかの形でSQLとして検索する Open-Domain QA Systems 質問のタイプを分類し、その後単語にマッチするものを探す ほとんどが固有名詞抽出の問題 Open-Domain QA Systems using Triple Representation 質問をtripleにしたり、検索対象(答えの存在する知識)をtripleにしたりする AquaLogともっとも似ているアプローチ Ontologies in Question Answering Ontologyを用いるのは一般にquery expansionのことが多い Close-Domainであれば知識にもOntologyの利用は可能

8 The Architecture Waterfall model
NL → query triples → ontology compatible triples → Answer なぜtripleを採用したか? 質問は大体tripleで表すことができる 例:日本の首都はどこですか? 日本→[首都]→(答え) RDF,OWLもtripleと同じ表現を使っている <subject, predicate, object> SemanticWebをtargetにするなら自然な発想

9 Two main processing modules
The linguistic component The relation similarity service 例としてOpen UniversityのKMIで作られているOntologyを用いている KMIの“academic life”に関するOntology projects, technologies, people, news, events, organizations, publications, and research areas

10 The linguistic component
自然言語のinputをQuery-Tripleにmapするcomponent GATE を使用 pattern baseのパーザー。sentences, tokens, nouns, verbsなどの認識ができる そのほか、筆者らはterms, relationsやquestion indicators (which, who, whenなど)と質問タイプとパターンを認識できるように拡張 JAPE grammarsと作成した23のパターンに対して正規表現を利用 曖昧性が残る場合は次のRSSへ任せる

11 Relation Similarity Service(1)
自然言語から得られたtripleからOntology中のtripleに以下の方法でマッチさせる string similarity matching generic lexical resourcesを用いる(Word Netなど) Learning Mechanismによって得られたdomainに依存したlexicon Interactiveということが重要 ユーザーの指定によって曖昧性が除去される relationとconceptはClass Similarity Service (CSS)によってそれぞれ一致しているか見る 固有名詞はdistance metrics algorithmによって一致するものを探す

12 Relation Similarity Service(2)
マッピングに失敗した質問のうち、いわゆるYes/Noの質問であれば答えられるものがある termに曖昧性がある場合はユーザーにinteractiveに選ばせることで解決できる semanticに曖昧性があるときはrelationなどを追加できる 例: Is Enrico working in IBM? 例: who are the researchers in semantic web research area? semantic web or web (CSS: Class Similarity Service) 例: Who is the secretary in KMi? → (secretary) works-for (organization)

13 Learning Mechanism(1) さまざまな言い回しに対してすべての表現をデータベースに入れるのは不可能
例:works (for) is working, works, collaborate, is involved 2つのメソッドから構成される matching 文章が入力されるとKBにあるかどうかチェック learning KBにない場合、候補をユーザーに選択させるrelationと共にKBに登録 似ているコンテキストの時でも使えるようにコンテキストも同時に登録

14 Learning Mechanism(2) Learning Process contextの判定・登録
質問のargument、ontologyの名前、ユーザーの情報から決められる contextは主にtripleのrelation relationを共に登録することによって、多義語を複数の人が各々のcontextで使用することが可能になる Context Generalization Ontologyの上位概念を用いることによってcontextをgeneralizeする ユーザーコミュニティへのサポート クエリー中のterm, category, relationの選択をコミュニティ内で再利用する 逆に前の記録を消すことも可能

15 Evaluation QAの能力とユーザーの使い勝手の両方で評価が必要
現在のシステムではAKT ontologyとKMi KBを用いて実装 10人のメンバーに質問を作ってもらう(事前に言語処理についての情報を与えずに) 76の質問のうち37個はうまく扱えた(48.68%) ontologyを超えた質問はうまく扱えない(一番の研究者は?など) さらに、Semantic Webへのインターフェースの役割も果たすためには、各ontologyにおけるportabilityの評価も必要 ontologyがきちんとtripleの形であればAquaLogでの利用は簡単 → Wine Ontologyで評価

16 例: Wine Ontology

17 End of the file


Download ppt "Vanessa Lopez, Michele Pasin, and Enrico Motta"

Similar presentations


Ads by Google