英作文支援システムの 構築に関する研究 平成 15 年 11 月 18 日 ( 火 ) A1 グループ M2 永易 稔 中間発表.

Slides:



Advertisements
Similar presentations
電子書籍の検索機能の改善 木下研究室 201002713 鴫原 善寿. 背景 スマートフォンなどの携帯端末の普及と ともに電子書籍に注目が浴びた。中でも amazon の kindle など電子書籍の専用端末も 現れた。 電子書籍はデータなので本棚もいらず、 持ち運びも容易になるなど様々な恩恵を もたらした。
Advertisements

音声翻訳における機械翻訳・音声合成の 性能評価および分析 ☆橋本佳 ,山岸順一 , William Byrne , Simon King ,徳田恵一 名工大 University of Edinburgh Cambridge University
大規模コーパスから獲得した 名詞の出現パターンを用いた 事態名詞の項構造解析
東京工科大学 コンピュータサイエンス学部 亀田弘之
自然言語処理:第3回 1.前回の確認 2.構文解析 3.格文法.
最大エントロピーモデルに基づく形態素解析と辞書による影響
構造的類似文検索アルゴリズムを応用した日本語文型パターン抽出法
ヘルスケア連動型 市販薬検索システム 研究者 : 加納 えり 指導教員 : 越田 高志.
言語体系とコンピュータ 第5回.
国内線で新千歳空港を利用している航空会社はどこですか?
知識情報演習Ⅲ(後半第1回) 辻 慶太(水)
Microsoft Office InfoPath 2003 概要
早稲田大学大学院理工学研究科 情報科学専攻修士2年 後藤滋樹研究室 坂本義裕
オンライン英単語・リスニング 学習ソフト 佐々木研究室 N02k1114 北隅 麻実.
実験 関数・記号付き文型パターンを用いた機械翻訳の試作と評価 石上真理子 水田理夫 徳久雅人 村上仁一 池原悟 (鳥取大) ◎評価方法1
Super-Functionに基づく日英機械翻訳
東京工科大学 コンピュータサイエンス学部 亀田弘之
テキストマイニング, データマイニングと 社会活動のトレース
1.自然言語処理システム 2.単語と形態素 3.文節と係り受け
部分形態素解析を用いた コーパスの品詞体系変換
4Y-4 印象に残りやすい日本語パスワードの合成法
状況の制約を用いることにより認識誤りを改善 同時に野球実況中継の構造化
卒業論文 最終発表 WWW情報検索 ナビゲーションシステムの設計と実装
東京工科大学 コンピュータサイエンス学部 亀田弘之
形態素解析および係り受け解析・主語を判別
DixChange プロジェクト ~辞書共通化の試み~
日本語解析済みコーパス管理ツール 「茶器」
動詞の共起パターンを用いた 動作性名詞の述語項構造解析
Javaソフトウェア部品検索システムのための索引付け手法の提案と実装
自然言語処理及び実習 第11回 形態素解析.
大規模データによる未知語処理を統合した頑健な統計的仮名漢字変換
Office IME 2010 を使う.
識別子の命名支援を目的とした動詞-目的語関係の辞書構築
オブジェクト指向プログラムにおける エイリアス解析手法の提案と実現
機械翻訳勉強会 NTCIR-7について 2007年10月16日 奈良先端大D1小町守.
インラインスクリプトに対するデータフロー 解析を用いた XHTML 文書の構文検証
東京大学OPAC Plus “言選Web” -関連学術用語による日本語文献情報への 簡易ナビゲーションシステム-
只見町 インターネット・エコミュージアムの「キーワード」検索の改善
雑音環境下における 非負値行列因子分解を用いた声質変換
単語登録(1) ◎MS-IMEの「単語登録」に、単語、語句、記号など自分がよく使うものを登録しておくと、便利である。
深層学習を用いた音声認識システム 工学部 電気電子工学科 白井研究室 T213069 林健吉.
12. 意味・意図の解析 12.1 意味表現とは 12.2 規則による意味解析処理 12.3 統計的な意味解析処理 12.4 スマートフォンでの音声サービス ニューラルネットワークによる意味解析.
オープンソース開発支援のための ソースコード及びメールの履歴対応表示システム
請求項記述言語(PCML)による特許文章の構造化
<日本語教育とAI:研究実践例と今後の課題 > 読解支援システムへのAI活用の可能性と留意点
類似度を用いた WWW のリンク構造の解析 谷 研究室    栗原 伸行.
形態素解析ドライバモデルの実装と コーパスの品詞体系変換への応用
音声認識・翻訳 Android アプリケーション制作
レビューとは (プロジェクト管理の観点から)
Happinessの歴史と 日本語処理のエピソード (株)平和情報センター 沓澤 尚明.
テキストマイニング, データマイニングと 社会活動のトレース
東京工科大学 コンピュータサイエンス学部 亀田弘之
日本の高校における英語の授業は 英語がベストか?
早稲田大学大学院 基幹理工学研究科 情報理工学専攻 後藤研究室 修士1年 魏 元
東京工科大学 コンピュータサイエンス学部 亀田弘之
コードクローン分類の詳細化に基づく 集約パターンの提案と評価
東京工科大学 コンピュータサイエンス学部 亀田弘之
JavaScriptを含んだHTML文書に対する データフロー解析を用いた構文検証手法の提案
自然言語処理2015 Natural Language Processing 2015
Unit 6 Part 3 教科書 p.54~55 I, you以外の単数の人やもの について「…しません」と 説明するときの言い方を
並列構造に着目した係り受け解析の改善に関する研究
第7回 Q&A メール講座 Next Stage:翻訳力アップ自己トレ(1)
エイリアス関係を考慮した Javaプログラム用静的スライシングツール
形態素解析と構文解析 金子邦彦.
自然言語処理2016 Natural Language Processing 2016
単語登録(1) ◎MS-IMEの「単語登録」に、単語、語句、記号など自分がよく使うものを登録しておくと、便利である。
識別子の読解を目的とした名詞辞書の作成方法の一試案
Normalized Web Distanceを用いた音声認識の誤り訂正法 301-4in
1.2 言語処理の諸観点 (1)言語処理の利用分野
東京工科大学 コンピュータサイエンス学部 亀田弘之
Presentation transcript:

英作文支援システムの 構築に関する研究 平成 15 年 11 月 18 日 ( 火 ) A1 グループ M2 永易 稔 中間発表

背景と目的 国際化により英語文書を作成する機会が増加 機械翻訳システム と 例文提示型システム 英作文を支援するシステムが求められている 表現文が限定 正しい文が得られない 正確な文を参考可能 状況に応じたテンプレート 文の活用 英作文支援システム 英作文を支援する環境の構築

英作文支援システム 例文提示 対訳例文 コーパス EDR 電子辞書 I live in Kobe. 私は神戸に住んでいます。 I live in KAKOGAWA. 加古川に住んでいます。 辞書 入出力部 キーワード抽出スコア計算 入力:私は徳島に住んでいます。 SF の抽出 … 例文選択 出力: I live in Tokushima. 名詞を対応付けて表示 [I] live in [Kobe]. [ 私 ] は [ 神戸 ] に住んでいます。 例文編集 英文訂正 徳島

検索キーワードの抽出手順  入力文を形態素解析して文節分け 英語 _ を / 話す / こと _ は / 容易 _ で _ ない  文節末の形態素の品詞が助詞ならば削除 英語 / 話す / こと / 容易でない  漢字かなまじり文をひらがなに変換 えいご / はなす / こと / よういでない  頻出キーワードを除去 えいご / はなす / よういでない ( 入力文 ) 英語を話すことは容易でない

対訳例文コーパスの検索 検索キーワードと一致する対訳例文コー パスを検索し,スコアを計算 keywordlengthverbindexfrequency えいご 3false2/12/34/1243/125…1507 はなす 3true2/34/1243/2342/3…586 よういでな い 6false1243/43234/2423…3 表: 検索キーワードの Index 参照テーブル

例文編集機能 [ 私 ] は [ 京都 ] に住みたいと思っている. [I] want to live in [Kyoto]. (例) SF で対応づけ したコーパス 日本文を編集して書き換えることで,対応する英文を システムが自動的に変更 (目標) SF で対応づけしたコーパスを用いた名詞単語の置換 最も,置き換えられやすい名詞に着目 東京 Tokyo

名詞部分の対応づけ  英文は単語の語形変化の部分を取り去る  日本文と英文を形態素解析,文節分けして名詞を抽出  日本文の名詞の英語訳を検索 日本語 → Japanese, the Japanese language 使役構文 → × 注意 → attention, concentration  英単語訳の候補と英文と比較し,一致する箇所が存在し, かつ,品詞に名詞を含めば対応づけ (英文は単語の語形変化の部分を取り去る) (例) [ 日本語 ] の [ 使役構文 ] に [ 注意 ] を向けよう。 Note/VB the/DT causative/JJ construction/NN in/IN the/DT Japanese/JJ language/NN. sses → ss , ies → i ss → ss , s → φ

概念の検索 1. 名詞辞書から概念識別子を検索 テニス → 3c0388 バドミントン → 3bdb4f 2. 概念体系辞書から上位概念を検索 3c0388 (テニス) → 30f7db (球技の種目) → 30f7da (競技の種目) → 3f968b → 3bd4f (バドミントン) → 30f7db → 30f7da → 3f968b → 3. 一致する概念識別子が無い場合は,置き換えの際に 警告 [ 私 ] は [ 明日 ][ テニス ] をするつもりだ. バドミントン (例)

英文訂正機能 スペルチェック SpellChecker を利用 cheker ー choker , cheer , checker 文法チェック 冠詞 (a , the) のチェック 3 単元の -e(s) のチェック

英作文の対象は科学技術,政治経済,生 活・文化に関するものなど多様化 英作文の分野タスク,文書構成・内容構成 から対訳例文を分類 分野特有の言い回しを得る 状況に応じた対訳例文を得る 対訳例文コーパスの構築 対訳例文の精度の向上

論文 報告書 仕様書 メール・手紙文 英作文タスク 科学技術 医学 文学・歴史 導入・背景文 主題文ー目的 主題文ー手法説明 主題文ーその他 結果・評価文 考察・結論文 文書構成・内容構成 対訳例文コーパス

システム構築 開発環境: Windows XP Professional 開発言語: Java 2 SDK Version 開発ツール: Jbuilde9 Personal 解析ツール: Cabocha , Monty Tagger , KAKASI DB : Microsoft Access2000 対訳例文コーパス メール,論文で用いられる表現文 ‥‥ 約 3,000 文 EDR の対訳文 ・・・・ 約 17 万文 EDR 電子辞書 名詞辞書 ( 日英単語辞書から名詞単語のみを抽出 ) 概念体系辞書

現状と問題 英作文に参考となる表現文があまり得られな い 支援ツールの作成 実用的な例文の追加 (問題点 ) 分類したデータベースのテーブルを効率よく 検索するプログラムの作成 英文コーパスからの例文検索 データベースから読み込んだ分類ツリーを表示 文字の表示をカラフルに

今後の課題 対訳例文の追加 システムの評価 名詞単語の置換に対する動詞変化への対応 検索語の拡張 英文コーパスの活用

評価方法について 英作文支援ツールを用いて, 10 文前後の英作文をし て貰った後にアンケートを取り評価 対象者:大学生及び大学院生 英作文分野:論文,メール文 アンケート内容 有効な表現文が得られるか 名詞単語の置換機能について ツールの使用感,使いやすさ 用例の分量 システムの応答速度 意見,要望