逆引き辞書の作成を可能にする 対訳辞書編集システムの構築

Slides:



Advertisements
Similar presentations
多言語版「チュウ太の web 辞 書」を用いた語彙学習 川村よし子 東京国際大学 共同研究者 金庭久美子・前田ジョイス・保原麗・川村ヒ サオ 各言語版辞書編集グループ.
Advertisements

英作文支援システムの 構築に関する研究 平成 15 年 11 月 18 日 ( 火 ) A1 グループ M2 永易 稔 中間発表.
Word で XML マニュアルを編集 し、 XML を自動組版する 1. XML の自動組版概要 2. Word での原稿入力 アンテナハウス株式会社 2004/09/03.
コーパス言語学実践 2006 年度 2 学期 第 2 回. 2 本日の内容 前半の作業について – 語彙調査の演習 – 用語の説明 語彙,単位語,延べ語,異なり語,見出し 語 作成作業 その1 – データ収集開始.
卒業論文審査会 Web の読みやすさ実験ツールの開発 岩手県立大学 ソフトウェア情報学部 ソフトウェア情報学部 4 年 柴田 大樹 指導教員:鈴木克明 藤原康宏 市川尚.
日本語 WWW 情報を用いた COCET3300 英単語学習支援に関する研究 情報・知能工学専攻 博士前期課程2年 渡邉 雄大 指導教員 河合 和久.
学事予算の支出状況表作成に 係る業務の効率化 教学部 高輪教学課 加藤美博. 目 次 ①背景 ②財務情報システムの現状 ③これまでの取り組み ④新たな改善事項 ⑤効果.
システム案内.
F5 を押すか、または [スライド ショー] > [最初から] をクリックして、コースを開始してください。
NDL-OPAC 国立国会図書館 Webcat PLUS 国立情報学研究所 Books 日本書籍出版協会
オートデスク・コラボレーション・サービス オートデスク株式会社
LZ符号化 森田 岳史.
電子書籍を さがす どんな書籍があるの? Maruzen eBook Libraryは、学術機関向け和書の電子書籍提供サービスです。
④CiNii ⑤NDL-OPAC(雑誌記事) ⑥日経BP
WEBから確認できる 駐車場管理システムについて
情報処理基礎 2006年 6月 1日.
電子書籍を さがす どんな書籍があるの?
デジタルポートフォリオ作成支援ツール PictFolio 使用マニュアル
「サイボウズ Office on cybozu.com」 すぐできるBOOK -ワークフロー 編 -
JavaによるCAI学習ソフトウェアの開発
文献管理ソフトRefWorksの利用 2009.
Fiery Color Profiler Suite v4.7
図書DBの使用方法 NDL-OPAC 国立国会図書館 Webcat PLUS 国立情報学研究所 Books 日本書籍出版協会
オンライン英単語・リスニング 学習ソフト 佐々木研究室 N02k1114 北隅 麻実.
欧州評議会から外国語教室にいた るまで…『言語・文化への多元的ア プローチ』への長い道のり (1)
チュートリアル EBSCOhost での記事の閲覧 support.ebsco.com.
文献管理ソフトRefWorksの利用.
ノンプログラマのための Selenium de DDT はじめの一歩
共同ローカリゼーション フレームワーク 井上 謙次.
DixChange プロジェクト ~辞書共通化の試み~
イメージポスターを作ろう! 高校2年 情報選択②.
EBSCOhost 詳細検索 チュートリアル support.ebsco.com.
日本語読解支援システム 『リーディング・チュウ太』の 難易度判定ツール
技術者英語 対象: 電気電子システム工学科 2年生 時限: 前期 水曜日 Ⅳ限 担当: 武藤 真三、本間 聡
佐賀わいわいWi-Fiマップ 防災 減災 少子 高齢 産業 創出 佐賀わいわいWi-Fiマップ 誕生の キッカケ
データベース設計 データベース設計 第0回 オリエンテーション 坂口利裕.
「東京の観光」ホームページ 資   料 Medians Free.
(メール添付・ファイルアップサービス等)
平成22年6月15日 図書系職員のための アプリケーション開発講習会
オントロジーを使用した プログラム開発支援システムの提案
練習問題アイテムバンクの開発研究 ~再生形式~
JST/中国総合研究センターの活動紹介 ~日中の科学技術分野における相互理解促進のための基盤~
文献の整理術 ―文献管理ソフトを使ってみよう―!
Office IME 2010 を使う.
識別子の命名支援を目的とした動詞-目的語関係の辞書構築
プロセス.
IOTA管理ファイル画面 P-1 TX90IARU(FK、162)のコールサインを検索の例 ・検索 ・テキスト欄記載内容を検索
この項は 『日本語構造伝達文法(05版)』 の第30章,第31章の内容に基づいています。より詳しくはその章をお読みください。
イメージポスターを作ろう! 情報C 課題.
すぐできるBOOK -基本設定編-.
単語登録(1) ◎MS-IMEの「単語登録」に、単語、語句、記号など自分がよく使うものを登録しておくと、便利である。
【e-Rad】担当者用 平成24年度公募(三次) 新規公募(三次)設定 操作説明 (3月29日修正版)
湘南工科大学 2013年10月8日 プログラミング基礎1 湘南工科大学情報工学科 准教授 小林 学.
海外のお客様とのコミュニケーションが可能!
<日本語教育とAI:研究実践例と今後の課題 > 読解支援システムへのAI活用の可能性と留意点
Maruzen eBook Libraryは、学術機関向け和書の電子書籍提供サービスです。 rev 電子書籍を さがす
Maruzen eBook Libraryは、学術機関向け和書の電子書籍提供サービスです。 rev 電子書籍を さがす
コンピュータ プレゼンテーション.
★CD-ROMを使った情報検索 瞬時に検索できる! ★電子文字化されたデータを使いレポートを仕上げる 電子文字は加工が容易!
『GoNET-SR 機能一覧』 2017年04月 アイビーソリューション株式会社 Ver 3.4.
Firebaseを用いた 位置情報共有システム
コンピュータにログイン 第1章 コンピュータにログイン 啓林館 情報A最新版 (p.6-13)
設計情報の再利用を目的とした UML図の自動推薦ツール
大規模コーパスに基づく同義語・多義語処理
情報検索演習:第4回 前回の配布資料: 教室の前方のカサ立てにある パソコンを起動したさいに入力する 氏名に 「時限-学籍番号-名前」
Unit 6 Part 3 教科書 p.54~55 I, you以外の単数の人やもの について「…しません」と 説明するときの言い方を
Googleマップを活用した 生物調査データベースの構築
第7回 Q&A メール講座 Next Stage:翻訳力アップ自己トレ(1)
医療科学B演習のおさらい 杏林大学医学図書館 医療科学B.
単語登録(1) ◎MS-IMEの「単語登録」に、単語、語句、記号など自分がよく使うものを登録しておくと、便利である。
Presentation transcript:

逆引き辞書の作成を可能にする 対訳辞書編集システムの構築 東京国際大学  川村よし子

逆引き辞書の作成を可能にする 対訳辞書編集システムの構築 1.『チュウ太のWeb辞書』開発の流れ 2.『チュウ太のWeb辞書』の特徴 3. 対訳辞書編集システムの概要 4. 逆引き辞書作成の問題点 5. 逆引き辞書作成を可能にする     対訳辞書編集システムの構築 6. 対訳辞書の活用

研究の目的 目的:『逆引き辞書の作成を可能にする 対訳辞書編集システムの構築』を行う どうして電子辞書の需要があるのか。 目的:『逆引き辞書の作成を可能にする     対訳辞書編集システムの構築』を行う どうして電子辞書の需要があるのか。 どうして対訳辞書(ミニ辞書)が必要なのか。   辞書はいつどこで使いたいのか。 どうして逆引き辞書(ミニ辞書の逆引き)が必要なのか。   辞書は誰が何のために使うのか。

1.『チュウ太のWeb辞書』開発の流れ 日本語読解学習支援システム『リーディング・チュウ太』 多言語版日本語辞書『チュウ太のWeb辞書』 ◎2003年から編集開始  ◎旧日本語能力試験出題基準の単語(8600語)  ◎ロシア語・ベトナム語・英語・スロヴェニア語で完成  ◎ハンガリー語もほぼ完成  ◎25以上の言語で編集が進行中  ◎インドネシア語・タガログ語・中国語(簡体字・繁体字) 韓国語・フランス語・スペイン語・タイ語 ⇒1語1訳辞書を搭載  ◎介護語彙を追加:インドネシア語・タガログ語・英語    ◎工学関係の専門辞書を追加:日越・日英    ⇒辞書は『日越工学用語辞典』  ◎逆引き対訳辞書の作成    日泰英・日越英対訳辞書⇒タイ日英・ベトナム日英辞書

2.『チュウ太のWeb辞書の特徴 ①辞書情報(複数の言語版を同時表示可) 見出し語・読み・意味・用法・レベル 初級動詞には活用形も表示 ②単語の語義ごとに例文(慣用表現にも対応) ③辞書ツール機能 ④単語検索機能 / 例文検索機能 ⑤ふりがな機能 ⑥単語レベル表示機能(語彙チェッカー) ⑦アクセラレータ機能

☑ ☑ ☑

チュウ太のWeb辞書の結果画面

チュウ太のWeb辞書の結果画面

チュウ太のWeb辞書の結果画面

「チュウ太のWeb辞書」の単語検索機能 単語を入力すれば、辞書項目を表示 「*」で、前方一致・後方一致の検索も可能 「*単語*」を使えば、例文検索も可能 半角アステリスク ** で単語を挟む

アステリスク(*)の活用法 *生 と入力した場合・・・ 生* と入力した場合・・・ さらに… 他の単語の「生」で始まる例文も検索可能 *生    と入力した場合・・・     生、学生、先生、留学生、写生、誕生 etc. 生*   と入力した場合・・・     生徒、生まれる、生活、生憎、生産 etc.     さらに…     他の単語の「生」で始まる例文も検索可能

ふりがな機能を使った結果画面

3.対訳辞書編集システムの概要 対訳辞書編集システム開発の目的 複数の編集者による対訳辞書作成が可能 Web経由で辞書ファイルのダウンロードが可能 Web経由で編集済みファイルのアップロードが可能         + 共通部分は多言語とは別に適宜編集可能

ダウンロードした多言語用辞書ファイル

訳語を入力した辞書ファイル

校正用の辞書ファイル a

4.逆引き辞書作成の問題点 ①サ変動詞・形容動詞 元の辞書の見出し語は語幹のみを出していた ⇒名詞形で入力される場合と動詞・形容詞が入力される 場合が生じていた ②多義語 1語1訳を基本としていたが、複数の意味がある場合、 「/(半角スラッシュ)」で区切って併記していた ⇒逆引きにした場合、日本語見出し語が必ずしも本義と ならないケースが生じる 間 space/interval 合う to match/to harmonize/to fit 明るい bright/cheerful/be familiar with

4.逆引き辞書作成を可能にする 対訳辞書編集システムの構築 4.逆引き辞書作成を可能にする        対訳辞書編集システムの構築 ①サ変動詞・形容動詞 元の辞書の見出し語は語幹のみを出していた ⇒見出し語として、語幹だけでなく「する」「な」を付与 した形を収録する ②多義語 ⇒複数の意味がある場合、意味の違いを( )内に示す 間(場所) space 間(期間) interval 合う(一致する) to match 合う(調和する) to harmonize 合う(フィットする) to fit 明るい bright 明るい(性格) cheerful 明るい(よく知っている)be familiar with

逆引きを配慮した対訳作成リスト(一部)

ダウンロードファイル

ダウンロードした対訳作成リスト(一部)

対訳リスト作成のルール 【1】「日本語見出し語」の語が不要の場合、あるいは、あてはまる訳語が存在しない場合、備考欄に「×」印を入れる。 【2】見出し語の変更が必要な場合も備考欄に記入する。 【3】原則として、1語-1訳とする。   訳す際に複数の語が必要となる場合は、新たに見出し語を   立て、( )で区別するための説明を加える。   例: 【4】まったく同じ意味で複数の訳語がある場合は、例外的に     「/」(半角スラッシュ)で区切って訳語欄に記入。

ダウンロードした対訳作成リスト(一部)

5.対訳辞書の活用 逆引き辞書の編集が可能な対訳辞書は、マレー語およびインドネシア語で編集中 完成した日マレー英、日インドネシア英を元に、逆引き辞書を作成予定 完成後、『チュウ太のWeb辞書』に逆引き辞書も搭載し  両方向から対訳辞書が引ける形にする予定 その他・・・  ネットに依存しない形の対訳辞書としての活用  ・紙辞書  ・電子辞書 逆引き辞書の編集が可能な対訳辞書の編集者を募集中! yoshiko@chuta.jpまでご連絡ください。お待ちしています。

謝辞 本研究の一部は、平成26年度科学研究費基盤(B)課題番号15H03219によるものである。 対訳辞書編集システムの開発に関しては、  筑波大学の川上大樹氏・小林秀和氏の協力を  得た。 各辞書の開発は、チュウ太プロジェクトメンバーとの連携によるものである。  ここに記して感謝の意を表する。

参考文献 川村よし子(2009)『チュウ太の虎の巻』くろしお出版 工藤拓(2006) MeCab: Yet Another Part-of-Speech and Morphological Analyzer,  http://mecab.sourceforge.net

ご清聴ありがとうございました。 今後もいろいろな方々との連携を進め、 より多くの方に役立つツールにしていきたい と考えています。