Download presentation
Presentation is loading. Please wait.
1
逆引き辞書の作成を可能にする 対訳辞書編集システムの構築
東京国際大学 川村よし子
2
逆引き辞書の作成を可能にする 対訳辞書編集システムの構築
1.『チュウ太のWeb辞書』開発の流れ 2.『チュウ太のWeb辞書』の特徴 3. 対訳辞書編集システムの概要 4. 逆引き辞書作成の問題点 5. 逆引き辞書作成を可能にする 対訳辞書編集システムの構築 6. 対訳辞書の活用
3
研究の目的 目的:『逆引き辞書の作成を可能にする 対訳辞書編集システムの構築』を行う どうして電子辞書の需要があるのか。
目的:『逆引き辞書の作成を可能にする 対訳辞書編集システムの構築』を行う どうして電子辞書の需要があるのか。 どうして対訳辞書(ミニ辞書)が必要なのか。 辞書はいつどこで使いたいのか。 どうして逆引き辞書(ミニ辞書の逆引き)が必要なのか。 辞書は誰が何のために使うのか。
4
1.『チュウ太のWeb辞書』開発の流れ 日本語読解学習支援システム『リーディング・チュウ太』 多言語版日本語辞書『チュウ太のWeb辞書』
◎2003年から編集開始 ◎旧日本語能力試験出題基準の単語(8600語) ◎ロシア語・ベトナム語・英語・スロヴェニア語で完成 ◎ハンガリー語もほぼ完成 ◎25以上の言語で編集が進行中 ◎インドネシア語・タガログ語・中国語(簡体字・繁体字) 韓国語・フランス語・スペイン語・タイ語 ⇒1語1訳辞書を搭載 ◎介護語彙を追加:インドネシア語・タガログ語・英語 ◎工学関係の専門辞書を追加:日越・日英 ⇒辞書は『日越工学用語辞典』 ◎逆引き対訳辞書の作成 日泰英・日越英対訳辞書⇒タイ日英・ベトナム日英辞書
5
2.『チュウ太のWeb辞書の特徴 ①辞書情報(複数の言語版を同時表示可) 見出し語・読み・意味・用法・レベル 初級動詞には活用形も表示 ②単語の語義ごとに例文(慣用表現にも対応) ③辞書ツール機能 ④単語検索機能 / 例文検索機能 ⑤ふりがな機能 ⑥単語レベル表示機能(語彙チェッカー) ⑦アクセラレータ機能
6
☑ ☑ ☑
7
チュウ太のWeb辞書の結果画面
8
チュウ太のWeb辞書の結果画面
9
チュウ太のWeb辞書の結果画面
15
「チュウ太のWeb辞書」の単語検索機能 単語を入力すれば、辞書項目を表示 「*」で、前方一致・後方一致の検索も可能
「*単語*」を使えば、例文検索も可能 半角アステリスク ** で単語を挟む
17
アステリスク(*)の活用法 *生 と入力した場合・・・ 生* と入力した場合・・・ さらに… 他の単語の「生」で始まる例文も検索可能
*生 と入力した場合・・・ 生、学生、先生、留学生、写生、誕生 etc. 生* と入力した場合・・・ 生徒、生まれる、生活、生憎、生産 etc. さらに… 他の単語の「生」で始まる例文も検索可能
20
☑
21
ふりがな機能を使った結果画面
22
☑
25
3.対訳辞書編集システムの概要 対訳辞書編集システム開発の目的 複数の編集者による対訳辞書作成が可能
Web経由で辞書ファイルのダウンロードが可能 Web経由で編集済みファイルのアップロードが可能 + 共通部分は多言語とは別に適宜編集可能
27
ダウンロードした多言語用辞書ファイル
28
訳語を入力した辞書ファイル
34
校正用の辞書ファイル a
37
4.逆引き辞書作成の問題点 ①サ変動詞・形容動詞 元の辞書の見出し語は語幹のみを出していた ⇒名詞形で入力される場合と動詞・形容詞が入力される 場合が生じていた ②多義語 1語1訳を基本としていたが、複数の意味がある場合、 「/(半角スラッシュ)」で区切って併記していた ⇒逆引きにした場合、日本語見出し語が必ずしも本義と ならないケースが生じる 間 space/interval 合う to match/to harmonize/to fit 明るい bright/cheerful/be familiar with
38
4.逆引き辞書作成を可能にする 対訳辞書編集システムの構築
4.逆引き辞書作成を可能にする 対訳辞書編集システムの構築 ①サ変動詞・形容動詞 元の辞書の見出し語は語幹のみを出していた ⇒見出し語として、語幹だけでなく「する」「な」を付与 した形を収録する ②多義語 ⇒複数の意味がある場合、意味の違いを( )内に示す 間(場所) space 間(期間) interval 合う(一致する) to match 合う(調和する) to harmonize 合う(フィットする) to fit 明るい bright 明るい(性格) cheerful 明るい(よく知っている)be familiar with
39
逆引きを配慮した対訳作成リスト(一部)
41
ダウンロードファイル
42
ダウンロードした対訳作成リスト(一部)
43
対訳リスト作成のルール 【1】「日本語見出し語」の語が不要の場合、あるいは、あてはまる訳語が存在しない場合、備考欄に「×」印を入れる。
【2】見出し語の変更が必要な場合も備考欄に記入する。 【3】原則として、1語-1訳とする。 訳す際に複数の語が必要となる場合は、新たに見出し語を 立て、( )で区別するための説明を加える。 例: 【4】まったく同じ意味で複数の訳語がある場合は、例外的に 「/」(半角スラッシュ)で区切って訳語欄に記入。
44
ダウンロードした対訳作成リスト(一部)
50
5.対訳辞書の活用 逆引き辞書の編集が可能な対訳辞書は、マレー語およびインドネシア語で編集中
完成した日マレー英、日インドネシア英を元に、逆引き辞書を作成予定 完成後、『チュウ太のWeb辞書』に逆引き辞書も搭載し 両方向から対訳辞書が引ける形にする予定 その他・・・ ネットに依存しない形の対訳辞書としての活用 ・紙辞書 ・電子辞書 逆引き辞書の編集が可能な対訳辞書の編集者を募集中!
51
謝辞 本研究の一部は、平成26年度科学研究費基盤(B)課題番号15H03219によるものである。 対訳辞書編集システムの開発に関しては、
筑波大学の川上大樹氏・小林秀和氏の協力を 得た。 各辞書の開発は、チュウ太プロジェクトメンバーとの連携によるものである。 ここに記して感謝の意を表する。
52
参考文献 川村よし子(2009)『チュウ太の虎の巻』くろしお出版
工藤拓(2006) MeCab: Yet Another Part-of-Speech and Morphological Analyzer,
53
ご清聴ありがとうございました。 今後もいろいろな方々との連携を進め、 より多くの方に役立つツールにしていきたい と考えています。
Similar presentations
© 2024 slidesplayer.net Inc.
All rights reserved.