逆引き辞書の作成を可能にする 対訳辞書編集システムの構築 東京国際大学 川村よし子
逆引き辞書の作成を可能にする 対訳辞書編集システムの構築 1.『チュウ太のWeb辞書』開発の流れ 2.『チュウ太のWeb辞書』の特徴 3. 対訳辞書編集システムの概要 4. 逆引き辞書作成の問題点 5. 逆引き辞書作成を可能にする 対訳辞書編集システムの構築 6. 対訳辞書の活用
研究の目的 目的:『逆引き辞書の作成を可能にする 対訳辞書編集システムの構築』を行う どうして電子辞書の需要があるのか。 目的:『逆引き辞書の作成を可能にする 対訳辞書編集システムの構築』を行う どうして電子辞書の需要があるのか。 どうして対訳辞書(ミニ辞書)が必要なのか。 辞書はいつどこで使いたいのか。 どうして逆引き辞書(ミニ辞書の逆引き)が必要なのか。 辞書は誰が何のために使うのか。
1.『チュウ太のWeb辞書』開発の流れ 日本語読解学習支援システム『リーディング・チュウ太』 多言語版日本語辞書『チュウ太のWeb辞書』 ◎2003年から編集開始 ◎旧日本語能力試験出題基準の単語(8600語) ◎ロシア語・ベトナム語・英語・スロヴェニア語で完成 ◎ハンガリー語もほぼ完成 ◎25以上の言語で編集が進行中 ◎インドネシア語・タガログ語・中国語(簡体字・繁体字) 韓国語・フランス語・スペイン語・タイ語 ⇒1語1訳辞書を搭載 ◎介護語彙を追加:インドネシア語・タガログ語・英語 ◎工学関係の専門辞書を追加:日越・日英 ⇒辞書は『日越工学用語辞典』 ◎逆引き対訳辞書の作成 日泰英・日越英対訳辞書⇒タイ日英・ベトナム日英辞書
2.『チュウ太のWeb辞書の特徴 ①辞書情報(複数の言語版を同時表示可) 見出し語・読み・意味・用法・レベル 初級動詞には活用形も表示 ②単語の語義ごとに例文(慣用表現にも対応) ③辞書ツール機能 ④単語検索機能 / 例文検索機能 ⑤ふりがな機能 ⑥単語レベル表示機能(語彙チェッカー) ⑦アクセラレータ機能
☑ ☑ ☑
チュウ太のWeb辞書の結果画面
チュウ太のWeb辞書の結果画面
チュウ太のWeb辞書の結果画面
「チュウ太のWeb辞書」の単語検索機能 単語を入力すれば、辞書項目を表示 「*」で、前方一致・後方一致の検索も可能 「*単語*」を使えば、例文検索も可能 半角アステリスク ** で単語を挟む
アステリスク(*)の活用法 *生 と入力した場合・・・ 生* と入力した場合・・・ さらに… 他の単語の「生」で始まる例文も検索可能 *生 と入力した場合・・・ 生、学生、先生、留学生、写生、誕生 etc. 生* と入力した場合・・・ 生徒、生まれる、生活、生憎、生産 etc. さらに… 他の単語の「生」で始まる例文も検索可能
☑
ふりがな機能を使った結果画面
☑
3.対訳辞書編集システムの概要 対訳辞書編集システム開発の目的 複数の編集者による対訳辞書作成が可能 Web経由で辞書ファイルのダウンロードが可能 Web経由で編集済みファイルのアップロードが可能 + 共通部分は多言語とは別に適宜編集可能
ダウンロードした多言語用辞書ファイル
訳語を入力した辞書ファイル
校正用の辞書ファイル a
4.逆引き辞書作成の問題点 ①サ変動詞・形容動詞 元の辞書の見出し語は語幹のみを出していた ⇒名詞形で入力される場合と動詞・形容詞が入力される 場合が生じていた ②多義語 1語1訳を基本としていたが、複数の意味がある場合、 「/(半角スラッシュ)」で区切って併記していた ⇒逆引きにした場合、日本語見出し語が必ずしも本義と ならないケースが生じる 間 space/interval 合う to match/to harmonize/to fit 明るい bright/cheerful/be familiar with
4.逆引き辞書作成を可能にする 対訳辞書編集システムの構築 4.逆引き辞書作成を可能にする 対訳辞書編集システムの構築 ①サ変動詞・形容動詞 元の辞書の見出し語は語幹のみを出していた ⇒見出し語として、語幹だけでなく「する」「な」を付与 した形を収録する ②多義語 ⇒複数の意味がある場合、意味の違いを( )内に示す 間(場所) space 間(期間) interval 合う(一致する) to match 合う(調和する) to harmonize 合う(フィットする) to fit 明るい bright 明るい(性格) cheerful 明るい(よく知っている)be familiar with
逆引きを配慮した対訳作成リスト(一部)
ダウンロードファイル
ダウンロードした対訳作成リスト(一部)
対訳リスト作成のルール 【1】「日本語見出し語」の語が不要の場合、あるいは、あてはまる訳語が存在しない場合、備考欄に「×」印を入れる。 【2】見出し語の変更が必要な場合も備考欄に記入する。 【3】原則として、1語-1訳とする。 訳す際に複数の語が必要となる場合は、新たに見出し語を 立て、( )で区別するための説明を加える。 例: 【4】まったく同じ意味で複数の訳語がある場合は、例外的に 「/」(半角スラッシュ)で区切って訳語欄に記入。
ダウンロードした対訳作成リスト(一部)
5.対訳辞書の活用 逆引き辞書の編集が可能な対訳辞書は、マレー語およびインドネシア語で編集中 完成した日マレー英、日インドネシア英を元に、逆引き辞書を作成予定 完成後、『チュウ太のWeb辞書』に逆引き辞書も搭載し 両方向から対訳辞書が引ける形にする予定 その他・・・ ネットに依存しない形の対訳辞書としての活用 ・紙辞書 ・電子辞書 逆引き辞書の編集が可能な対訳辞書の編集者を募集中! yoshiko@chuta.jpまでご連絡ください。お待ちしています。
謝辞 本研究の一部は、平成26年度科学研究費基盤(B)課題番号15H03219によるものである。 対訳辞書編集システムの開発に関しては、 筑波大学の川上大樹氏・小林秀和氏の協力を 得た。 各辞書の開発は、チュウ太プロジェクトメンバーとの連携によるものである。 ここに記して感謝の意を表する。
参考文献 川村よし子(2009)『チュウ太の虎の巻』くろしお出版 工藤拓(2006) MeCab: Yet Another Part-of-Speech and Morphological Analyzer, http://mecab.sourceforge.net
ご清聴ありがとうございました。 今後もいろいろな方々との連携を進め、 より多くの方に役立つツールにしていきたい と考えています。