鳥取大学大学院工学研究科 展瑜 徳久雅人 池原悟 村上仁一

Similar presentations


Presentation on theme: "鳥取大学大学院工学研究科 展瑜 徳久雅人 池原悟 村上仁一"— Presentation transcript:

1 鳥取大学大学院工学研究科 展瑜 徳久雅人 池原悟 村上仁一
日中機械翻訳における 名詞訳語の選択 鳥取大学大学院工学研究科  展瑜 徳久雅人 池原悟 村上仁一

2 研究の背景 ●機械翻訳の問題:名詞の訳語選択 例:あんなに働いてよく体が続くものだ ●従来の方法:
 <身体><体格>・・・<体力> ●従来の方法: 日英翻訳の場合:意味属性による翻訳方式 「結合価文法による動詞と名詞の訳語選択能力の評価」(金出地 2003) 例:彼は友人を家まで送った.  訳語候補 ●本研究の考え:日中翻訳において名詞訳語選択 具体 「家族」    family 「居住施設」 house 「家屋」     house 具体物 場所 家族 居住施設 家屋

3 目   的 日本語の基本名詞に対して訳語の多義構造 日中翻訳における「意味属性体系」の 識別能力 日中機械翻訳のための意味属性体系の提案

4 日本語基本名詞の訳語の多義構造 ●対 象: IPALの基本名詞1,081語
情報処理振興事業協会技術センター 1996」 ●使用辞典: 日中辞典 「北京・対外経済貿易大学と商務印 書館及び日本小学館の共同編集 1987」 ●出力データ:「対応表」

5 ●日本語基本名詞の中国語訳語多義分布           (対象:1081語基本名詞) 最大多義数:30, 多義:60%の基本名詞

6 ●日英中の結果と比較 IPAL辞書 (日本語) ALT辞書 (英語) 日中辞典 (中国語) 平均多義数 2.13 1.88 2.6
(1,081語の多義について) IPAL辞書 (日本語) ALT辞書 (英語) 日中辞典 (中国語) 平均多義数 2.13 1.88 2.6 最大多義数 18 12 30 例:「手」の多義:    30 日、英の結果:「日英機械翻訳における名詞の訳語選択」(桐沢 2000)

7 意味属性の語義識別能力 运动服 ●意味属性による訳語選択 単語の「意味的用法」が分かれば,その単語がどの
  単語の「意味的用法」が分かれば,その単語がどの 語義で使用されたか判断できる可能性がある  見出し語      意味属性      訳語語義    例文       訳し分け可能 树木 木头 梆子 樹木 材木 楽器 木を植える 木で造った家 木を入れる スポーツ着 制服 仕事着   运动服        衣服        制服            工作服       訳し分け不可能 ユニフォーム

8 ●日中において既存意味属性の適用性 意味属性体系の量的な有効性 意味属性が対応しない訳語があるか 対応する数 件数 割合
(対象:1081語基本名詞) 意味属性が対応しない訳語があるか 対応する数 件数 割合 全ての訳語に意味属性が対応 1対1で対応 531 49.6% 重複し対応 108 10.1% 意味属性の対応しない訳語がある 意味属性が1つ不足 172 16.1% 意味属性が2つ不足 100 9.3% 意味属性が3つ不足 60 5.6% 4つ以上不足 98 9.2% 問題あり

9 訳語の多義から見た名詞の分類 (対象:多義を持つ見出し語,638語) 問題あり

10 ●考   察 中国語は語義が広い 意味属性の粒度が不適切 原因 訳語が他の品詞 対応する意味属性がなし 意味の包含関係の差

11 日中翻訳のための意味属性体系 意味属性の拡張 ●既存の意味属性の再配置 (252語) 既存意味 属性体系
●既存の意味属性の再配置 (252語)        例:見出し語 意味属性 訳語語義 拡張した意味属性 594  手 手 1035 方法 手段 手 1166 権利 归……所有 592  腕 臂 - 手掌 596 手のひら - 笔迹 筆跡 - 手指头 手の指 ・ ・ ・ ・ ・ ・ -      (手里的)棋子[牌] 921 遊び道具・運動具 既存意味 属性体系

12 ●意味属性の細分類 (48語) 例:日本語 意味属性 中国語 鳥 「538 鳥」 鸟 鸡 <鸟> 雀,烏等 <鸡> 鶏,家鴨等 536
●意味属性の細分類 (48語) 例:日本語 意味属性 中国語 鳥 「538 鳥」 鸟 536  動物 538 鳥 538.1 鳥<野禽類> 538.2 鳥<家禽類> 537  538 鳥 <鸟> 雀,烏等 <鸡> 鶏,家鴨等

13 ●新しい意味属性の追加 (10語) 686 植物(部分) 687 芽・苗 690 根 ・・・・・・ 697 花 700 実・種子・穂
●新しい意味属性の追加 (10語) 686 植物(部分)  687 芽・苗  690 根  ・・・・・・ 697 花                  700 実・種子・穂  704 樹皮・果皮  705 細胞 例: 686 植物(部分)  ・・・・・・  697 花                    700 実・種子・穂  704 樹皮・果皮  704zy 木質部 (追加した意味属性)  705 細胞 図:木の断面図

14 ●意味属性を拡張した効果     意味属性の量的な有効性 (対象:1081語基本名詞) 問題あり

15 訳語の多義から見た名詞の分類 (対象:多義を持つ見出し語,638語) 問題あり
     (対象:多義を持つ見出し語,638語) 問題あり 日英割合:「日英機械翻訳における名詞の訳語選択」(桐沢 2000)

16 まとめ ●日中翻訳において意味的用法による名詞の 訳語選択 結果: 訳語が一意に決まる場合 ●結論: 日中翻訳にも「意味属性体系」が有効
日英のための意味属性体系を日中に適用 拡張すべき点を考察 拡張を行い,訳し分けの効果を確認   結果: 訳語が一意に決まる場合     全単語1,081語の場合:  49% 71%     多義のある638語の場合:15.5% 59.5% ●結論: 日中翻訳にも「意味属性体系」が有効


Download ppt "鳥取大学大学院工学研究科 展瑜 徳久雅人 池原悟 村上仁一"

Similar presentations


Ads by Google