Download presentation
Presentation is loading. Please wait.
1
鳥取大学大学院工学研究科 展瑜 徳久雅人 池原悟 村上仁一
日中機械翻訳における 名詞訳語の選択 鳥取大学大学院工学研究科 展瑜 徳久雅人 池原悟 村上仁一
2
研究の背景 ●機械翻訳の問題:名詞の訳語選択 例:あんなに働いてよく体が続くものだ ●従来の方法:
<身体><体格>・・・<体力> ●従来の方法: 日英翻訳の場合:意味属性による翻訳方式 「結合価文法による動詞と名詞の訳語選択能力の評価」(金出地 2003) 例:彼は友人を家まで送った. 訳語候補 ●本研究の考え:日中翻訳において名詞訳語選択 具体 「家族」 family 「居住施設」 house 「家屋」 house 人 具体物 場所 家族 居住施設 家屋
3
目 的 日本語の基本名詞に対して訳語の多義構造 日中翻訳における「意味属性体系」の 識別能力 日中機械翻訳のための意味属性体系の提案
4
日本語基本名詞の訳語の多義構造 ●対 象: IPALの基本名詞1,081語
情報処理振興事業協会技術センター 1996」 ●使用辞典: 日中辞典 「北京・対外経済貿易大学と商務印 書館及び日本小学館の共同編集 1987」 ●出力データ:「対応表」
5
●日本語基本名詞の中国語訳語多義分布 (対象:1081語基本名詞) 最大多義数:30, 多義:60%の基本名詞
6
●日英中の結果と比較 IPAL辞書 (日本語) ALT辞書 (英語) 日中辞典 (中国語) 平均多義数 2.13 1.88 2.6
(1,081語の多義について) IPAL辞書 (日本語) ALT辞書 (英語) 日中辞典 (中国語) 平均多義数 2.13 1.88 2.6 最大多義数 18 12 30 例:「手」の多義: 30 日、英の結果:「日英機械翻訳における名詞の訳語選択」(桐沢 2000)
7
意味属性の語義識別能力 运动服 ●意味属性による訳語選択 単語の「意味的用法」が分かれば,その単語がどの
単語の「意味的用法」が分かれば,その単語がどの 語義で使用されたか判断できる可能性がある 見出し語 意味属性 訳語語義 例文 訳し分け可能 树木 木头 梆子 樹木 材木 楽器 木を植える 木 木で造った家 木を入れる スポーツ着 制服 仕事着 运动服 衣服 制服 工作服 訳し分け不可能 ユニフォーム
8
●日中において既存意味属性の適用性 意味属性体系の量的な有効性 意味属性が対応しない訳語があるか 対応する数 件数 割合
(対象:1081語基本名詞) 意味属性が対応しない訳語があるか 対応する数 件数 割合 全ての訳語に意味属性が対応 1対1で対応 531 49.6% 重複し対応 108 10.1% 意味属性の対応しない訳語がある 意味属性が1つ不足 172 16.1% 意味属性が2つ不足 100 9.3% 意味属性が3つ不足 60 5.6% 4つ以上不足 98 9.2% 問題あり
9
訳語の多義から見た名詞の分類 (対象:多義を持つ見出し語,638語) 問題あり
10
●考 察 中国語は語義が広い 意味属性の粒度が不適切 原因 訳語が他の品詞 対応する意味属性がなし 意味の包含関係の差
11
日中翻訳のための意味属性体系 意味属性の拡張 ●既存の意味属性の再配置 (252語) 既存意味 属性体系
●既存の意味属性の再配置 (252語) 例:見出し語 意味属性 訳語語義 拡張した意味属性 594 手 手 1035 方法 手段 手 1166 権利 归……所有 592 腕 臂 - 手掌 596 手のひら - 笔迹 筆跡 - 手指头 手の指 ・ ・ ・ ・ ・ ・ - (手里的)棋子[牌] 921 遊び道具・運動具 既存意味 属性体系
12
●意味属性の細分類 (48語) 例:日本語 意味属性 中国語 鳥 「538 鳥」 鸟 鸡 <鸟> 雀,烏等 <鸡> 鶏,家鴨等 536
●意味属性の細分類 (48語) 例:日本語 意味属性 中国語 鳥 「538 鳥」 鸟 鸡 536 動物 538 鳥 538.1 鳥<野禽類> 538.2 鳥<家禽類> 537 獣 538 鳥 <鸟> 雀,烏等 <鸡> 鶏,家鴨等
13
●新しい意味属性の追加 (10語) 686 植物(部分) 687 芽・苗 690 根 ・・・・・・ 697 花 700 実・種子・穂
●新しい意味属性の追加 (10語) 686 植物(部分) 687 芽・苗 690 根 ・・・・・・ 697 花 700 実・種子・穂 704 樹皮・果皮 705 細胞 例: 686 植物(部分) ・・・・・・ 697 花 700 実・種子・穂 704 樹皮・果皮 704zy 木質部 (追加した意味属性) 705 細胞 図:木の断面図
14
●意味属性を拡張した効果 意味属性の量的な有効性 (対象:1081語基本名詞) 問題あり
15
訳語の多義から見た名詞の分類 (対象:多義を持つ見出し語,638語) 問題あり
(対象:多義を持つ見出し語,638語) 問題あり 日英割合:「日英機械翻訳における名詞の訳語選択」(桐沢 2000)
16
まとめ ●日中翻訳において意味的用法による名詞の 訳語選択 結果: 訳語が一意に決まる場合 ●結論: 日中翻訳にも「意味属性体系」が有効
日英のための意味属性体系を日中に適用 拡張すべき点を考察 拡張を行い,訳し分けの効果を確認 結果: 訳語が一意に決まる場合 全単語1,081語の場合: 49% 71% 多義のある638語の場合:15.5% 59.5% ●結論: 日中翻訳にも「意味属性体系」が有効
Similar presentations
© 2025 slidesplayer.net Inc.
All rights reserved.