東京工科大学 コンピュータサイエンス学部 亀田弘之

Slides:



Advertisements
Similar presentations
自然言語処理 平成 24 年 11 月 5 日 (No5)- 東京工科大学 コンピュータサイエンス学部 亀田弘之.
Advertisements

Windows Azure ハンズオン トレーニング Windows Azure Web サイト入門.
東京工科大学 コンピュータサイエンス学部 亀田弘之
英語勉強会.
STEP 2 ノート・テイキングのサンプル.
ソフトウェアとネットワーク、自由な社会 g新部 裕.
東京工科大学 コンピュータサイエンス学部 亀田弘之
Super-Functionに基づく日英機械翻訳
東京工科大学 コンピュータサイエンス学部 亀田弘之
How to Become a Supply Chain Analyst with Free
THE PLAIN FORM An Adventure in verbs.
東京工科大学 コンピュータサイエンス学部 亀田弘之
Delphi Day ~Delphi 概要、および新バージョンのご紹介~
Let’s discuss in English! What are your opinions? Let’s discuss it!
東京工科大学 コンピュータサイエンス学部 亀田弘之
Reasonので + Consequence clause
CRLA Project Assisting the Project of
自然言語処理2014(3回目) Natural Language Processing 2014
日本語解析済みコーパス管理ツール 「茶器」
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学大学院 バイオニクス・情報メディア学専攻科 担当: 亀田 弘之
東京工科大学コンピュータサイエンス学部 亀田弘之
機械翻訳勉強会 NTCIR-7について 2007年10月16日 奈良先端大D1小町守.
Microsoft Visual Studio 2005 Tools for
東京工科大学 コンピュータサイエンス学部 亀田弘之
情報源:MARA/ARMA 加 工:成田空港検疫所 菊池
自然言語処理2016 -平成28年11月7日・14日(No.6&7)-
自然言語処理2011(3回目) Natural Language Processing 2011
WELCOME TO THE WORLD OF DRAGON BALL
Where is Wumpus Propositional logic (cont…) Reasoning where is wumpus
第24回応用言語学講座公開連続講演会 後援:国際言語文化研究科教育研究プロジェクト経費
東京工科大学大学院 バイオニクス・情報メディア学専攻科 担当: 亀田 弘之
金沢大学ハノイ事務所 医薬保健学域連絡事務所
自然言語処理2013(3回目) Natural Language Processing 2013
半構造化テキストに対する 文字列照合アルゴリズム
東京工科大学 コンピュータサイエンス学部 亀田弘之
自然言語処理2015(3回目) Natural Language Processing 2015
自然言語処理2010(3回目) Natural Language Processing 2010
名古屋大学大学院国際原語文化研究科 第46回日本語教育学講座講演会
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
データ圧縮技術による文字列照合処理の高速化に関する研究
自然言語処理2016(3回目) Natural Language Processing 2016
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 担当 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
The Facilitative Cues in Learning Complex Recursive Structures
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
JEFFREY WITZEL (University of Texas at Arlington, USA)
平成28年4月11日(月) 東京工科大学 コンピュータサイエンス学部 担当教員:亀田弘之
自然言語処理2015 Natural Language Processing 2015
東京工科大学 コンピュータサイエンス学部 担当 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
形態素解析と構文解析 金子邦彦.
形式言語とオートマトン Formal Languages and Automata 第5日目
自然言語処理2016 Natural Language Processing 2016
mi-8. 自然言語処理 人工知能を演習で学ぶシリーズ(8)
アノテーションガイドラインの管理を行う アノテーションシステムの提案
Improving Strategic Play in Shogi by Using Move Sequence Trees
1.2 言語処理の諸観点 (1)言語処理の利用分野
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
Presentation transcript:

東京工科大学 コンピュータサイエンス学部 亀田弘之 自然言語処理2016 No.13 東京工科大学 コンピュータサイエンス学部 亀田弘之

今日の内容(各種ツール紹介) テキスト処理 形態素解析 統語解析 機械翻訳 OpenNLP(http://opennlp.apache.org/) Python+NLTK(http://www.nltk.org) 形態素解析 Juman Chasen MeCab 統語解析 OpenNLP 機械翻訳 東京工科大学コンピュータサイエンス学部

openNLP The Apache OpenNLP library is a machine learning based toolkit for the processing of natural language text. It supports the most common NLP tasks, such as tokenization, sentence segmentation, part-of-speech tagging, named entity extraction, chunking, parsing, and coreference resolution. These tasks are usually required to build more advanced text processing services. OpenNLP also includes maximum entropy and perceptron based machine learning. 東京工科大学コンピュータサイエンス学部

NLTK NLTK is a leading platform for building Python programs to work with human language data. It provides easy-to-use interfaces to over 50 corpora and lexical resources such as WordNet, along with a suite of text processing libraries for classification, tokenization, stemming, tagging, parsing, and semantic reasoning. 東京工科大学コンピュータサイエンス学部

NLTK(2) Thanks to a hands-on guide introducing programming fundamentals alongside topics in computational linguistics, NLTK is suitable for linguists, engineers, students, educators, researchers, and industry users alike. NLTK is available for Windows, Mac OS X, and Linux. Best of all, NLTK is a free, open source, community-driven project. NLTK has been called “a wonderful tool for teaching, and working in, computational linguistics using Python,” and “an amazing library to play with natural language.” 東京工科大学コンピュータサイエンス学部

機械翻訳(MachineTranslation;MT) 東京工科大学コンピュータサイエンス学部

歴史(概略) コンピュータ発明当初から研究された その後、ALPACレポートにより実用性が否定(研究が下火) 質問応答システムの研究が別に進行 積み木の世界システム(SHRDLU)によりAI研究活性化 各種翻訳手法の提案・研究 Web等の電子化テキストが大量に出現 用例に基づく翻訳 統計的機械翻訳 => 深層学習による翻訳手法 (まだまだ解決すべき問題は多い) 東京工科大学コンピュータサイエンス学部

機械翻訳とは 全自動翻訳 翻訳支援システム 翻訳補助システム 手作業による翻訳 東京工科大学コンピュータサイエンス学部

機械翻訳とは 全自動翻訳 翻訳支援システム 翻訳補助システム 手作業による翻訳 前編集(pre-edit)と後編集(post-edit) 電子辞書 文法チェック ワープロ(翻訳文書の清書) など 手作業による翻訳 大昔のやり方 東京工科大学コンピュータサイエンス学部

機械翻訳処理方式の種類 トランスファー(transfer)方式 ピボット(pivot)方式(あるいは、中間言語方式) 図.機械翻訳の解析/生成のトライアングル (出典) http://blogo.ermitejo.com/wp-content/uploads/2009/01/mt_triangulo1.png 東京工科大学コンピュータサイエンス学部

機械翻訳システムの例 Google翻訳 Yahoo!翻訳 エキサイト翻訳 Nifty翻訳 ATLAS LogoVista UNL (http://www.undl.org/) (国連の特許第一号) 東京工科大学コンピュータサイエンス学部

翻訳方式の1例紹介 + a b a + b + a b a b + 東京工科大学コンピュータサイエンス学部

機械翻訳の課題 (各自で考えてみよう) 東京工科大学コンピュータサイエンス学部

そもそも機械翻訳の用途は? (価値あるニーズを考えてみよう) 東京工科大学コンピュータサイエンス学部

人工無脳について AIML(Artificial Intelligence Markup Language) Watson(IBM) 参考URL http://alice.pandorabots.com/ Watson(IBM) 参考URL https://www.ibm.com/smarterplanet/jp/ja/ibmwatson/ 東京工科大学コンピュータサイエンス学部

以上で,今日はおしまいです. 次回は1月16日(月)1限です. 次回は、追加の話題、総復習および定期試験対 策講座(確認)です。 試験対策問題を配りますので,出席してください。 東京工科大学コンピュータサイエンス学部