音声認識・翻訳 Android アプリケーション制作

Slides:



Advertisements
Similar presentations
特別支援教育で使える PowerPoint の活用法 研修 最低限必要なスキルはこれでバッチリ!! ICT 活用支援員 高松 崇.
Advertisements

情報アプリケーション1 2006 年 10 月 12 日 第四回資料 担当 重定 如彦. 目次 データの送信とフォーム クイズ CGI 複数のパーツのデータの分割方法 配列変数.
1 なんとなく Ajax ~新しくて古い XMLHttp 川合孝典 (Kansai.pm) 2005/5/22.
プレゼンテーションからホームページ作成まで 情報システム入門 A 総合情報センター 非常勤講師 :中山 進.
情報科学部 ディジタルメディア学科 佐々木研究室 n02k1118 流石 寛子
F5 を押すか、または [スライド ショー] > [最初から] をクリックして、コースを開始してください。
ウェブページビルダーマニュアル 株式会社 SOIYAA.
Microsoft Office 2010 クイックガイド ~OneNote編~
企画書作成ソフトウェアの開発 佐々木研究室 05k1134 吉村祥平.
3次元nクイーン問題の 解に関する研究 論理工学研究室 伊藤精一
プレゼンテーションからホームページ作成まで
情報処理実習 第05回 Excelマクロ機能入門 操作マクロ入門.
TV会議 セットと使用法 神奈川技術士会
Microsoft PowerPoint98 Netscape Communicator 4.06[ja]
コンピュータ プレゼンテーション.
Androidアプリを公開する方法.
WordPressの基礎.
ファイルやフォルダを検索する ①「スタート」→「検索」→「ファイルとフォルダ」とクリックする。
JavaによるCAI学習ソフトウェアの開発
伺か with なでしこ 発表者:しらたま /05/05 うかべん大阪#3.
オンライン英単語・リスニング 学習ソフト 佐々木研究室 N02k1114 北隅 麻実.
教科用教材ソフトの「英語フラッシュカード」を電子黒板で実行
1.自然言語処理システム 2.単語と形態素 3.文節と係り受け
F5 を押すか、または [スライド ショー] > [最初から] をクリックして、コースを開始してください。
静岡大学テレビジョン 字幕操作ガイド その1 NEXT サムネイルにこの表記がある番組は 校正済み英語字幕が付いています!
SWAT I18N 概要 付け足した機能(実行時に言語の切り替え-i18nの範囲で) 問題点(細かい技術的問題、根本的問題) 今後
12月11日(土) 13:00~15:00 長崎大学教育学部 全炳徳 久方純
在宅医療における 対話型自動健康診断システム
2011年6月24日(金) 於 名桜大学言語学習センター 国際学群 伊藤孝行
プレゼンテーション機能の紹介 僕の機能、プレゼンテーション機能を紹介するよ[pose:top_bothhand] [next] K 【 】
PDF管理Webアプリケーションの制作 ~PDFファイル探索時間の短縮化~
Microsoft Office 2010 クイックガイド ~OneNote編~
Titanium Studioを使った アプリ開発 Vol.1
Androidアプリの作成 07A1069 松永大樹.
第8章 Web技術とセキュリティ   岡本 好未.
【プログラミング応用】 必修2単位 通年 30週 授業形態:演習.
計算物理学基礎 第1回 UNIXの基礎 C言語の基本.
2016年11月25日 大阪開発センター 技術1部 深田 健太 アプライアンス&デジタルソリューション株式会社
大規模データによる未知語処理を統合した頑健な統計的仮名漢字変換
Office IME 2010 を使う.
広瀬啓吉 研究室 4.音声認識における適応手法の開発 1.劣条件下での複数音源分離 5.音声認識のための韻律的特徴の利用
WEBアプリケーションの開発 2002年度春学期 大岩研究会2.
情報コミュニケーション入門e 第11回 Part2 Web入門(1)
第6回 Androidアプリの作成 07A1069 松永大樹.
TIME SIGNAL: 集合知を利用した赤信号点灯時間の取得手法
議事録作成支援 Webアプリケーションの開発 リアルタイム通信を用いた合意形成を目指して
トレーニング プレゼンテーションのタイトル
3.1 PowerPoint の概要 PowerPointを使ってできること
12. 意味・意図の解析 12.1 意味表現とは 12.2 規則による意味解析処理 12.3 統計的な意味解析処理 12.4 スマートフォンでの音声サービス ニューラルネットワークによる意味解析.
Androidアプリの作成 情報工学部情報工学科 07A1069 松永大樹.
コンピュータ プレゼンテーション.
ユビコン環境構築のためのソフトウェアプラットフォーム ユビコン環境における化身話利用の可能性
A03 音声インターフェイスによる インスタントメッセージング エージェントの開発
初心者のための補足 キーボード・マウスの基本操作と 日本語入力
ブラウザを快適に操作するツールの開発 藤村研究室 1DS04179M 阪上 翔伍.
物体検出による視覚補助システム T215085 若松大仁 白井研究室.
モバイルP2Pを用いた携帯電話 動画配信手法の提案 第2回 FM10019 種田研究室 古江和栄
Presented by なんでも作るつたい(隊)
Visual Basic 2010 による 学習ウェアの開発
手書き文字の自動認識アプリケーション 15K1013 坂本 倖輝
構造的類似性を持つ半構造化文書における頻度分析
設計情報の再利用を目的とした UML図の自動推薦ツール
「マイグレーションを支援する分散集合オブジェクト」
Androidアプリの作成 07A1069 松永大樹.
vc-1. Visual Studio C++ の基本操作 (Visual Studio C++ の実用知識を学ぶシリーズ)
C言語講習 第0章 Hello, world!.
Visual Studio 2013 の起動と プロジェクトの新規作成 (C プログラミング演習,Visual Studio 2019 対応) 金子邦彦.
論理回路製作実験 発表ガイダンス 発表者氏名 秋田工業高等専門学校 電気・電子・情報系.
1.2 言語処理の諸観点 (1)言語処理の利用分野
5.基本API 5-1 レイアウト ウィジェットの並べ方を指定するには、 パレットのレイアウト(Layoutでは以下の8種類)を配置する。
Presentation transcript:

音声認識・翻訳 Android アプリケーション制作 情報物理研究室 1210960031 豊田晃己

研究の背景 まずは研究の背景について述べたいと思います。 1/16

日本への外国人旅行客数 1937万人 1341万人 1036万人 日本政府観光局のデータによると、日本への外国人旅行者数,は年々増加しており2015年は2012年の2倍以上増加しています。 また,2020 年には日本政府目標の 2,000 万人を上回る 3,000 万人も達成する勢いです. このような増加から、日本政府は外国人旅行客の増加の対応に向けて 多言語音声翻訳システムの研究開発および社会実装に取り組んでおり、 都市インフラとして、多言語サポート整備の必要性が高まっています。 2/16

音声翻訳サービス Google音声翻訳 NICT音声翻訳アプリ 3/16 次に音声翻訳サービスについてですが、 実際に音声翻訳サービスはスマートフォンを利用している人が良く知っていると 思われるGoogle音声翻訳や、日本情報通信研究機構であるNICTが音声翻訳のアプリケーションを開発しています。 これらのサービスがある背景がありますが、 私の研究ではこれらのサービス参考にして、音声翻訳アプリを製作することです。 3/16

NICTの音声翻訳の仕組みの解説 続いてにくとの音声翻訳の仕組みについて解説をします。 4/16

NICT翻訳システムの精度 コーパスとは…. 言語学において、自然言語の文章を構造化し大規模に集積したデータ コーパスを使って統計的機械翻訳を実現 TOEIC600点以上の英語翻訳精度 次に翻訳システムの精度についてですが、 精度の高い翻訳を実現するためには「コーパス」という部分が非常に重要です。翻訳システムは対訳コーパスに 基づいて,同じ表現でも場面や使い方に合わせて翻訳するための確率付対訳辞書を自動的にさくせいするようになっています.翻訳システムを作る時に,「コーパス」をどれだけ集めるかが,翻訳精度を高めることにつながっています.「コーパス」を 使った統計的機械翻訳を用いると,多言語の翻訳システムが簡単に作れるという ところがメリットの一つです. また,翻訳結果をきかいがくしゅうすることにより翻訳精度が向上することから,翻訳を使えば使うほどデータが多くなり,翻訳精度が 向上する仕組みがあります. また、NICTの日本語から英語翻訳の精度はトエック600点以上を取るレベルだと いわれています。 5/16

音声入力 音声入力 クラウドサーバー処理 日本語 「おはよう」 6/16 続いてNICTの日本語から英語の音声翻訳の仕組みについて説明します。 まずは端末に音声入力を行います。 次に入力された音声データをネットワーク上のクラウドサーバーへ送信をされます。 音声入力 6/16

クラウドサーバー処理 クラウドサーバー処理の流れ 「o ha yo u」 7/16 「おはよう」 ↓ 「o ha yo u」 ↓ ↓    ↓ 「o ha yo u」 「o ha yo u」 ↓ 「おはようございます。」 「おはようございます。」 ↓ 「goodmorning」 「Goodmorning.」 日本語の 発音列に変換 日本語の 文字列に変換 日本語と同じ 意味の英語に変換 文法に合わせて 自然な文章に変換 自然な会話音声 に変換 次にクラウド処理についてです。日本語音声コーパスで日本語の発音列に 変換します. 次に日本語の文字コーパスで日本語の辞書と 文法により文字列に 変換し, 自然な日本語文章にあわせて文字を並び替えます.並び替えた文字列を英語の対訳コーパスから,日本語文字列と同じ意味の英語を検索します. 次に一致した同じ意味の検索結果から,英語文字コーパスで英語の文法にあわせて自然な文章に並び替えます. 並び替えられた文章を英語音声コーパスを用いて自然な会話音声に変換され,クラウド処理が完了です。 日本語音声コーパス 日本語文字コーパス 英語対訳コーパス 英語文字コーパス 英語音声コーパス 7/16

音声データを再生 クラウドサーバー 音声再生 音声データ 「Goodmorning.」 8/16 次に端末に音声データが送られ、音声が再生されます。 8/16

音声翻訳アプリを制作するために 音声認識・翻訳ソフトウェア開発キット 提供 9/16 独自に開発が可能 次に音声翻訳アプリ制作をするためにどれを利用したのかというと、 NICTが音声翻訳アプリの開発に利用している音声認識 翻訳サーバーを利用するためのソフトウェア開発キットを利用しました。これを利用することで、 音声認識・翻訳機能を持つアプリを独自に開発することができます。 開発はAndroid StudioでAndroidアプリ開発をしました。 では音声翻訳サービスを参考にし、開発した点を述べていきたいと思います。 提供 独自に開発が可能 Android StudioでAndroidアプリ開発 9/16

10/16 NIctが提供しているソフトウェア開発キットをこのまま実行すると、 音声翻訳はできるのですが、すべて英語表記されています。 私のアプリケーションの利用者は日本人と想定しているため選択言語項目とテキスト表記を日本語化しました。 10/16

次に利用者がなんのための言語選択と、選択している言語を視覚的に 理解できるために、項目をタイトルとボタンを配置しました。 11/16

次にボタンを配置して、ボタンを押すと追加した機能が実行するようにしました。 12/16

13/16 使い方説明ボタンは利用者向けの説明欄画面に画面移動。 音声翻訳リピートボタンは最後に行った音声翻訳が再生できるようにした機能。 対話履歴ボタンは対話履歴画面に画面移動する機能実装しています。 しかし、音声翻訳リピートボタンの機能は未実装です。 13/16

アプリケーション実演 ここでアプリケーションの実演に入りたいと思います。 14/16

課題 ボタンを配置しただけで機能は未実装 画面レイアウト ユーザーインターフェース 15/16 続いで課題点についてですが、 音声翻訳サービスにあった音声翻訳機能を実装しようと思って、 コードを読解してそれらしきメソッドをボタンで実行するような記述してみましたが、 上手くいきませんでした。 ボタンを配置しただけで機能は未実装なので、これを実装できるようにすること。 HTMLを利用したレイアウトや動的なレイアウトがあったのだが、 時間的制約で実装できなかったので、勉強をすすめて実装していくことと、 NICTが提供している音声翻訳SDKは、録音開始時は画面を押し続け、 録音終了時は指を離すというユーザーインターフェースです。 このユーザーインターフェースを、スマホを傾けて音声録音を開始、 傾きを戻すと、録音が終了する ユーザーインターフェースを実装するのが課題点です。 なぜなら、音声翻訳者が傍らにいるかのようなユーザーインターフェースを 目指しているからです。 15/16

まとめ 1210960031 豊田晃己 まとめとしては、アプリケーション製作に音声翻訳のソフトウェア開発キットを利用しましたが、開発キットの中身のプログラム内容がとても難しく、プログラムの読解が 困難でした。しかし、あきらめずに読解をし、メソッドを変えることはできなかったのですが、コードを追記し、追加機能を実現、文字表記を変更することができました。 このことから、NICTの音声翻訳アプリの開発キットを使用して独自のアプリ開発するための足場を作ることができたと思います。 これで発表を終わります。ご静聴、ありがとうございました。 16/16