ラズパイ・オーディオの製作中間報告1 14EC004 飯田頌平.

Slides:

Advertisements

Similar presentations

特別支援教育で使える PowerPoint の活用法研修最低限必要なスキルはこれでバッチリ！！ ICT 活用支援員高松崇.

Advertisements

OWL-Sを用いたWebアプリケーションの検査と生成

　　　　　　　　　ＡＶＡＩＬ，Ｉｎｃ．ただ今より、アベイル並びに、私共のミドルウェア製品を利用した連携ソリューションについてのご紹介を致します。

難しいことは置いといて、取り合えず「BlazeDS」を使って、 Flash、AIRアプリから Javaオブジェクトのメソッドを呼び出すための手順書（Windows版） 2008年2月　Lecce.

安全なログオン手順 2004/08/26 Port139 伊原秀明.

動画像品質調整機能を組み込んだプロキシキャッシングシステムの実装と評価

知能機械工学科担当：長谷川晶一 TA：新・後藤・ナンバ

ARの拡張性の研究Ｈ４１１０２３　太田智章.

2006年11月15日植田龍男 Webサービス II (第8回) 年11月15日植田龍男.

Flashプレイヤーを使った動画配信情報工学科宮本崇也.

Deep learningによる読唇システム

WebDAVでOpenOffice.org の文章を共有する

Lync 会議 Lync 会議に参加する Lync 2013 クイックリファレンス Lync 会議のスケジュール

Lync Web App クイックリファレンスカード: 会議にコールインする

REST型Webサービスによる楽曲検索システムの開発

USB2.0対応PICマイコンによるデータ取得システムの開発

いもうとデスクトップが出来るまで話すひと: 646.

伺か with なでしこ発表者：しらたま /05/05　うかべん大阪#3.

IM、プレゼンス、連絡先 IM 要求に応答するプレゼンスを設定または変更するユーザーを検索する

ＡｋａｍｉｎｅＰｌａｙｅｒについて 04a2049　中村まりえ.

情報第一回: 練習課題第一回田浦健次朗 2010/4/9.

SFA、マーケティングといった標準機能に NTT データのノウハウを追加

「まめだくん Ver.1.0」特徴と利用方法.

スティックライト for USB USB-ROMの開発手順について WindowsがUSBメモリから起動します。株式会社ロムウィン

侵入検知システム（IDS）停止 IDS サーバへの不正アクセスが増加している

IM、プレゼンス、連絡先 IM 要求を受け入れる Lync 2013 クイックリファレンスプレゼンスを設定または変更するユーザーの検索

MSBuild 色々出来るよ 2011/04/02 おだ.

ORF　application ace.

Java言語による「DTM アプリケーション」の開発～Java Sound API の利用～

クラシック音楽普及プロジェクト KG:mao B3 wakutin.

Curlの仕組み.

ストリーム処理エンジンを用いた顔映像に対する補助情報提供システム

スキルアップ.

～合成音声を活用したスライド動画ソフト～リアルナレーターズ2 のご紹介主な機能

経済学のための情報処理ホームページの作成.

Linuxカーネルについて 2014/01.

携帯用グループナビゲーションの実装とその評価

Microsoft Office クイックガイド～OneNote 2013～

第8章 Web技術とセキュリティ　　岡本　好未.

2003年度データベース論安藤　友晴.

共通言語アイコンを用いたネットワークコミュニケーション

Cisco Router GUI設定 CCPE3.2 紹介本資料に記載の各社社名、製品名は、各社の商標または登録商標です。

XenによるゲストOSの監視に基づくパケットフィルタリング

澤見研究室 I04I021 片山祐輔 I05I095 山田大志 I06I040 野崎祥志

LEGO MINDSTORMの車両の PCによる遠隔操縦

オープンソフトウェア利用促進事業第3回OSSモデルカリキュラム導入実証

事務所における情報化の問題点データが所内で共有されていない、各課ごとに個別に利用されている

アップデート株式会社アプライド・マーケティング大越　章司

実行時情報に基づく OSカーネルのコンフィグ最小化

オペレーティングシステムⅡ 第13回講師　松本章代 VirtuaWin・・・仮想デスクトップソフト.

12. 意味・意図の解析 12.1 意味表現とは 12.2 規則による意味解析処理 12.3 統計的な意味解析処理 12.4 スマートフォンでの音声サービスニューラルネットワークによる意味解析.

ネットワークプログラミング（５回目） 05A1302 円田　優輝.

第16章ＢＯＯＴＰ：ブートストラップ・プロトコル

実践ロボットプログラミング LEGO Mindstorms EV3 で目指せロボコン！

SiTCP-VME変換モジュールの開発 KEK　物構研：中性子佐藤節夫.

一方向画像からの３Dモデル生成電気電子工学科　白井研究室 T215049　田原　大輝.

軽量な仮想マシンを用いたIoT機器の安全な監視

工学部電気電子工学科白井研究室 T 山田翔也

中間発表 MIRS1704　.

Microsoft® Lync Online™ 2010 Web App

★C++/オブジェクト指向実践企画★ Othelloゲーム作成

CDHplot:旧daq使用からTsukada’s tokai Class(Class ver1)への移行

顔認識を用いた居眠り運転防止システム白井研究室 T 山本大介

自然言語処理2015 Natural Language Processing 2015

プログラムの一時停止時に将来の実行情報を提供するデバッガ

視覚補助のための物体検出白井研究室 T 若松大仁

ビデオビデオのクイックリファレンスビデオコントロールを使って表示する Lync 2013 クイックリファレンス

自然言語処理2016 Natural Language Processing 2016

Presentation transcript:

ラズパイ・オーディオの製作中間報告1 14EC004 飯田頌平

コンセプト音声でオーディオに命令する

デバイスドライバ開発と音声認識は親和性が高いなぜ音声認識をするのか？音声認識はマイクの質が課題もともとの目的はRaspberry Piでデバイスドライバを開発すること ADCをRaspberry Piに搭載できるようにシリアル通信なので音質が良い追加のDACをRaspberry Piに搭載 bcm2835を使わずに再生できるデバイスドライバ開発と音声認識は親和性が高い

製作物概要

構成部品 Raspberry Pi 2 無線子機 USBカメラオーディオ入力端子として使用将来的にADCに置換スピーカー

外部仕様音楽の再生・停止ファイル選択対話機能「再生」「停止」と呼びかけると実行ファイル名を呼びかけて指定特定の文言を受け取ると、返事をする

音声認識音楽認識エンジン入力－サーバ間サーバ－クライアント間パケット解析 juliusを使用 USB/シリアル通信 TCP/IP通信 openCVの音声版入力－サーバ間 USB/シリアル通信サーバ－クライアント間 TCP/IP通信パケット解析 XMLパーサを使用音声入力音声認識サーバクライアントパケット解析スクリプト

音楽の再生・停止再生命令・停止命令を認識すると実行シェルスクリプトによって再生停止はプロセスを抹消することで実現現状ではpythonでの再生が難しいため参考：Audio problem with snd_bcm2835 + PyAudio (sound stuttering) https://github.com/raspberrypi/linux/issues/994

ファイル選択認識された音声から命令語を得る命令語をデコードして曲の情報を取得得られた情報から曲ファイルのパスを取得曲ファイル名ルートまでの親ディレクトリ拡張子その他特徴（ジャンル、発表年など）得られた情報から曲ファイルのパスを取得

対話機能モード切り替え時の案内などを合成音声で知らせる簡単な会話も可能自動でニュースも読み上げてくれる音声合成ツール「AquesTalk」を使用簡単な会話も可能自動でニュースも読み上げてくれるクローラーでニュースサイトのトピックを取得他の情報も取得可能（天気など）

今後の展望デバイスドライバは開発が難航アプリケーション部分（音声認識他）コンパイルに際し膨大な通信量を要するよって、努力目標とする一回コンパイルしてみるのに半日～丸一日よって、努力目標とするアプリケーション部分（音声認識他）シェルやpythonで操作できる限りのことが可能 AI部分について重点的に挑戦したい余裕があれば音声信号処理もやってみる