ラズパイ・オーディオの製作 中間報告1 14EC004 飯田 頌平.

Slides:



Advertisements
Similar presentations
特別支援教育で使える PowerPoint の活用法 研修 最低限必要なスキルはこれでバッチリ!! ICT 活用支援員 高松 崇.
Advertisements

OWL-Sを用いたWebアプリケーションの検査と生成
         AVAIL,Inc. ただ今より、アベイル並びに、私共のミドルウェア製品を利用した連携ソリューションについてのご紹介を致します。
難しいことは置いといて、 取り合えず 「BlazeDS」 を使って、 Flash、AIRアプリから Javaオブジェクトのメソッドを呼び出すための 手順書(Windows版) 2008年2月 Lecce.
UNIX利用法.
安全なログオン手順 2004/08/26 Port139 伊原 秀明.
動画像品質調整機能を組み込んだ プロキシキャッシングシステムの 実装と評価
知能機械工学科 担当:長谷川晶一 TA:新・後藤・ナンバ
ARの拡張性の研究 H411023 太田智章.
2006年11月15日 植田龍男 Webサービス II (第8回) 年11月15日 植田龍男.
Flashプレイヤーを使った動画配信 情報工学科 宮本 崇也.
Deep learningによる 読唇システム
WebDAVでOpenOffice.org の文章を共有する
Lync 会議 Lync 会議に参加する Lync 2013 クイック リファレンス Lync 会議のスケジュール
Lync Web App クイック リファレンス カード: 会議にコールインする
REST型Webサービスによる 楽曲検索システムの開発
USB2.0対応PICマイコンによる データ取得システムの開発
いもうとデスクトップが出来るまで 話すひと: 646.
伺か with なでしこ 発表者:しらたま /05/05 うかべん大阪#3.
IM、プレゼンス、連絡先 IM 要求に応答する プレゼンスを設定または変更する ユーザーを検索する
AkaminePlayerについて 04a2049 中村まりえ.
1.
情報 第一回: 練習課題 第一回 田浦健次朗 2010/4/9.
SFA、マーケティングといった標準機能に NTT データのノウハウを追加
「まめだくん Ver.1.0」 特徴と利用方法.
スティックライト for USB USB-ROMの開発手順について WindowsがUSBメモリから起動します。 株式会社ロムウィン
侵入検知システム(IDS) 停止 IDS サーバへの不正アクセスが増加している
IM、プレゼンス、連絡先 IM 要求を受け入れる Lync 2013 クイック リファレンス プレゼンスを設定または変更する ユーザーの検索
MSBuild 色々出来るよ 2011/04/02 お だ.
ORF application ace.
Java言語による 「DTM アプリケーション」の開発 ~Java Sound API の利用~
クラシック音楽普及プロジェクト KG:mao B3 wakutin.
Curlの仕組み.
ストリーム処理エンジンを用いた 顔映像に対する 補助情報提供システム
スキルアップ.
~ 合成音声を活用したスライド動画ソフト~ リアルナレーターズ2 のご紹介 主な機能
経済学のための情報処理 ホームページの作成.
Linuxカーネルについて 2014/01.
携帯用グループナビゲーションの 実装とその評価
Microsoft Office クイックガイド ~OneNote 2013~
第8章 Web技術とセキュリティ   岡本 好未.
2003年度 データベース論 安藤 友晴.
共通言語アイコンを用いたネットワーク コミュニケーション
Cisco Router GUI設定 CCPE3.2 紹介 本資料に記載の各社社名、製品名は、各社の商標または登録商標です。
Xenによる ゲストOSの監視に基づく パケットフィルタリング
澤見研究室 I04I021 片山祐輔 I05I095 山田大志 I06I040 野崎祥志
LEGO MINDSTORMの車両の PCによる遠隔操縦
オープンソフトウェア利用促進事業 第3回OSSモデルカリキュラム導入実証
事務所における情報化の問題点 データが所内で共有されていない、各課ごとに個別に利用されている
アップデート 株式会社アプライド・マーケティング 大越 章司
実行時情報に基づく OSカーネルのコンフィグ最小化
オペレーティングシステムⅡ 第13回 講師 松本 章代 VirtuaWin・・・仮想デスクトップソフト.
12. 意味・意図の解析 12.1 意味表現とは 12.2 規則による意味解析処理 12.3 統計的な意味解析処理 12.4 スマートフォンでの音声サービス ニューラルネットワークによる意味解析.
ネットワークプログラミング (5回目) 05A1302 円田 優輝.
第16章 BOOTP:ブートストラップ・プロトコル
実践ロボットプログラミング LEGO Mindstorms EV3 で目指せロボコン!
SiTCP-VME変換モジュールの開発 KEK 物構研:中性子 佐藤節夫.
一方向画像からの 3Dモデル生成 電気電子工学科 白井研究室 T215049 田原 大輝.
軽量な仮想マシンを用いたIoT機器の安全な監視
工学部 電気電子工学科 白井研究室 T 山田 翔也
中間発表 MIRS1704 .
Microsoft® Lync Online™ 2010 Web App
★C++/オブジェクト指向実践企画★ Othelloゲーム作成
CDHplot:旧daq使用からTsukada’s tokai Class(Class ver1)への移行
顔認識を用いた居眠り運転防止システム 白井研究室 T 山本大介
自然言語処理2015 Natural Language Processing 2015
プログラムの一時停止時に 将来の実行情報を提供するデバッガ
視覚補助のための物体検出 白井研究室 T 若松大仁
ビデオ ビデオのクイック リファレンス ビデオ コントロールを使って表示する Lync 2013 クイック リファレンス
自然言語処理2016 Natural Language Processing 2016
Presentation transcript:

ラズパイ・オーディオの製作 中間報告1 14EC004 飯田 頌平

コンセプト 音声でオーディオに命令する

デバイスドライバ開発と 音声認識は親和性が高い なぜ音声認識をするのか? 音声認識はマイクの質が課題 もともとの目的はRaspberry Piでデバイスドライバを開発すること ADCをRaspberry Piに搭載できるように シリアル通信なので音質が良い 追加のDACをRaspberry Piに搭載 bcm2835を使わずに再生できる デバイスドライバ開発と 音声認識は親和性が高い

製作物概要

構成部品 Raspberry Pi 2 無線子機 USBカメラ オーディオ入力端子として使用 将来的にADCに置換 スピーカー

外部仕様 音楽の再生・停止 ファイル選択 対話機能 「再生」「停止」と呼びかけると実行 ファイル名を呼びかけて指定 特定の文言を受け取ると、返事をする

音声認識 音楽認識エンジン 入力-サーバ間 サーバ-クライアント間 パケット解析 juliusを使用 USB/シリアル通信 TCP/IP通信 openCVの音声版 入力-サーバ間 USB/シリアル通信 サーバ-クライアント間 TCP/IP通信 パケット解析 XMLパーサを使用 音声入力 音声認識サーバ クライアント パケット解析 スクリプト

音楽の再生・停止 再生命令・停止命令を認識すると実行 シェルスクリプトによって再生 停止はプロセスを抹消することで実現 現状ではpythonでの再生が難しいため 参考:Audio problem with snd_bcm2835 + PyAudio (sound stuttering) https://github.com/raspberrypi/linux/issues/994

ファイル選択 認識された音声から命令語を得る 命令語をデコードして曲の情報を取得 得られた情報から曲ファイルのパスを取得 曲ファイル名 ルートまでの親ディレクトリ 拡張子 その他特徴(ジャンル、発表年など) 得られた情報から曲ファイルのパスを取得

対話機能 モード切り替え時の案内などを合成音声で知らせる 簡単な会話も可能 自動でニュースも読み上げてくれる 音声合成ツール「AquesTalk」を使用 簡単な会話も可能 自動でニュースも読み上げてくれる クローラーでニュースサイトのトピックを取得 他の情報も取得可能(天気など)

今後の展望 デバイスドライバは開発が難航 アプリケーション部分(音声認識他) コンパイルに際し膨大な通信量を要する よって、努力目標とする 一回コンパイルしてみるのに半日~丸一日 よって、努力目標とする アプリケーション部分(音声認識他) シェルやpythonで操作できる限りのことが可能 AI部分について重点的に挑戦したい 余裕があれば音声信号処理もやってみる