コンピュータと音 B3 入野仁志(irino).

Slides:



Advertisements
Similar presentations
知能情報工学 年4月26日 吉川雅博 第3回第3回 k最近傍法. プロトタイプによるNN法の流れ 2 AD変換前処理部特徴抽出部識別部 ・標本化 ・量子化 ・ノイズ除去 ・正規化 識別辞書 (プロトタイプ) 音声や画像 (アナログ信号) 識別 結果 識別が容易な 特徴を抽出 プロトタイプと比較.
Advertisements

データの圧縮.
授業展開#3 アナログとデジタル.
第2章 第2節 情報通信の効率的な方法 1 情報の容量と伝送の特性 2 データの圧縮 3 エラー検出とエラー訂正
量子化(Mid-riser型) 出力y 入力x 通信ネットワーク特論(量子化・符号化).
最新コピーガード CPRM コピーや録画できる回数を制限するコピーコントロール信号である。コピーワンス放送などの映像データに入っている。
Signal Masterによる フィルタバンクの実装
第9回放送授業.
第1節 コンピュータにおける 情報のあらわし方
J107 マルチメディアとは② 動画と音声 マルチメディアとは② 動画と音声 J107 中3情報.
第1章 第1節 情報のディジタル化のしくみ 4 音の表現 5 画像の表現
「情報」 (中村) オリジナル PPT (2010/05/07) 1 1.
第1章 第1節 情報のディジタル化のしくみ 4 音の表現 5 画像の表現
アナログとディジタル 五感 視覚、聴覚、味覚、臭覚、触覚 埼玉県立越ヶ谷高等学校・情報科.
経営情報 #1 デジタル表現 / 2003 (春) 安田豊 1.
第三章 ディジタル符号変換の基礎 3・1PCMパルス符号変換 3・2符号変換 3・3通信路符号形式 3・4スクランブル.
デジタル信号処理①
動的ハフマン符号化の例 入力:ABCDEからなる文字列 出力:動的に作ったハフマン木.
ウェーブレット変換と 非線形適応信号処理を用いた 電子透かしの研究
マルチメディア情報の ディジタル表現と処理
2012年度 情報数理 ~ QRコードを作ろう!(1) ~.
2008年度 情報数理 ~ QRコードを作ろう!(1) ~.
担当 : 山口 匡 伊藤 祐吾 (TA) 宮内 裕輔 (TA)
首都大学東京 都市教養学部数理科学コース 関谷博之
実時間動画像マルチキャストのための フィルタリング手法の実装と評価
デジタル信号処理④
アナログとディジタル 教科書 P8~30,資料8,12 埼玉県立大宮武蔵野高等学校・情報科.
情 報 A ー ディジタル化のしくみ ー.
ディジタル回路 1. アナログ と ディジタル 五島 正裕.
1. アナログ と ディジタル 五島 正裕.
ー 第1日目 ー 確率過程について 抵抗の熱雑音の測定実験
ー 第3日目 ー ねじれ型振動子のブラウン運動の測定
2010年度 情報数理 ~ QRコードを作ろう!(1) ~.
※DES/RSA暗号に関する計算問題(演習・レポート課題)と似た問題は出題しません。
第3回: 今日の目標 平均情報量を説明し、計算できる シャノンの通信モデルを説明できる 情報源符号化の条件を示せる
ディジタル信号処理 Digital Signal Processing
大阪大学 大学院工学研究科 極限光通信工学領域 井上研究室 欅田 直也・橘 遼太郎・隅田 拓也・高 祥史
情報機器の発達とディジタル化 第2節 情報のディジタル化②
音信号表現 音声波形のデジタル化(PCM) サンプリング、標本化定理、量子化 ソースフィルタモデル
授業展開#3 アナログとデジタル.
パワーラボの使い方.
画像情報特論 (5) - ディジタル圧縮 (2) 音声・オーディオ圧縮 電子情報通信学科 甲藤二郎
2. 論理ゲート と ブール代数 五島 正裕.
動画ファイル形式 コンピュータでは、文字や画像、動画、音声といった様々な種類の情報を扱うことができるが、記憶装置に記録されるデータそのものは0と1の情報でしかない。動画ファイルの形式としてはMPEGやAVIです。
第4回 信号表現とエリアシング.
2008年度 情報数理 ~ 様々なデジタル情報 ~.
情報数理 ~様々なデジタル情報~ 2007年度 担当教員:幸山直人.
サウンドファイルの紹介 wave, aiff, MP3 参考: 御池鮎樹著,2004. 裏口からのDTM. 工学社.
5. 音声からの特徴抽出 5.1 特徴抽出の手順 5.2 音声信号のディジタル化 5.3 人の聴覚をまねて -スペクトル分析 5.4 もうひと工夫 -ケプストラム分析 5.5 雑音の除去.
音楽をつくろう! 1.MIDI音楽の仕組みを理解しよう.
Ibaraki Univ. Dept of Electrical & Electronic Eng.
動画形式 2010年11月.
音・音楽の設計と表現Ⅱ キーワード : サンプリング(標本化)、周波数、量子化 音は空気を伝わる波 → 音をデジタル(0と1の数値)にする。
ー 第3日目 ー ねじれ型振動子のブラウン運動の測定
2. 音声とは 2.1 音声の科学 2.2 どうやって声を作るか ー調音音声学 2.3 声の正体とは ー音響音声学 2.4 どうやって声を聴き取るか ー聴覚音声学.
2012年度 情報数理 ~ 様々なデジタル情報(1) ~.
音声のディジタル化 Copyright(C)2004 Tsutomu Ohara All rights reserved.
アナログ と ディジタル アナログ,ディジタル: 情報処理の過程: 記録/伝送 と 処理 において, 媒体(メディア)の持つ物理量 と
Hoffman符号 2011/05/23.
情報A 第15回授業 04情報のディジタル化 対応ファイル:12exp15.xls
2010年度 情報数理 ~ 様々なデジタル情報(1) ~.
アナログとデジタル.
第2回 標本化と量子化.
音声のディジタル化 Copyright(C)2004 Tsutomu Ohara All rights reserved.
第3回 標本化定理.
ソースフィルタモデル.
2019年度 情報数理特論B ~ 様々なデジタル情報(1) ~.
アナログ と ディジタル アナログ,ディジタル: 情報処理の過程: 記録/伝送 と 処理 において, 媒体(メディア)の持つ物理量 と
今後の音声圧縮技術について 鈴木 誠人 .
2.2 伝送方式 アナログ伝送とデジタル伝送 ■アナログ回線でデジタルデータを転送する場合, デジタル to アナログ変換
Presentation transcript:

コンピュータと音 B3 入野仁志(irino)

連続データと離散データ アナログは連続データ デジタル化するという事は離散データに標本化する。

サンプリング定理 聴こうとする2倍の周波数でサンプリングする。 CDのサンプリング周波数は44.1kHz

サンプリング定理

情報を小さくする 可逆圧縮 非(不)可逆圧縮 元通りに戻る圧縮方法→文書など欠損があってはならないデータに利用 Run Length Huffman LZ 非(不)可逆圧縮 元通りに戻らない圧縮方法→音楽、映像などの感覚で同じと感じれば必ずしも正確でなくてよいデータに利用 MPEG,JPEG MP3 心理聴覚分析

MP3って何? Mpeg 3? × Mpeg 1 Audio Layer 3? ○ 昔はそうだったけど最近はちょっと意味が拡張されている。 ISO-MPEG ({1|2|2.5}) Audio Layer 3 (IS 11172-3 and IS 13818-3) ◎

Versionの違い Mpeg 1 Audio Layer 3 Mpeg 2Audio Layer 3 (Mpeg2/BC) マルチチャンネル対応 Mpeg 2.5 Audio Layer 3 (Mpeg2/BC) 低サンプリングレート(16,22.05,24kHz)対応 Mpeg-2/AAC Mpeg1,Mpeg2/BCとの互換性を捨てる その代わりに音質の向上をさせる(5チャンネルを320kbpsで符号化した際に欧州放送連合が定めた放送品質を達成できる)

参考(1) MPEG-2/BCのBCとは? MPEG-2/AACのAACとは? Backward Compatible 下位互換性の意 Advanced Audio Codec

参考(2) MPEG-2/BCのマルチチャンネルとMPEG1の互換性。 L0=L+x*C+y*LS R0=R+x*C+y*RS x,yは予め定められた整数

MP3の処理の流れ 心理聴覚分析 サブバンド符号化 MDCT(変形離散コサイン変換) 折り返し歪み削減バタフライ (非線形)量子化 ハフマン符号化

不要と判断される情報 聴こえない範囲の音は削除 最小可聴限界の周波数特性 マスキング効果 大きな音の直前直後にある周波数が同程度の小さな音や、大きな音の中に埋もれた周波数が同程度の小さな音などは、聴き取れない。→削除

インテンシティステレオ ステレオサウンドの場合、単純に考えると、データ量はモノラルの2倍になってしまう インテンシティステレオモードは、聴覚の時間差による位置検出能力は高域ほど低い、という特性を利用したもので、高域のブロックに関しては、左右独立したデータは持たずモノラル化してしまう。

サブバンド符号化 入力信号を細かい周波数帯域ごとに分ける。 入力信号がある周波数帯域に偏在する時に特に有効 MP3では32個に分解する 一番信号が偏在している一つを間引き、MDCT処理に渡す

MDCT(変形離散コサイン変換) サブバンド符号化で得られた18個ずつ集める。この18個は時間順に並んでいる。 サブバンド符号化で得られた情報を50%ずつ重ね合わせる。(window幅36) 隣り合わせのデータと重ね合わせて量子化誤差を防ぐ

折り返し歪み削減バタフライ サブバンド符号化時に間引きしたデータは重複部分がある。それを除去する。

(非線形)量子化 各サブバンドサンプルをスケールファクタ(ダイナミックレンジを揃える)で正規化した値X(n),サブバンドごとに割り当てられたビット数に対応した値A(n)とB(n)を用いて、A(n)*X(n)+B(n)に従って量子化する。

ハフマン符号化 前述で生成されたデータをハフマン符号化する。 ハフマン符号化の考え方は、よく出てくる情報に短い情報量を割り当てようというもの。

ハフマン符号化の例 AABBCCCCCCDDという文字列があったときに各文字に2bit割り当てると2*12=24 Cに1bit,Aに2bit,b,cに3bit割り当てると、1*6+2*2+3*4=22 というわけで情報量が少なくなる。