多重ベータ分布を用いた音色形状の数理モデリングによる

Slides:



Advertisements
Similar presentations
Lesson 9. 頻度と分布 §D. 正規分布. 正規分布 Normal Distribution 最もよく使われる連続確率分布 釣り鐘形の曲線 -∽から+ ∽までの値を取る 平均 mean =中央値 median =最頻値 mode 曲線より下の面積は1に等しい.
Advertisements

土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
本日の内容(10/30) (以下、前回資料と重複あり) 音響データの分析 音楽的な性質(調・調性、拍節構造) 音楽情報科学について(導入)
ウェーブレットによる 信号処理と画像処理 宮崎大輔 2004年11月24日(水) PBVセミナー.
集積回路工学研究室 岩淵 勇樹 秋田 純一 北川 章夫
2次元フーリエ変換による 外装材の汚れの定量的評価に関する基礎的研究 Basic Research for the Qualification of the Stain on Claddings by 2dimention Fast Fourier Transform 東京大学大学院工学系研究科 建築学専攻.
2010年7月9日 統計数理研究所 オープンハウス 確率モデル推定パラメータ値を用いた市場木材価格の期間構造変化の探求 Searching for Structural Change in Market-Based Log Price with Regard to the Estimated Parameters.
発声のしくみ -声道の共鳴と音源の生成-.
Bassモデルにおける 最尤法を用いたパラメータ推定
クロストーク成分の相互相関に 着目した音場再生システム
徳島大学工学部知能情報工学科 A1 グループ 学部4年 森陽司
状況の制約を用いることにより認識誤りを改善 同時に野球実況中継の構造化
ベイズ基準によるHSMM音声合成の評価 ◎橋本佳,南角吉彦,徳田恵一 (名工大).
高山建志 五十嵐健夫 テクスチャ合成の新たな応用と展開 k 情報処理 vol.53 No.6 June 2012 pp
ランダム不均質媒質中の非等方震源におけるベクトル波エンベロープ合成
Buried Markov Modelを用いた 構音障害者の音声認識の検討
小標本検査データを元にした 疲労破損率のベイズ推定
音高による音色変化に着目した 音源同定手法
音信号表現 音声波形のデジタル化(PCM) サンプリング、標本化定理、量子化 ソースフィルタモデル
Bottom-UpとTop-Down アプローチの統合による 単眼画像からの人体3次元姿勢推定
音高による音色変化と未知楽器の 問題を考慮した楽器音の音源同定
モデルの逆解析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
Online Decoding of Markov Models under Latency Constraints
音高による音色変化に着目した音源同定に関する研究
雑音環境下における 非負値行列因子分解を用いた声質変換
顧客維持に関するモデル.
音響伝達特性を用いた単一マイクロホンによる話者の頭部方向の推定
1-P-6 パラボラ反射板を用いたアクティブマイクロフォンによる方向推定
音色空間の音高依存性を考慮した 楽器音の音源同定
Specmurtを利用した調波構造行列による 混合楽音解析の検討
Basis vectors generation
NMF と基底モデルを用いた多重楽音解析 2-P-10 中鹿亘 ・ 滝口哲也 ・ 有木康雄 (神戸大) 概要 従来手法の問題点 提案手法
バイラテラルフィルタを用いた音声特徴量抽出 2-Q-6
構音障害者を対象とした混合正規分布モデルに基づく統計的声質変換に関する研究
Number of random matrices
不完全な定点観測から 真の不正ホストの分布が分かるか?
音声合成.
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年6月25日 3.1 関数近似モデル
Wavelet係数の局所テクスチャ特徴量を用いたGraph Cutsによる画像セグメンテーション
Bottom-UpとTop-Down アプローチの組み合わせによる 単眼画像からの人体3次元姿勢推定
わかりやすいパターン認識 第7章:部分空間法  7.1 部分空間法の基本  7.2 CLAFIC法                  6月13日(金)                  大城 亜里沙.
楽器音を対象とした音源同定: 音高による音色変化を考慮する識別手法の検討
クロスバリデーションを用いた ベイズ基準によるHMM音声合成
多重ベータ混合モデルを用いた調波時間構造の モデル化による音声合成の検討
川崎浩司:沿岸域工学,コロナ社 第4章(pp.58-68)
ブースティングとキーワードフィルタリング によるシステム要求検出
VOCAL DYNAMICS CONTROLLER: 歌声のF0動特性をノート単位で編集し, 合成できるインタフェース
ナイキストの安定判別に基づく熱音響システムの自励発振解析における発振余裕と 定常発振状態における圧力振幅の関係
HMM音声合成における 変分ベイズ法に基づく線形回帰
重みつきノルム基準によるF0周波数選択を用いた Specmurtによる多重音解析
ベイズ基準による 隠れセミマルコフモデルに基づく音声合成
音色空間の音高依存性を考慮した 楽器音の音源同定
ベイズ音声合成における 事前分布とモデル構造の話者間共有
ガウス分布における ベーテ近似の理論解析 東京工業大学総合理工学研究科 知能システム科学専攻 渡辺研究室    西山 悠, 渡辺澄夫.
1ーQー18 音声特徴量抽出のための音素部分空間統合法の検討
音響伝達特性モデルを用いた シングルチャネル音源位置推定の検討 2-P-34 高島遼一,住田雄司,滝口哲也,有木康雄 (神戸大) 研究の背景
地上分光観測による金星下層大気におけるH2Oの半球分布の導出
音響伝達特性を用いたシングルチャネル音源方向推定
制約付き非負行列因子分解を用いた 音声特徴抽出の検討
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
多重関数を用いた調波時間スペクトル形状のモデル化による音声合成 1-P-4
音響伝達特性を用いた単一チャネル 音源位置推定における特徴量選択の検討
1-Q-12 Buried Markov Modelを用いた構音障害者の音声認識の検討
ソースフィルタモデル.
自己縮小画像と混合ガウス分布モデルを用いた超解像
CSP係数の識別に基づく話者の 頭部方向の推定
Normalized Web Distanceを用いた音声認識の誤り訂正法 301-4in
ランダムプロジェクションを用いた音響モデルの線形変換
雑音環境下における Sparse Coding声質変換 3-P-49d
混合ガウスモデル Gaussian Mixture Model GMM
Presentation transcript:

多重ベータ分布を用いた音色形状の数理モデリングによる 楽器音生成 1-P-10 ◎中鹿亘,滝口哲也,有木康雄 (神戸大・工) 概要 CQT [1] Brown, J.C., ”Calculation of a Constant Q Spectral Transform” CQT (Constant-Q-Transform [1]) を用いると,注目したい対数周波数だけを解析することができる 背景 従来の楽器音合成技術には,物理モデリング,PCM方式に基づく合成法等がある これらの手法では,前者は膨大な計算コスト,後者は大量のパラメータを必要とする なるべく計算機資源を抑えたい アプローチ 楽器音をパラメトリックにモデル化する 多重ベータ分布 (Multi-beta distribution, MBD) を用いて, ある前提条件のもとで音色形状 (各調波の強度時間変化) をモデル化 ⇒ 楽音に最適な解析手法 Pitch Time p(t;\alpha, \beta) &= \frac{1}{B(\alpha,\beta)} t^{\alpha-1} (1-t)^{\beta-1} \label{eq:beta} \\ \sum_n c_n &= 1 , \ \forall n, \, \alpha_n, \beta_n > 0 \\ \delta_{i,j} &= \begin{cases} 1 & (i=j) \\ 0 & otherwise \end{cases} q(x,t; \alpha, \beta, c) &= \sum_n \delta_{x, n} \ c_n \cdot p(t;\alpha_n,\beta_n) Estimate modeling distribution parameters Spectral analysis with CQT Random sampling based on observed distribution (Instrument signal) (Generated signal) Extract modeling distribution parameters Instrument sound regeneration Learning Stage Synthesis Stage 前提1:音色形状は倍音のみで構成 前提2:音色形状は音高に依存しない 前提3:音色形状は音長に依存しない CQT の定義 Spectrogram Multi-beta-distribution model : スペクトル系列 : 入力信号 : k番目の窓幅 : 対象周波数 多重ベータ分布 実験結果 実験条件 対象音源: ピアノ音 (A4, 単音) ハーモニクスの数: 8 サンプル数: 5000 概要 複数のベータ分布が周波数軸上に重なり合っているような 分布関数として定義 パラメータを変えることで多様な2次元形状を表現できる は 基音,倍音,・・・を表す Time Log-frequency Power 1 log2 log3 Power Power Time Time 定義 Harmonics Harmonics Original MBD-modeled パラメータ推定 ここで 0.2 0.4 0.6 0.8 1 Time Log power Original MBD 0.2 0.4 0.6 0.8 1 Time Log power Original MBD 0.2 0.4 0.6 0.8 1 Time Log power Original MBD 0.2 0.4 0.6 0.8 1 Time Log power Original MBD fundamental 3rd harmonic 5th harmonic 8th harmonic 強度ピーク時間やハーモニクス間の強度比率,強度減衰など,MBDを用いて音色形状を表現できることが分かる : ベータ関数 : ディガンマ関数 MBD のパラメータは 最尤法を用いて推定できる : n番目のハーモニクスの観測分布 各分布によるDP距離の比較 : 観測分布からのサンプル 楽器音合成 DP距離を算出して,ベータ分布,正規分布,Weibull分布の精度比較を行った 楽器音の合成は,倍音加算方式を用いて行う , :n倍音の強度時間変化 : 合成される楽器音信号 :発音長 :音高 ここで    は 多重ベータ分布のパラメータを用いて表現できる Sum of distance ベータ分布が最もよく 音色形状を近似できている MBD のパラメータを用いて 楽器音合成が可能 Beta Normal Weibull 0.068063 0.142527 0.074789 : 多重ベータ分布の部分分布