多重ベータ分布を用いた音色形状の数理モデリングによる 楽器音生成 1-P-10 ◎中鹿亘,滝口哲也,有木康雄 (神戸大・工) 概要 CQT [1] Brown, J.C., ”Calculation of a Constant Q Spectral Transform” CQT (Constant-Q-Transform [1]) を用いると,注目したい対数周波数だけを解析することができる 背景 従来の楽器音合成技術には,物理モデリング,PCM方式に基づく合成法等がある これらの手法では,前者は膨大な計算コスト,後者は大量のパラメータを必要とする なるべく計算機資源を抑えたい アプローチ 楽器音をパラメトリックにモデル化する 多重ベータ分布 (Multi-beta distribution, MBD) を用いて, ある前提条件のもとで音色形状 (各調波の強度時間変化) をモデル化 ⇒ 楽音に最適な解析手法 Pitch Time p(t;\alpha, \beta) &= \frac{1}{B(\alpha,\beta)} t^{\alpha-1} (1-t)^{\beta-1} \label{eq:beta} \\ \sum_n c_n &= 1 , \ \forall n, \, \alpha_n, \beta_n > 0 \\ \delta_{i,j} &= \begin{cases} 1 & (i=j) \\ 0 & otherwise \end{cases} q(x,t; \alpha, \beta, c) &= \sum_n \delta_{x, n} \ c_n \cdot p(t;\alpha_n,\beta_n) Estimate modeling distribution parameters Spectral analysis with CQT Random sampling based on observed distribution (Instrument signal) (Generated signal) Extract modeling distribution parameters Instrument sound regeneration Learning Stage Synthesis Stage 前提1:音色形状は倍音のみで構成 前提2:音色形状は音高に依存しない 前提3:音色形状は音長に依存しない CQT の定義 Spectrogram Multi-beta-distribution model : スペクトル系列 : 入力信号 : k番目の窓幅 : 対象周波数 多重ベータ分布 実験結果 実験条件 対象音源: ピアノ音 (A4, 単音) ハーモニクスの数: 8 サンプル数: 5000 概要 複数のベータ分布が周波数軸上に重なり合っているような 分布関数として定義 パラメータを変えることで多様な2次元形状を表現できる は 基音,倍音,・・・を表す Time Log-frequency Power 1 log2 log3 Power Power Time Time 定義 Harmonics Harmonics Original MBD-modeled パラメータ推定 ここで 0.2 0.4 0.6 0.8 1 Time Log power Original MBD 0.2 0.4 0.6 0.8 1 Time Log power Original MBD 0.2 0.4 0.6 0.8 1 Time Log power Original MBD 0.2 0.4 0.6 0.8 1 Time Log power Original MBD fundamental 3rd harmonic 5th harmonic 8th harmonic 強度ピーク時間やハーモニクス間の強度比率,強度減衰など,MBDを用いて音色形状を表現できることが分かる : ベータ関数 : ディガンマ関数 MBD のパラメータは 最尤法を用いて推定できる : n番目のハーモニクスの観測分布 各分布によるDP距離の比較 : 観測分布からのサンプル 楽器音合成 DP距離を算出して,ベータ分布,正規分布,Weibull分布の精度比較を行った 楽器音の合成は,倍音加算方式を用いて行う , :n倍音の強度時間変化 : 合成される楽器音信号 :発音長 :音高 ここで は 多重ベータ分布のパラメータを用いて表現できる Sum of distance ベータ分布が最もよく 音色形状を近似できている MBD のパラメータを用いて 楽器音合成が可能 Beta Normal Weibull 0.068063 0.142527 0.074789 : 多重ベータ分布の部分分布