画像処理 基礎
デジタル画像
デジタル画像とは アナログ画像 (フィルム,絵,実世界) デジタル画像 デジタルカメラ 携帯電話 PCデータ, IT デジタル放送 量子化&標本化
ピクセル Pixel = Pix (Picture) element 2-Dデジタル画像の画素単位 columns 1 N-1 n 1 1 N-1 n 1 rows m Digital image M x N pixels M-1
ボクセル Voxel = Volume element 3-Dデジタル画像の画素単位 l m Digital image m Digital image L x M x N pixels n
グリッド 利用が可能であろう3種類のグリッド形式 Triangular grid Square grid Hexagonal grid
隣接関係 隣のピクセルは何個あるか? Triangular grid Square grid Hexagonal grid エッジを共有 3 4 6 角を共有 9 4
解像度 何ピクセルあれば十分か? 40 x 30 pixels 80 x 60 pixels 160 x 120 pixels
解像度(続き) 離れて見てみると 40 x 30 pixels 80 x 60 pixels 160 x 120 pixels
表現の色数 何色で十分か? 16.7 million colors 256 colors 16 colors 4 colors
標本化 アナログデータを時間軸で離散的に領域を分ける アナログデータ (時間軸と数値は連続) サンプリングデータ (時間軸は離散的) サンプリング間隔
標本化(続き) 2-D デジタル画像の場合 サンプリング間隔によって画像解像度が決まる
量子化 サンプリングされたデータの数値を離散的に分ける サンプリングデータ (時間軸は離散的) デジタルデータ (時間軸と数値の両方が離散的) 量子化ビット数: 3 bit = 8 level 8 bit = 256 level
量子化(続き) 2-Dデジタル画像の場合 1 2 3 5 色は数値として表される (行列形式) 量子化ビット数によって色数が決まる
フィルタ処理
フィルタとは 人間の視覚やコンピュータビジョンための前処理 ノイズ除去 画像強調 特徴抽出 FILTER ?
フィルタとは(続き) 空間領域での処理 隣接ピクセルとの演算 線形と非線形フィルタ 周波数領域での処理 画像をフーリエ変換
ノイズ除去 ノイズ源 取得時に発生 圧縮や伝送時に発生
平均値フィルタ 隣接点の値を平均して置き換える 5 3 1 4 10 8 7 6 9 5 4 6 4 1 / 9 3 10 / 9 5 3 1 4 10 8 7 6 9 5 4 6 4 1 / 9 3 10 / 9 8 / 9 5 / 9 0 / 9 9 / 9 7 / 9 7 8 5 5 5 9 10 8 8 7 3 7 8 9 8 1 5 7 9 10 3 x 3 (5 x 5) (7 x 7)
平均値フィルタ(続き) 重み付け平均では 5 3 1 4 10 8 7 6 9 5 3 1 4 10 8 7 6 9 4 / 16 5 3 1 4 10 8 7 6 9 5 3 1 4 10 8 7 6 9 4 / 16 2 / 16 1 / 16 40 / 16 16 / 16 5 / 16 0 / 16 18 / 16 7 / 16 8 6
平均値フィルタ(続き) 例1 ガウスノイズの場合 ノイズ画像 (5% Gaussian) 平均値 重み付け平均値
平均値フィルタ(続き) 例2 ショットノイズの場合 ノイズ画像 (Random binary) 平均値 重み付け平均値
ウィンドウボックス 隣接空間フィルタは,ウィンドウボックスとの演算によって行う ウィンドウに入れる値によって作用が決まる 1 / 9 2 1 2 1 -2 -1 8 -1 平均値 Sobel Dx Laplacian
Binomialフィルタ 1-D Binomialフィルタ 複雑なフィルタや大規模なフィルタは単純なフィルタの組み合わせから生成できる p 回合わせると Pascal’s triangle
Binomialフィルタ(続き) 2-D Binomialフィルタ 1-D フィルタの水平方向と垂直方向から構成する
Binomialフィルタ(続き) 例 B4の場合 ガウスノイズ ショットノイズ
非線形フィルタ 最大値フィルタ 最小値フィルタ メディアン(中央値)フィルタ ウィンドウボックス内の最大値で置き換える ウィンドウボックス内の最小値で置き換える メディアン(中央値)フィルタ
メディアンフィルタ ウィンドウボックス内の中央値で置き換える 10 9 8 7 5 5 3 1 4 10 8 7 6 9 5 3 1 4 5 3 1 4 10 8 7 6 9 5 3 1 4 10 8 7 6 9 10 9 8 7 5 ソート 中央値 8 8
メディアンフィルタ(続き) 例 3 x 3 フィルタ ガウスノイズ ショットノイズ
ノイズ除去フィルタ まとめ 線形フィルタ 非線形フィルタ ガウスノイズ エッジのぼやけ ショットノイズ エッジの保存 ガウスノイズ 平均値 (3 x 3) 平均値 (3 x 3) 中央値 (3 x 3) 中央値 (3 x 3)
エッジ
エッジとは 画像中の明るさ(数値)が急激に変化する部分 近傍ピクセルとの微分処理 (離散的には差分式) 物体認識などでは重要な特徴となる 微分処理であるためノイズに弱い
ノイズの種類 ステップエッジ ルーフエッジ ピークエッジ Intensity x Intensity x Intensity x
1-D エッジの微分 1回微分と2回微分 元信号 1回微分 2回微分 Fig. from Digital Image Processing (Springer)
Gradient-base 1回微分のオペレータ 離散的な差分式では 2 x 2 サイズ 3 x 3 サイズ エッジの強さと方向が得られる
Gradient-base (続き) オペレータの種類 Roberts Prewitt Sobel
Gradient-base (続き) 例 Prewittオペレータ Dx Dy
Laplacian operator 2回微分のオペレータ 4 direction 8 direction エッジの強さが得られる
Laplacian operator (続き) 4 direction 8 direction
Laplacian Of Gaussian 微分演算はノイズに対して弱い Gauss関数でぼかして(ノイズ除去)してからLaplacianオペレータ Laplacian of Gaussian
Laplacian Of Gaussian (続き) 例 LOGオペレータ
2値画像
2値画像 前景 (興味のある領域) と背景を分離する 文字認識や物体認識の前処理 Fig. from Digital Image Processing (Springer)
2値化 しきい値をTとすると関数fにより 閾値をどのように決めるか? 1: 前景, 0:背景 単純しきい値 P-タイル法 モード法 分散比の最大化
ヒストグラム 画像中の明るさの分布を表したグラフ Number of points Intensity value
単純しきい値 大局的にある値を使う T Number of points Number of points Intensity この場合,簡単に決定できる ?
P-タイル法 事前にそれぞれの領域の割合pが分かっている しきい値Tを自動的に決定できる (100 - p) % p % T Number of points Intensity T
モード法 ヒストグラムが双峰性を持つ時 t1& t2: ヒストグラムの峰の値 T : 2つの峰の間の局所的小値で 下の条件を満たす t1 下の条件を満たす Number of points t1 t2 Intensity C1& C2: 調整は必要 T
分散比の最大化 クラス内分散 クラス間分散 2つの分散の比をTを動かすことにより最大化する S2 S1 T Number of points Intensity T
2値化 例 Fig. from Digital Image Processing (Springer)
References Bernd Jahne, “Digital Image Processing”, Springer 谷口慶治,“画像処理工学”,共立出版