Advanced Programmable Shading: Beyond Per-vertex and Per-pixel Shading

Advanced Programmable Shading: Beyond Per-vertex and Per-pixel Shading
Meltdown Tokyo 2001 Advanced Programmable Shading: Beyond Per-vertex and Per-pixel Shading

DirectX7 グラフィックスパイプライン(GeForce / GeForce2)
頂点のトランスフォーム & ライティング T & L セットアップラスタライザテクスチャブレンディング頂点単位のテクスチャ - フレームバッファアンチエイリアス

DirectX8 グラフィックスパイプライン(GeForce3)
高次曲面サーフェス頂点プログラム可能なシェーダ頂点単位のシェーディングセットアップラスタライザテクスチャシャドウ 3D アドレス操作テクスチャプログラム可能なテクスチャピクセル単位のシェーディングブレンディングフレームバッファアンチエイリアス

プログラム可能な頂点処理 GeForce ファミリーが PC にハードウェア T&L を導入した
トランスフォーム & ライティング GeForce3 (次世代) は開発者による T&L プログラムを可能にする頂点プログラム開発者は現在次のようなカスタムプログラムが可能頂点トランスフォーム頂点ライティング特殊効果 (レイヤ化されたフォグ、ボリュームライティング、モーフィング…)

標準 T&L に対するカスタムサブルーチン頂点入力定数メモリレジスタプログラム可能な頂点プロセッサ頂点出力 128 bits
Meltdown Tokyo 2001 標準 T&L に対するカスタムサブルーチン頂点入力定数メモリ 128 bits 4 floats 16 エントリレジスタプログラム可能な頂点プロセッサ A0 addr addr 128 bits 4 floats data data 128 命令 12 エントリ 128 bits 4 floats 頂点出力 128 bits 4 floats 96 エントリ 13 エントリ

このすべてがプログラム可能になったとき開発者は何をすべきか ?
高次曲面サーフェス ? 頂点プログラム可能なシェーダ頂点単位のシェーディングセットアップラスタライザテクスチャシャドウ 3D ? アドレス操作テクスチャプログラム可能なテクスチャピクセル単位のシェーディングブレンディングフレームバッファアンチエイリアス

? これまでは、おおむね… curved surfaces (より良い) vertex programmable T & L shaders
高次曲面 surfaces サーフェス (より良い) ? vertex programmable T & L shaders per - vertex shading setup セットアップ rasterizer ラスタライザ (より良い) tex - addr shadows ops 3d tex テクスチャブレンディング texture programmable blending per - pixel shading fb フレームバッファ antialias アンチエイリアス

それによって何がおきたのか? ハードウェアにおけるプログラマブル頂点シェーダとピクセルシェーダの登場はグラフィックスの長い歴史の中で最も根本的な変化だ ! しかし、多くの開発者はゲーム内で使ってはいない、あるいは単純なマルチパスシェーダをシングルパスにする程度のためにしかそれを使っていない。

もっと大きなチャンスが複雑なレンダリング手法は CPU、頂点シェーダ、ピクセルシェーダそれぞれの実行部分に「因数分解」できる。
プログラマブル頂点処理とピクセル処理の真のパワーは「プログラマ」がもっと複雑で多様なアルゴリズムをハードウェア上で展開できるところにある。

CPU GPU Pixels 以下のプロセスに代わって… CPU は次の処理を行う三角形 GPU は次の処理を行う & テクスチャ
ゲームコード AI 物理演算シーン管理 GPU は次の処理を行う T&L ラスタ化テクスチャリング / シェーディング描画三角形 & テクスチャ GPU Pixels

CPU GPU Pixels 以下のことを考えてみよう... データ途中の結果
ゲームコード、AI、物理演算、シーン管理 GPU は依然として次の処理を行う T&L、ラスタ化、テクスチャリング / シェーディング、描画そして、もっと途中の結果データ GPU Pixels

頂点シェーダ / ピクセルシェーダを使った新手法
ステンシルシャドウに対して (自動的に !!!) シャドウボリュームを生成順序依存のないトランスペアレンシ (深度ピーリング) DX8.1 PS1.3 が必要 texm3x2depth モーションブラー / 被写界深度 (Depth of Field)

ステンシルを使ったシャドウボリュームパワフルなテクニックによってすばらしい結果が可能に

レビュー: ステンシルを使ったシャドウボリューム
個々のポイントライト光源が空間を分割するシャドウ領域非シャドウ領域シャドウボリュームのサーフェスはこれらのシャドウ領域と非シャドウ領域との境界アイデア : オブジェクトがシャドウ領域の境界内にあれば、そのオブジェクトはシャドウの影響を受けることが分かる [Crow 77] によって最初に説明された

シャドウボリュームをキャストした NVIDIA ロゴのシーン
シャドウボリュームの表示遮蔽物と光源によってシャドウボリュームをキャストシャドウボリューム内のオブジェクトは影付けされるべき光源シャドウボリュームをキャストした NVIDIA ロゴのシーンシャドウボリュームの表示

シャドウボリュームアルゴリズムアルゴリズムの概観 :
シーンと光源の位置を与え、シャドウボリュームを決定する (思ったより難しいが、我々はそれを容易にする !) 2パスでシーンをレンダリングするライトを有効にしてシーンを描画し、非シャドウ領域のフラグメントだけをアップデートするライトを無効にしてシーンを描画し、シャドウ領域のフラグメントだけをアップデートする問題のシャドウボリューム生成部分に焦点を当てよう

シャドウボリュームの計算思ったより難しい単一の三角形なら簡単、光源と逆方向に三角形から3つの無限ポリゴンを射影するだけ
複雑なオブジェクトでは、オブジェクトの 2D 輪郭の射影が良い近似だが、この計算は困難これ以外の2つの新しい GPU 頂点シェーダ手法クイック&ダーティ (高速、負荷が低い、必ずしもうまくいかない) 強固 (必ずうまくいくが、計算コストがより多くかかる)

困難な方法: ポリゴンモデルに関するシャドウボリュームを計算
概要: モデルの「可能な輪郭」エッジを決定するライトをオブジェクト空間にトランスフォームモデル内の全ポリゴンの平面方程式を計算 (静的モデルでの事前計算が可能) モデル内の全ポリゴンに対して、オブジェクト空間でのライトの位置がポリゴン平面の後ろか前かを確かめる i.e. ポリゴン平面からライトの位置への平面距離がプラスかマイナスか ? ライトと逆向きになっているポリゴンのエッジを探すこれらのエッジは輪郭線の可能性がある

クイック&ダーティな方法: 頂点シェーダを使ったステンシルシャドウボリュームの生成
実際のポリゴンモデルを使用 (全くそのまま) 頂点シェーダで頂点法線 N と L の内積をテスト前を向いている頂点は変更しない後ろを向いている頂点を遠くに押し出すライトから近似的な輪郭線を押し出す効果が得られ、シャドウボリュームが生成できる近似 – 閉じた、細かくスムースにテセレーションされたオブジェクトでのみ動作する (単一の三角形や立方体を想像して欲しい)

強固な方法: 頂点シェーダを使ったステンシルシャドウボリュームの生成
実際のポリゴンモデルを修正全エッジに退化四角形を追加新しい退化四角形頂点の法線は実際のジオメトリのものを使う頂点シェーダで頂点法線 N と L の内積をテスト前を向いている頂点は変更しない後ろを向いている頂点を遠くに押し出すライトから輪郭線を押し出す効果が得られ、シャドウボリュームが生成できる全てのオブジェクトに対し、いつでも動作する (単一の三角形を想像して欲しい)

順序依存のないトランスペアレンシ: Good… Bad.

順序依存のないトランスペアレンシ (深度ピーリング)
このアルゴリズムは「暗黙のソート」を使って複数の深度レイヤを抽出する最初のパスで最前面のフラグメントの色 / 深度を得るそれに続く各パスで、次に近いフラグメントの色 / 深度をピクセル単位ベースで得る (抽出する) ２つの深度バッファを使って直前の最も近いフラグメントと現在のフラグメントを比較 2つ目の「深度バッファ」はテクスチャとの比較 (読み込み専用) に使用

レイヤ 0 レイヤ 1 レイヤ 2 レイヤ 3

レイヤ 0 レイヤ 1 レイヤ 2 深度深度深度深度ピーリングの各連続パスで各深度レイヤを剥ぎ取っていく。上の画像では、最も近い(最も左) サーフェスを黒い太線で示し、隠面を黒い細線で示し、「剥ぎ取られた」サーフェスを灰色の線で示している。

擬似コード for (i=0; i<num_passes; i++) { clear color buffer A = i % 2
B = (i+1) % 2 depth unit 0: if(i == 0) disable depth test else enable depth test bind buffer A disable depth writes; set depth func to GREATER depth unit 1: bind buffer B clear depth buffer enable depth writes; enable depth test; set depth func to LESS render scene save color buffer RGBA as layer I }

1 レイヤ 2 レイヤ 3 レイヤ 4 レイヤ

頂点シェーダ / ピクセルシェーダを使ってモーションブラー / 被写界深度を表現
モーションブラースクリーンショット :

被写界深度: スクリーンショット

頂点シェーダを積極的に使うことは安全で重要
いつでも頂点シェーダを使うことは「安全」多くのハードウェアプラットフォームがサポートしているメインストリームの GPU がこの秋リリースされる CPU は頂点シェーダを十分にエミュレートできるので、CPU によるフォールバックがOK 頂点シェーダとピクセルシェーダに対応したコンテンツの設計が「重要」頂点シェーダ、ピクセルシェーダを採用し、トップダウンからコンテンツを作成スケールダウンとフォールバックのほうがスケールアップよりずっと簡単

謝辞アイデア、スライド、デモ、画像への援助に対して John Carmack, Rui Bastos, Mark Kilgard, Sim Dietrich, Matthew Papakipos, Cem Cebonoyan, Greg James, Matthias Wloka, Erik Lindholm, Doug Rogers, Cass Everitt, (そして忘れてしまったこれ以外の方々) に感謝するデモ / サンプルソースコードやホワイトペーパーはにあります

Advanced Programmable Shading: Beyond Per-vertex and Per-pixel Shading

Similar presentations

Presentation on theme: "Advanced Programmable Shading: Beyond Per-vertex and Per-pixel Shading"— Presentation transcript:

Similar presentations

About project

フィードバック

ログインする

Auth with social network:

Advanced Programmable Shading: Beyond Per-vertex and Per-pixel Shading

Similar presentations

Presentation on theme: "Advanced Programmable Shading: Beyond Per-vertex and Per-pixel Shading"— Presentation transcript:

Similar presentations

About project

フィードバック