ストレージテクスチャは、直接書き込みまたは「保存」できるテクスチャです。通常、頂点シェーダーで三角形を指定し、GPUが間接的にテクスチャを更新しますが、ストレージテクスチャを使用すると、好きな場所に直接テクスチャに書き込むことができます。
ストレージテクスチャは特別な種類のテクスチャではなく、createTexture
で作成する他のテクスチャと同様のテクスチャです。STORAGE_BINDING
使用法フラグを追加すると、必要な他の使用法フラグに加えて、テクスチャをストレージテクスチャとして使用でき、その後、テクスチャをストレージテクスチャとして使用することもできます。
ある意味で、ストレージテクスチャは、2D配列として使用するストレージバッファのようなものです。たとえば、ストレージバッファを作成し、次のようにコードで参照できます。
ストレージテクスチャに対して
したがって、それらが同等であるように見える場合、手動でストレージバッファを使用する場合とストレージテクスチャを使用する場合の違いは何でしょうか?
ストレージテクスチャは依然としてテクスチャです。
1つのシェーダーでストレージテクスチャとして使用し、別のシェーダーで通常のテクスチャ(サンプラー、ミップマッピングなど)として使用できます。
ストレージテクスチャにはフォーマット解釈がありますが、ストレージバッファにはありません。
例:
上記では、textureLoad
を呼び出すと、テクスチャはrgba8unorm
テクスチャであり、4バイトがロードされ、自動的に0から1の間の4つの浮動小数点値に変換され、vec4f
として返されます。
バッファの場合、4バイトが単一のf32
値としてロードされます。バッファをarray<u32>
に変更し、値をロードし、手動で4バイト値に分割し、それらを自分で浮動小数点数に変換することもできますが、それが望むものであれば、ストレージテクスチャで無料で入手できます。
ストレージテクスチャには次元があります。
バッファの場合、唯一の次元はその長さ、またはむしろ、そのバインディングの長さです[1]。上記では、バッファを2D配列として使用した場合、2D座標から1Dバッファインデックスに変換するためにwidth
が必要でした。width
の値をハードコーディングするか、何らかの方法で渡す必要があります[2]。テクスチャを使用すると、textureDimensions
を呼び出してテクスチャの次元を取得できます。
とはいえ、ストレージテクスチャには制限があります。
特定のフォーマットのみがread_write
可能です。
これらはr32float
、r32sint
、r32uint
です。
他のサポートされているフォーマットは、単一のシェーダー内でread
またはwrite
のみ可能です。
特定のフォーマットのみがストレージテクスチャとして使用できます。
多数のテクスチャフォーマットがありますが、ストレージテクスチャとして使用できるのは特定のフォーマットのみです。
rgba8(unorm/snorm/sint/uint)
rgba16(float/sint/uint)
rg32(float/sint/uint)
rgba32(float/sint/uint)
欠落していることに気づく1つのフォーマットはbgra8unorm
です。これについては以下で説明します。
ストレージテクスチャはサンプラーを使用できません。
テクスチャを通常のTEXTURE_BINDING
として使用する場合、textureSample
のような関数を呼び出すことができます。これは、ミップレベル全体で最大16個のテクセルをロードし、それらをブレンドします。テクスチャをSTORAGE_BINDING
として使用する場合、一度に1つのテクセルをロードおよび保存するtextureLoad
および/またはtextureStore
のみを呼び出すことができます。
キャンバステクスチャをストレージテクスチャとして使用できます。そのためには、ストレージテクスチャとして使用できるテクスチャを提供するようにコンテキストを構成します。
TEXTURE_BINDING
は、ブラウザ自体がテクスチャをページにレンダリングできるようにするために必要です。STORAGE_BINDING
を使用すると、キャンバスのテクスチャをストレージテクスチャとして使用できます。このサイトのほとんどの例のように、レンダーパスを介してテクスチャにレンダリングしたい場合は、RENDER_ATTACHMENT
の使用法も追加します。
ただし、ここには複雑な問題があります。最初の記事で説明したように、通常、navigator.gpu.getPreferredCanvasFormat
を呼び出して、優先キャンバス形式を取得します。getPreferredCanvasFormat
は、ユーザーのシステムでよりパフォーマンスの高い形式に応じて、rgba8unorm
またはbgra8unorm
のいずれかを返します。
しかし、上記のように、デフォルトでは、bgra8unorm
テクスチャをストレージテクスチャとして使用することはできません。
幸いなことに、'bgra8unorm-storage'
という機能があります。その機能を有効にすると、bgra8unorm
テクスチャをストレージテクスチャとして使用できるようになります。一般的に、優先キャンバス形式としてbgra8unorm
を報告するプラットフォームでは利用可能であるはずですが、利用できない可能性も多少あります。したがって、'bgra8unorm-storage'
機能が存在するかどうかを確認する必要があります。存在する場合は、デバイスにそれを要求し、優先キャンバス形式を使用します。そうでない場合は、キャンバス形式としてrgba8unorm
を選択します。
これで、キャンバステクスチャをストレージテクスチャとして使用できます。テクスチャに同心円を描画する簡単なコンピュートシェーダーを作成しましょう。
ストレージテクスチャをwrite
としてマークし、シェーダー自体で特定のテクスチャ形式を指定する必要があったことに注意してください。TEXTURE_BINDING
とは異なり、STORAGE_BINDING
はテクスチャの正確な形式を知る必要があります。
設定は、最初の記事で記述したコンピュートシェーダーに似ています。シェーダーモジュールを作成した後、それを使用するコンピュートパイプラインを設定します。
レンダリングするには、キャンバスの現在のテクスチャを取得し、テクスチャをシェーダーに渡すことができるようにバインドグループを作成し、パイプラインの設定、バインドグループのバインド、ワークグループのディスパッチという通常のことを行います。
そして、これがそれです。
通常のテクスチャを使用しても何も変わりませんが、テクスチャを作成するためにgetCurrentTexture
の代わりにcreateTexture
を呼び出し、必要な他の使用法フラグとともにSTORAGE_BINDING
を渡します。
上記では、ピクセルごとに1つのワークグループをディスパッチしました。これは無駄であり、GPUははるかに高速に実行できます。最適な作業量のためにシェーダーを最適化すると、例が複雑になります。ポイントは、ストレージテクスチャの使用を実証することであり、可能な限り高速なシェーダーではありません。画像ヒストグラムの計算に関する記事で、コンピュートシェーダーを最適化するいくつかの方法について読むことができます。
同様に、ストレージテクスチャのどこにでも書き込むことができるため、コンピュートシェーダーに関する他の記事で説明したような競合状態に注意する必要があります。呼び出しが実行される順序は保証されていません。競合を回避したり、textureBarriers
やその他のものを挿入して、2つ以上の呼び出しが互いの邪魔をしないようにするのはあなた次第です。
compute.toysは、ストレージテクスチャに直接書き込む例がたくさんあるウェブサイトです。警告:compute.toysの例から学ぶべきことはたくさんありますが、必ずしもベストプラクティスではありません。Compute toysは、コンピュートシェーダーのみで興味深いものを作成することに関するものです。コンピュートシェーダーのみで創造的な何かを行う方法を見つけ出すのは楽しいパズルですが、他の方法が10倍、100倍、または1000倍高速になる可能性があることに注意してください。