m4x4 - ps
4 要素ベクトルと 4x4 行列の積を計算します。
構文
m4x4 dst, src0, src1 |
---|
この場合
- dst はデスティネーション レジスタです。結果は 4 要素ベクトルになります。
- src0 は 4 要素ベクトルを表すソース レジスタです。
- src1 は 4x4 行列を表すソース レジスタです。これは、連続する 4 つのレジスタの最初のレジスタに相当します。
解説
ピクセル シェーダーのバージョン | 1_1 | 1_2 | 1_3 | 1_4 | 2_0 | 2_x | 2_sw | 3_0 | 3_sw |
---|---|---|---|---|---|---|---|---|---|
m4x4 | x | x | x | x | x |
デスティネーション レジスタには xyzw (デフォルト) マスクが必要です。正負の反転およびスィズルの修飾子は、src0 には使用できますが、src1 には使用できません。
スィズルおよび正負の反転の修飾子は、src0 レジスタに対しては無効です。dst レジスタと src0 レジスタを同じにすることはできません。
次のコードは、実行される演算を示しています。
dest.x = (src0.x*src1.x) + (src0.y*src1.y) + (src0.z*src1.z) + (src0.w*src1.w);
dest.y = (src0.x*src2.x) + (src0.y*src2.y) + (src0.z*src2.z) + (src0.w*src2.w);
dest.z = (src0.x*src3.x) + (src0.y*src3.y) + (src0.z*src3.z) + (src0.w*src3.w);
dest.w = (src0.x*src4.x) + (src0.y*src4.y) + (src0.z*src4.z) + (src0.w*src4.w);
入力ベクトルはレジスタ src0 にあります。下の展開に示すように、入力の 4x4 行列は、レジスタ src1 と、それに続く 3 つの上位レジスタにあります。
この処理は一般に、射影行列による位置座標のトランスフォームに使われます。この命令は、次のように、1 セットの内積として実装されます。
m4x4 r0.xyzw, r1, c0 will be expanded to:
dp4 r0.x, r1, c0
dp4 r0.y, r1, c1
dp4 r0.z, r1, c2
dp4 r0.w, r1, c3