_mm256_permute2_pd
更新 : 2011 年 3 月
Visual Studio 2010 SP1 が必要です。
Microsoft 固有の仕様 →
XOP YMM 命令 vpermil2pd を生成して、1 つ目と 2 つ目のソースから浮動小数点値を選択します。ゼロ設定は任意で行います。
__m256 _mm_permute2_pd (
__m256d src1,
__m256d src2,
__m256i selector,
int control
);
パラメーター
[入力] src1
4 個の 64 ビット浮動小数点値を含む 256 ビットのパラメーター。[入力] src2
4 個の 64 ビット浮動小数点値を含む 256 ビットのパラメーター。[入力] selector
4 個の 64 ビット浮動小数点値を含む 256 ビットのパラメーター。[入力] control
結果の値をゼロに設定するかどうかを決定する方法を制御する 32 ビットの整数パラメーター。
戻り値
4 個の 64 ビット浮動小数点値を含む 256 ビットの結果 r。
結果の上位 128 ビットの各値は、ゼロか、src1 および src2 の上位 128 ビットの 2 個の 64 ビット浮動小数点値から選択された値になります。 結果の下位 128 ビットの各値は、ゼロか、src1 および src2 の下位 128 ビットの 2 個の 64 ビット浮動小数点値から選択された値になります。
必要条件
組み込み |
アーキテクチャ |
---|---|
_mm256_permute2_pd |
XOP |
ヘッダー ファイル <intrin.h>
解説
selector の上位 128 ビットの 2 個の各クワドワードによって、結果の対応するクワドワードの値が src1 および src2 の上位 128 ビットの 4 個の 64 ビット浮動小数点値のいずれかから選択されます。 この値は、control の値および selector クワドワードのビット 3 の値に応じて、結果に書き込まれる前にゼロで置換できます。 同様に、selector の下位 128 ビットの 2 個の各クワドワードによって、src1 および src2 の下位 128 ビットの 4 個の 64 ビット浮動小数点値のいずれかから値が選択されます。この値もゼロで置換できます。
selector の上位 128 ビットの各クワドワードの場合、2 つ目と 3 つ目の下位ビットによって src1 または src2 の浮動小数点値のいずれかが選択されます。値 0 から 1 により src1[2] から src1[3] が選択され、値 2 から 3 により src2[2] から src2[3] が選択されます。 selector の下位 128 ビットの各クワドワードの場合、2 つ目と 3 つ目の下位ビットによって src1 または src2 の浮動小数点値のいずれかが選択されます。値 0 から 1 により src1[0] から src1[1] が選択され、値 2 から 3 により src2[0] から src2[1] が選択されます。
selector の各クワドワードの次のビットは、以下では "一致" ビットと呼んでいます。 selector の各クワドワードの下位ビットと上位 60 ビットは無視されます。
4 つ目のソース control では、結果値を 0 に設定する場合の条件を決定します。 control の値は 0、1、2、または 3 にする必要があります。 control が 0 または 1 の場合は、選択された浮動小数点値がターゲットに書き込まれます。 control が 2 の場合、selector の対応する一致ビットが 0 であれば選択された浮動小数点値がターゲットに書き込まれますが、一致ビットが 1 であればゼロが書き込まれます。 control が 3 の場合、対応する一致ビットが 1 であれば選択された浮動小数点値がターゲットに書き込まれますが、一致ビットが 0 であればゼロが書き込まれます。
vpermil2pd 命令は、XOP ファミリの命令の一部です。 この組み込みを使用する前に、プロセッサでこの命令がサポートされていることを確認してください。 この命令に対するハードウェア サポートを確認するには、InfoType を 0x80000001 にして __cpuid 組み込みを呼び出し、CPUInfo[2] (ECX) のビット 11 をチェックします。 このビットは、命令がサポートされている場合は 1 になり、サポートされていない場合は 0 になります。
使用例
#include <stdio.h>
#include <intrin.h>
int main()
{
__m256d a, b, d;
__m256i select;
int i;
for (i = 0; i < 4; i++) {
a.m256d_f64[i] = i;
b.m256d_f64[i] = i + 4;
}
select.m256i_i64[0] = 2 << 1;
select.m256i_i64[1] = (1 << 1) + 8; // turn on match bit
select.m256i_i64[2] = 0 << 1;
select.m256i_i64[3] = (3 << 1) + 8; // turn on match bit
d = _mm256_permute2_pd(a, b, select, 0); // just select, don't zero
printf_s("%.3lf %.3lf %.3lf %.3lf\n", d.m256d_f64[0],
d.m256d_f64[1], d.m256d_f64[2], d.m256d_f64[3]);
d = _mm256_permute2_pd(a, b, select, 2); // zero if match is 1
printf_s("%.3lf %.3lf %.3lf %.3lf\n", d.m256d_f64[0],
d.m256d_f64[1], d.m256d_f64[2], d.m256d_f64[3]);
d = _mm256_permute2_pd(a, b, select, 3); // zero if match is 0
printf_s("%.3lf %.3lf %.3lf %.3lf\n", d.m256d_f64[0],
d.m256d_f64[1], d.m256d_f64[2], d.m256d_f64[3]);
}
参照
参照
その他の技術情報
Visual Studio 2010 SP1 用に追加された XOP 組み込み
履歴の変更
日付 |
履歴 |
理由 |
---|---|---|
2011 年 3 月 |
このコンテンツを追加。 |
SP1 機能変更 |