Share via


_mm256_permute2_pd

更新 : 2011 年 3 月

Visual Studio 2010 SP1 が必要です。

Microsoft 固有の仕様 →

XOP YMM 命令 vpermil2pd を生成して、1 つ目と 2 つ目のソースから浮動小数点値を選択します。ゼロ設定は任意で行います。

__m256 _mm_permute2_pd (
   __m256d src1,
   __m256d src2,
   __m256i selector,
   int control
); 

パラメーター

  • [入力] src1
    4 個の 64 ビット浮動小数点値を含む 256 ビットのパラメーター。

  • [入力] src2
    4 個の 64 ビット浮動小数点値を含む 256 ビットのパラメーター。

  • [入力] selector
    4 個の 64 ビット浮動小数点値を含む 256 ビットのパラメーター。

  • [入力] control
    結果の値をゼロに設定するかどうかを決定する方法を制御する 32 ビットの整数パラメーター。

戻り値

4 個の 64 ビット浮動小数点値を含む 256 ビットの結果 r。

結果の上位 128 ビットの各値は、ゼロか、src1 および src2 の上位 128 ビットの 2 個の 64 ビット浮動小数点値から選択された値になります。 結果の下位 128 ビットの各値は、ゼロか、src1 および src2 の下位 128 ビットの 2 個の 64 ビット浮動小数点値から選択された値になります。

必要条件

組み込み

アーキテクチャ

_mm256_permute2_pd

XOP

ヘッダー ファイル <intrin.h>

解説

selector の上位 128 ビットの 2 個の各クワドワードによって、結果の対応するクワドワードの値が src1 および src2 の上位 128 ビットの 4 個の 64 ビット浮動小数点値のいずれかから選択されます。 この値は、control の値および selector クワドワードのビット 3 の値に応じて、結果に書き込まれる前にゼロで置換できます。 同様に、selector の下位 128 ビットの 2 個の各クワドワードによって、src1 および src2 の下位 128 ビットの 4 個の 64 ビット浮動小数点値のいずれかから値が選択されます。この値もゼロで置換できます。

selector の上位 128 ビットの各クワドワードの場合、2 つ目と 3 つ目の下位ビットによって src1 または src2 の浮動小数点値のいずれかが選択されます。値 0 から 1 により src1[2] から src1[3] が選択され、値 2 から 3 により src2[2] から src2[3] が選択されます。 selector の下位 128 ビットの各クワドワードの場合、2 つ目と 3 つ目の下位ビットによって src1 または src2 の浮動小数点値のいずれかが選択されます。値 0 から 1 により src1[0] から src1[1] が選択され、値 2 から 3 により src2[0] から src2[1] が選択されます。

selector の各クワドワードの次のビットは、以下では "一致" ビットと呼んでいます。 selector の各クワドワードの下位ビットと上位 60 ビットは無視されます。

4 つ目のソース control では、結果値を 0 に設定する場合の条件を決定します。 control の値は 0、1、2、または 3 にする必要があります。 control が 0 または 1 の場合は、選択された浮動小数点値がターゲットに書き込まれます。 control が 2 の場合、selector の対応する一致ビットが 0 であれば選択された浮動小数点値がターゲットに書き込まれますが、一致ビットが 1 であればゼロが書き込まれます。 control が 3 の場合、対応する一致ビットが 1 であれば選択された浮動小数点値がターゲットに書き込まれますが、一致ビットが 0 であればゼロが書き込まれます。

vpermil2pd 命令は、XOP ファミリの命令の一部です。 この組み込みを使用する前に、プロセッサでこの命令がサポートされていることを確認してください。 この命令に対するハードウェア サポートを確認するには、InfoType を 0x80000001 にして __cpuid 組み込みを呼び出し、CPUInfo[2] (ECX) のビット 11 をチェックします。 このビットは、命令がサポートされている場合は 1 になり、サポートされていない場合は 0 になります。

使用例

#include <stdio.h>
#include <intrin.h>
int main()
{
    __m256d a, b, d;
    __m256i select;
    int i;
    for (i = 0; i < 4; i++) {
        a.m256d_f64[i] = i;
        b.m256d_f64[i] = i + 4;
    }
    select.m256i_i64[0] = 2 << 1;
    select.m256i_i64[1] = (1 << 1) + 8; // turn on match bit
    select.m256i_i64[2] = 0 << 1;
    select.m256i_i64[3] = (3 << 1) + 8; // turn on match bit

    
    d = _mm256_permute2_pd(a, b, select, 0); // just select, don't zero
    printf_s("%.3lf %.3lf %.3lf %.3lf\n", d.m256d_f64[0],
             d.m256d_f64[1], d.m256d_f64[2], d.m256d_f64[3]);
    d = _mm256_permute2_pd(a, b, select, 2); // zero if match is 1
    printf_s("%.3lf %.3lf %.3lf %.3lf\n", d.m256d_f64[0],
             d.m256d_f64[1], d.m256d_f64[2], d.m256d_f64[3]);
    d = _mm256_permute2_pd(a, b, select, 3); // zero if match is 0
    printf_s("%.3lf %.3lf %.3lf %.3lf\n", d.m256d_f64[0],
             d.m256d_f64[1], d.m256d_f64[2], d.m256d_f64[3]);
}
  

参照

参照

__cpuid, __cpuidex

その他の技術情報

_mm256_permute2_ps

_mm_permute2_pd

Visual Studio 2010 SP1 用に追加された XOP 組み込み

履歴の変更

日付

履歴

理由

2011 年 3 月

このコンテンツを追加。

SP1 機能変更