_mm_permute2_ps
更新:2011 年 3 月
需要 Visual Studio 2010 SP1。
Microsoft 专用
生成 XOP XMM 指令 vpermil2ps 以从浮点值前两个源的值(具有可选零位调整)中进行选择。
__m128 _mm_permute2_ps (
__m128 src1,
__m128 src2,
__m128i selector,
int control
);
参数
[in] src1
包含四个 32 位浮点值的 128 位参数。[in] src2
包含四个 32 位浮点值的 128 位参数。[in] selector
包含四个 32 位整数选择器值的 128 位参数。[in] control
32 位整数参数,可控制决定结果中是否为零值的方法。
返回值
包含四个 32 位浮点值的 128 位结果 r。
该结果中的每个值为零,或者是从 src1 和 src2 中的八个 32 位浮点值中选择的值。
要求
内部 |
体系结构 |
---|---|
_mm_permute2_ps |
XOP |
头文件 <intrin.h>
备注
selector 中四个双字的每个为其对于该结果的相应双字选择的值,来自 src1 和 src2 的八个 32 位浮点值的其中之一。 在将此值写入结果之前可用零来替换,取决于 control 的值以及 selector 双字的位 3 的值。
对于 selector 中的每个双字,三个低序位选择 src1 或 src2 的其中一个浮点值,使用值 0 到 3 选择 src1 [0] 到 src1 [3],使用值 4 到 7 选择 src2 [0] 到 src2 [3]。
selector 中每个双字的下一个位将被称为以下的“匹配”位。 忽略 selector 中的每个高序位 28 位双字。
第四个源,control,确定要将结果值设置为 0 的条件。 control 的值必须为 0、1、2 或 3。 如果 control 是 0 或 1,则所选的浮点值将被写入该目标。 如果 control 为 2,则当 selector 中相应的匹配位为 0 时,将所选的浮点值写入该目标,但是当该匹配位为 1 时,将写入零。 如果 control 为 3,则当相应的匹配位为 1 时,将所选的浮点值写入该目标,但是当该匹配位为 0 时,将写入零。
vpermil2ps 指令是 XOP 系列指令的一部分。 在您使用此内部函数之前,必须确保处理器支持该指令。 若要确定此指令的硬件支持,调用 InfoType = 0x80000001 的 __cpuid 内部函数并检查和 CPUInfo[2] (ECX) 的位 11。 当该指令受支持时,此位为 1,否则为 0。
示例
#include <stdio.h>
#include <intrin.h>
int main()
{
__m128 a, b, d;
__m128i select;
int i;
for (i = 0; i < 4; i++) {
a.m128_f32[i] = i;
b.m128_f32[i] = i+4;
}
select.m128i_i32[0] = 5;
select.m128i_i32[1] = 1 + 8; // turn on match bit
select.m128i_i32[2] = 2;
select.m128i_i32[3] = 6 + 8; // turn on match bit
d = _mm_permute2_ps(a, b, select, 0); // just select, don't zero
for (i = 0; i < 4; i++) printf_s(" %.3f", d.m128_f32[i]);
printf_s("\n");
d = _mm_permute2_ps(a, b, select, 2); // zero if match is 1
for (i = 0; i < 4; i++) printf_s(" %.3f", d.m128_f32[i]);
printf_s("\n");
d = _mm_permute2_ps(a, b, select, 3); // zero if match is 0
for (i = 0; i < 4; i++) printf_s(" %.3f", d.m128_f32[i]);
printf_s("\n");
}
请参见
参考
其他资源
针对 Visual Studio 2010 SP1 添加的 XOP 内部函数
修订记录
Date |
修订记录 |
原因 |
---|---|---|
2011 年 3 月 |
添加了本内容。 |
SP1 功能更改。 |