_mm_roti_epi32
更新:2011 年 3 月
需要 Visual Studio 2010 SP1。
Microsoft 专用
生成 XOP 指令 vprotd 以旋转每个双字的第一个源中由第二个源指定的数量。
__m128i _mm_roti_epi32 (
__m128i src,
int count
);
参数
[in] src
包含四个 32 位无符号整数的 128 位参数。[in] count
整数旋转计数,最好是常数。
返回值
包含四个 32 位无符号整数的 128 位结果 r。
r[i] := (count > 0) ? rotate_left(src[i], count) :
rotate_right(src[i], -count);
要求
内部 |
体系结构 |
---|---|
_mm_roti_epi32 |
XOP |
头文件 <intrin.h>
备注
将 src 中的每个 32 位无符号整数值按照 count 中所指定的位数转动,并将该 32 位无符号整数结果存储为目标中相应的值。 如果 count 中的值为正,则向左旋转(向最高有效位);否则,向右旋转。
vprotd 指令有一个表单用于常数参数,另一个用于非常数参数。 如果 count 中的值在编译时无法确定为常数,则该编译器将生成额外的代码来设置和使用 vprotd 的非常数版本。 vprotd 的常数版本速度更快。
vprotd 指令是 XOP 系列指令的一部分。 在您使用此内部函数之前,必须确保处理器支持该指令。 若要确定此指令的硬件支持,调用 InfoType = 0x80000001 的 __cpuid 内部函数并检查和 CPUInfo[2] (ECX) 的位 11。 当该指令受支持时,此位为 1,否则为 0。
示例
#include <stdio.h>
#include <intrin.h>
int main()
{
__m128i a, b, d;
int i, j;
unsigned int temp;
for (i = 0; i < 4; i++) {
temp = 0;
for (j = 0; j < 8; j++) {
temp = temp << 4 | (8*i + j + 7) % 16;
}
a.m128i_u32[i] = temp;
b.m128i_i8[4*i] = 11*i - 21;
}
d = _mm_roti_epi32(a, -21);
printf_s("data: ");
for (i = 0; i < 4; i++) printf_s(" %08x", a.m128i_u32[i]);
printf_s("\nrotated by -21 gives");
for (i = 0; i < 4; i++) printf_s(" %08x", d.m128i_u32[i]);
printf_s("\n");
}
请参见
参考
其他资源
针对 Visual Studio 2010 SP1 添加的 XOP 内部函数
修订记录
Date |
修订记录 |
原因 |
---|---|---|
2011 年 3 月 |
添加了本内容。 |
SP1 功能更改。 |