_mm_haddq_epu16
更新:2011 年 3 月
需要 Visual Studio 2010 SP1。
Microsoft 专用
生成 XOP 指令 vphadduwq 以执行其源的无符号整数水平加法。
__m128i _mm_haddq_epu16 (
__m128i src
);
参数
- [in] src
包含八个 16 位无符号整数的 128 位参数。
返回值
包含两个 64 位无符号整数的 128 位结果 r。
r[i] := src[4*i] + src[4*i+1] + src[4*i+2] + src[4*i+3];
要求
内部 |
体系结构 |
---|---|
_mm_haddq_epu16 |
XOP |
头文件 <intrin.h>
备注
将 src 中两组四个 16 位无符号整数值每组相加以得到 64 位无符号整数的和,并将该结果存储为目标中相应的值。 在此指令中不可能有溢出。
vphadduwq 指令是 XOP 系列指令的一部分。 在您使用此内部函数之前,必须确保处理器支持该指令。 若要确定此指令的硬件支持,调用 InfoType = 0x80000001 的 __cpuid 内部函数并检查和 CPUInfo[2] (ECX) 的位 11。 当该指令受支持时,此位为 1,否则为 0。
示例
#include <stdio.h>
#include <intrin.h>
int main()
{
__m128i a, d;
int i;
for (i = 0; i < 4; i++) {
a.m128i_i16[i] = i-128;
a.m128i_i16[i+4] = 127-i;
}
// Note that this intrinsic treats negative values as unsigned
// So, e.g., -1 becomes +65535
d = _mm_haddq_epu16(a);
for (i = 0; i < 2; i++) printf_s(" %I64u", d.m128i_u64[i]);
printf_s("\n");
}
请参见
参考
其他资源
针对 Visual Studio 2010 SP1 添加的 XOP 内部函数
修订记录
Date |
修订记录 |
原因 |
---|---|---|
2011 年 3 月 |
添加了本内容。 |
SP1 功能更改。 |