_mm_haddq_epu8

更新:2011 年 3 月

需要 Visual Studio 2010 SP1。

Microsoft 专用

生成 XOP 指令 vphaddubq 以执行其源的无符号整数水平加法。

__m128i _mm_haddq_epu8 (
   __m128i src
); 

参数

  • [in] src
    包含十六个 8 位无符号整数的 128 位参数。

返回值

包含两个 64 位无符号整数的 128 位结果 r。

r[i] := src[8*i] + src[8*i+1] + src[8*i+2] + src[8*i+3] +
        src[8*i+4] + src[8*i+5] + src[8*i+6] + src[8*i+7];

要求

内部

体系结构

_mm_haddq_epu8

XOP

头文件 <intrin.h>

备注

将 src 中两组八个 8 位无符号整数值每组相加以得到 64 位无符号整数的结果,并将该结果存储为目标中相应的值。 在此指令中不可能有溢出。

vphaddubq 指令是 XOP 系列指令的一部分。 在您使用此内部函数之前,必须确保处理器支持该指令。 若要确定此指令的硬件支持,调用 InfoType = 0x80000001 的 __cpuid 内部函数并检查和 CPUInfo[2] (ECX) 的位 11。 当该指令受支持时,此位为 1,否则为 0。

示例

#include <stdio.h>
#include <intrin.h>
int main()
{
    __m128i a, d;
    int i;
    for (i = 0; i < 4; i++) {
        a.m128i_i8[i] = -128;
        a.m128i_i8[i+4] = i-128;
        a.m128i_i8[i+8] = 10*i;
        a.m128i_i8[i+12] = 127;
    }
    // Note that this intrinsic treats negative values as unsigned
    // So, e.g., -128 becomes +128
    d = _mm_haddq_epu8(a);
    for (i = 0; i < 2; i++) printf_s(" %I64u", d.m128i_u64[i]);
    printf_s("\n");
}
  

请参见

参考

__cpuid, __cpuidex

其他资源

_mm_haddw_epu8

_mm_haddd_epu8

_mm_haddq_epu16

_mm_haddq_epu32

_mm_haddq_epi8

针对 Visual Studio 2010 SP1 添加的 XOP 内部函数

修订记录

Date

修订记录

原因

2011 年 3 月

添加了本内容。

SP1 功能更改。