_mm_maddsd_epi16
更新:2011 年 3 月
需要 Visual Studio 2010 SP1。
Microsoft 专用
生成 XOP 指令 vpmadcswd 以执行其源的饱和整数乘法-加法-累计。
__m128i _mm_maddsd_epi16 (
__m128i src1,
__m128i src2,
__m128i src3
);
参数
[in] src1
包含八个 16 位带符号整数的 128 位参数。[in] src2
包含八个 16 位带符号整数的 128 位参数。[in] src3
包含四个 32 位带符号整数的 128 位参数。
返回值
包含四个 32 位带符号整数的 128 位结果 r。
tempeven[i] := src1[2*i] * src2[2*i]; // 16*16->32
tempodd[i] := src1[2*i+1] * src2[2*i+1]; // 16*16->32
r[i] = tempeven[i] + tempodd[i] + src3[i];
要求
内部 |
体系结构 |
---|---|
_mm_maddsd_epi16 |
XOP |
头文件 <intrin.h>
备注
将 src1 中每个偶数索引的 16 位带符号整数值乘以 src2 中相应的 16 位带符号整数值。 将 src1 中下一个(奇数索引的)16 位带符号整数值乘以 src2 中其相应的 16 位带符号整数值。 将该 32 位带符号整数的结果相加,将所得的和加上 src3 中相应的 32 位带符号整数值,并将该带符号 32 位整数结果存储为目标中相应的值。
如果乘法-加法-累计的结果大于 2147483647 (0x7FFFFFFF) 或小于 -2147483648 (0x80000000),则可通过分别将该结果值设置为 2147483647 或 -2147483648 使乘法-加法-累计“尽量充满”。
vpmadcswd 指令是 XOP 系列指令的一部分。 在您使用此内部函数之前,必须确保处理器支持该指令。 若要确定此指令的硬件支持,调用 InfoType = 0x80000001 的 __cpuid 内部函数并检查和 CPUInfo[2] (ECX) 的位 11。 当该指令受支持时,此位为 1,否则为 0。
示例
#include <stdio.h>
#include <intrin.h>
int main()
{
__m128i a, b, c, d;
int i;
for (i = 0; i < 8; i++) {
a.m128i_i16[i] = 8000*(i-4);
b.m128i_i16[i] = 10000;
}
for (i = 0; i < 4; i++) {
c.m128i_i32[i] = -1900000000;
}
d = _mm_maddsd_epi16(a, b, c);
for (i = 0; i < 4; i++) printf_s(" %d", d.m128i_i32[i]);
printf_s("\n");
}
请参见
参考
其他资源
针对 Visual Studio 2010 SP1 添加的 XOP 内部函数
修订记录
Date |
修订记录 |
原因 |
---|---|---|
2011 年 3 月 |
添加了本内容。 |
SP1 功能更改。 |