_mm_nmsub_sd
更新:2011 年 3 月
需要 Visual Studio 2010 SP1。
Microsoft 专用
生成 FMA4 XMM 指令 vfnmsubsd 以执行单精度舍入双精度浮点取负乘法-减法的低序位浮点值源的值。
__m128d _mm_nmsub_sd (
__m128d src1,
__m128d src2,
__m128d src3
);
参数
[in] src1
在该低序位四字中包含 64 位浮点值的 128 位参数。[in] src2
在该低序位四字中包含 64 位浮点值的 128 位参数。[in] src3
在该低序位四字中包含 64 位浮点值的 128 位参数。
返回值
包含两个 64 位浮点值的 128 位结果 r。
r[0] := -(src1[0] * src2[0]) - src3[0];
r[1] := 0.;
要求
内部 |
体系结构 |
---|---|
_mm_nmsub_sd |
FMA4 |
头文件 <intrin.h>
备注
将 src1 中的低序位双精度浮点值乘以 src2 中相应的值。 将结果取负,从所得结果中减去 src3 中相应的值,并将该结果存储为目标中相应的值。 src1、src2 和 src3 中的其他值被忽略,并且该结果的高序位双精度浮点值被设置为 0。 乘法-取负-减法使用末尾处单精度舍入进行,如同中间结果都计算到无限精度。
vfnmsubsd 指令是 FMA4 系列指令的一部分。 在您使用此内部函数之前,必须确保处理器支持该指令。 若要确定此指令的硬件支持,调用 InfoType = 0x80000001 的 __cpuid 内部函数并检查 CPUInfo[2] (ECX) 的位 16。 当该指令受支持时,此位为 1,否则为 0。
示例
#include <stdio.h>
#include <intrin.h>
int main()
{
__m128d a, b, c, d;
int i;
for (i = 0; i < 2; i++) {
a.m128d_f64[i] = i;
b.m128d_f64[i] = 2.;
c.m128d_f64[i] = 3.;
}
d = _mm_nmsub_sd(a, b, c);
for (i = 0; i < 2; i++) printf_s(" %.3lf", d.m128d_f64[i]);
printf_s("\n");
}
请参见
参考
其他资源
针对 Visual Studio 2010 SP1 添加的 FMA4 内部函数
修订记录
Date |
修订记录 |
原因 |
---|---|---|
2011 年 3 月 |
添加了本内容。 |
SP1 功能更改。 |