_mm256_maddsub_pd

Article
08/10/2011

Visual Studio 2010 SP1 est requis

Spécifique à Microsoft

Génère l'instruction YMM FMA4 vfmaddsubpd pour exécuter une autre opération multiplier-ajouter/soustraire à virgule flottante avec un seul arrondi de ses sources.

__m256d _mm256_maddsub_pd (
   __m256d src1,
   __m256d src2,
   __m256d src3
);

Paramètres

[in] src1
Paramètre de 256 bits qui contient quatre valeurs à virgule flottante 64 bits.
[in] src2
Paramètre de 256 bits qui contient quatre valeurs à virgule flottante 64 bits.
[in] src3
Paramètre de 256 bits qui contient quatre valeurs à virgule flottante 64 bits.

Valeur de retour

Résultat r de 256 bits qui contient quatre valeurs à virgule flottante de 64 bits.

r[i] := src1[i] * src2[i] - src3[i]; // i even
r[i] := src1[i] * src2[i] + src3[i]; // i odd

Configuration requise

Intrinsèque	Architecture
_mm256_maddsub_pd	FMA4

Fichier d'en-tête <intrin.h>

Notes

Chacune des quatre valeurs à virgule flottante double précision dans src1 est multipliée par la valeur correspondante dans src2. Chaque valeur source paire de src3 est soustraite de son produit correspondant, chaque valeur impaire est ajoutée à son produit correspondant et chaque résultat est stocké comme valeur correspondante dans la destination. Chaque paire multiplication-addition/soustraction est exécutée avec un seul arrondi à la fin, comme si les résultats intermédiaires étaient calculés à une précision infinie.

L'instruction vfmaddsubps fait partie de la famille FMA4 des instructions. Avant d'utiliser cette fonction intrinsèque, vous devez vérifier que le processeur prend en charge cette instruction. Pour déterminer la prise en charge du matériel pour cette instruction, appelez la fonction intrinsèque __cpuid avec InfoType = 0x80000001 et vérifiez le bit 16 de CPUInfo[2] (ECX). Ce bit est égal à 1 lorsque l'instruction est prise en charge, sinon il est égal à 0.

Exemple

#include <stdio.h>
#include <intrin.h>
int main()
{
    __m256d a, b, c, d;
    int i;
    for (i = 0; i < 4; i++) {
        a.m256d_f64[i] = i;
        b.m256d_f64[i] = 2.;
        c.m256d_f64[i] = 3.;
    }
    d = _mm256_maddsub_pd(a, b, c);
    for (i = 0; i < 4; i++) printf_s(" %.3lf", d.m256d_f64[i]);
    printf_s("\n");
}