Partager via


_mm256_nmacc_pd

Visual Studio 2010 SP1 est requis

Spécifique à Microsoft

Génère l'instruction YMM FMA4 vfnmaddpd pour exécuter une opération négative multiplier-ajouter à virgule flottante double précision avec un seul arrondi de ses sources.

__m256d _mm_nmacc_pd (
   __m256d src1,
   __m256d src2,
   __m256d src3
);

Paramètres

  • [in] src1
    Paramètre de 256 bits qui contient quatre valeurs à virgule flottante 64 bits.

  • [in] src2
    Paramètre de 256 bits qui contient quatre valeurs à virgule flottante 64 bits.

  • [in] src3
    Paramètre de 256 bits qui contient quatre valeurs à virgule flottante 64 bits.

Valeur de retour

Résultat r de 256 bits qui contient quatre valeurs à virgule flottante de 64 bits.

r[i] := -(src1[i] * src2[i]) + src3[i];

Configuration requise

Intrinsèque

Architecture

_mm256_nmacc_pd

FMA4

Fichier d'en-tête <intrin.h>

Notes

Chacune des quatre valeurs à virgule flottante double précision dans src1 est multipliée par la valeur correspondante dans src2. Le résultat est mis en négatif et ajouté à la valeur correspondante dans src3, et le résultat obtenu est stocké comme valeur correspondante dans la destination. Chaque opération de multiplication-négatif-addition est exécutée avec un seul arrondi à la fin, comme si les résultats intermédiaires étaient calculés à une précision infinie.

L'instruction vfnmaddpd fait partie de la famille FMA4 des instructions. Avant d'utiliser cette fonction intrinsèque, vous devez vérifier que le processeur prend en charge cette instruction. Pour déterminer la prise en charge du matériel pour cette instruction, appelez la fonction intrinsèque __cpuid avec InfoType = 0x80000001 et vérifiez le bit 16 de CPUInfo[2] (ECX). Ce bit est égal à 1 lorsque l'instruction est prise en charge, sinon il est égal à 0.

Exemple

#include <stdio.h>
#include <intrin.h>
int main()
{
    __m256d a, b, c, d;
    int i;
    for (i = 0; i < 4; i++) {
        a.m256d_f64[i] = i;
        b.m256d_f64[i] = 2.;
        c.m256d_f64[i] = 3.;
    }
    d = _mm256_nmacc_pd(a, b, c);
    for (i = 0; i < 4; i++) printf_s(" %.3lf", d.m256d_f64[i]);
    printf_s("\n");
}
  

Voir aussi

Référence

__cpuid, __cpuidex

Autres ressources

_mm_nmacc_pd

_mm_nmacc_sd

_mm256_nmacc_ps

_mm256_macc_pd

_mm256_msub_pd

_mm256_nmsub_pd

Fonctions FMA4 intrinsèques ajoutées pour Visual Studio 2010 SP1

Historique des modifications

Date

Historique

Motif

Mars 2011

Ce contenu a été ajouté.

Modifications de fonctionnalités dans le SP1.