Partager via


_mm256_nmacc_ps

Visual Studio 2010 SP1 est requis

Spécifique à Microsoft

Génère l'instruction YMM FMA4 vfnmaddps pour exécuter une opération négative multiplier-ajouter à virgule flottante avec un seul arrondi de ses sources.

__m256 _mm256_nmacc_ps (
   __m256 src1,
   __m256 src2,
   __m256 src3
);

Paramètres

  • [in] src1
    Paramètre de 256 bits qui contient huit valeurs à virgule flottante de 32 bits.

  • [in] src2
    Paramètre de 256 bits qui contient huit valeurs à virgule flottante de 32 bits.

  • [in] src3
    Paramètre de 256 bits qui contient huit valeurs à virgule flottante de 32 bits.

Valeur de retour

Résultat r de 256 bits qui contient huit valeurs à virgule flottante de 32 bits.

r[i] := -(src1[i] * src2[i]) + src3[i];

Configuration requise

Intrinsèque

Architecture

_mm256_nmacc_ps

FMA4

Fichier d'en-tête <intrin.h>

Notes

Chacune des huit valeurs à virgule flottante simple précision dans src1 est multipliée par la valeur correspondante dans src2. Le résultat est mis en négatif et ajouté à la valeur correspondante dans src3, et le résultat obtenu est stocké comme valeur correspondante dans la destination. Chaque opération de multiplication-négatif-addition est exécutée avec un seul arrondi à la fin, comme si les résultats intermédiaires étaient calculés à une précision infinie.

L'instruction vfnmaddps fait partie de la famille FMA4 des instructions. Avant d'utiliser cette fonction intrinsèque, vous devez vérifier que le processeur prend en charge cette instruction. Pour déterminer la prise en charge du matériel pour cette instruction, appelez la fonction intrinsèque __cpuid avec InfoType = 0x80000001 et vérifiez le bit 16 de CPUInfo[2] (ECX). Ce bit est égal à 1 lorsque l'instruction est prise en charge, sinon il est égal à 0.

Exemple

#include <stdio.h>
#include <intrin.h>
int main()
{
    __m256 a, b, c, d;
    int i;
    for (i = 0; i < 8; i++) {
        a.m256_f32[i] = i;
        b.m256_f32[i] = 2.;
        c.m256_f32[i] = 3.;
    }
    d = _mm256_nmacc_ps(a, b, c);
    for (i = 0; i < 8; i++) printf_s(" %.3f", d.m256_f32[i]);
    printf_s("\n");
}
  

Voir aussi

Référence

__cpuid, __cpuidex

Autres ressources

_mm_nmacc_ps

_mm_nmacc_ss

_mm256_nmacc_pd

_mm256_macc_ps

_mm256_msub_ps

_mm256_nmsub_ps

Fonctions FMA4 intrinsèques ajoutées pour Visual Studio 2010 SP1

Historique des modifications

Date

Historique

Motif

Mars 2011

Ce contenu a été ajouté.

Modifications de fonctionnalités dans le SP1.