Partager via


_mm256_maddsub_pd

Visual Studio 2010 SP1 est requis

Spécifique à Microsoft

Génère l'instruction YMM FMA4 vfmaddsubpd pour exécuter une autre opération multiplier-ajouter/soustraire à virgule flottante avec un seul arrondi de ses sources.

__m256d _mm256_maddsub_pd (
   __m256d src1,
   __m256d src2,
   __m256d src3
);

Paramètres

  • [in] src1
    Paramètre de 256 bits qui contient quatre valeurs à virgule flottante 64 bits.

  • [in] src2
    Paramètre de 256 bits qui contient quatre valeurs à virgule flottante 64 bits.

  • [in] src3
    Paramètre de 256 bits qui contient quatre valeurs à virgule flottante 64 bits.

Valeur de retour

Résultat r de 256 bits qui contient quatre valeurs à virgule flottante de 64 bits.

r[i] := src1[i] * src2[i] - src3[i]; // i even
r[i] := src1[i] * src2[i] + src3[i]; // i odd

Configuration requise

Intrinsèque

Architecture

_mm256_maddsub_pd

FMA4

Fichier d'en-tête <intrin.h>

Notes

Chacune des quatre valeurs à virgule flottante double précision dans src1 est multipliée par la valeur correspondante dans src2. Chaque valeur source paire de src3 est soustraite de son produit correspondant, chaque valeur impaire est ajoutée à son produit correspondant et chaque résultat est stocké comme valeur correspondante dans la destination. Chaque paire multiplication-addition/soustraction est exécutée avec un seul arrondi à la fin, comme si les résultats intermédiaires étaient calculés à une précision infinie.

L'instruction vfmaddsubps fait partie de la famille FMA4 des instructions. Avant d'utiliser cette fonction intrinsèque, vous devez vérifier que le processeur prend en charge cette instruction. Pour déterminer la prise en charge du matériel pour cette instruction, appelez la fonction intrinsèque __cpuid avec InfoType = 0x80000001 et vérifiez le bit 16 de CPUInfo[2] (ECX). Ce bit est égal à 1 lorsque l'instruction est prise en charge, sinon il est égal à 0.

Exemple

#include <stdio.h>
#include <intrin.h>
int main()
{
    __m256d a, b, c, d;
    int i;
    for (i = 0; i < 4; i++) {
        a.m256d_f64[i] = i;
        b.m256d_f64[i] = 2.;
        c.m256d_f64[i] = 3.;
    }
    d = _mm256_maddsub_pd(a, b, c);
    for (i = 0; i < 4; i++) printf_s(" %.3lf", d.m256d_f64[i]);
    printf_s("\n");
}
  

Voir aussi

Référence

__cpuid, __cpuidex

Autres ressources

_mm_maddsub_pd

_mm256_msubadd_pd

_mm256_maddsub_ps

Fonctions FMA4 intrinsèques ajoutées pour Visual Studio 2010 SP1

Historique des modifications

Date

Historique

Motif

Mars 2011

Ce contenu a été ajouté.

Modifications de fonctionnalités dans le SP1.