Partager via


_mm256_maddsub_ps

Visual Studio 2010 SP1 est requis

Spécifique à Microsoft

Génère l'instruction YMM FMA4 vfmaddsubps pour exécuter une autre opération multiplier-ajouter/soustraire à virgule flottante avec un seul arrondi de ses sources.

__m256 _mm256_maddsub_ps (
   __m256 src1,
   __m256 src2,
   __m256 src3
);

Paramètres

  • [in] src1
    Paramètre de 256 bits qui contient huit valeurs à virgule flottante de 32 bits.

  • [in] src2
    Paramètre de 256 bits qui contient huit valeurs à virgule flottante de 32 bits.

  • [in] src3
    Paramètre de 256 bits qui contient huit valeurs à virgule flottante de 32 bits.

Valeur de retour

Résultat r de 256 bits qui contient huit valeurs à virgule flottante de 32 bits.

r[i] := src1[i] * src2[i] - src3[i]; // i even
r[i] := src1[i] * src2[i] + src3[i]; // i odd

Configuration requise

Intrinsèque

Architecture

_mm256_maddsub_ps

FMA4

Fichier d'en-tête <intrin.h>

Notes

Chacune des huit valeurs à virgule flottante simple précision dans src1 est multipliée par la valeur correspondante dans src2. Chaque valeur source paire de src3 est soustraite de son produit correspondant, chaque valeur impaire est ajoutée à son produit correspondant et chaque résultat est stocké comme valeur correspondante dans la destination. Chaque paire multiplication-addition/soustraction est exécutée avec un seul arrondi à la fin, comme si les résultats intermédiaires étaient calculés à une précision infinie.

L'instruction vfmaddsubps fait partie de la famille FMA4 des instructions. Avant d'utiliser cette fonction intrinsèque, vous devez vérifier que le processeur prend en charge cette instruction. Pour déterminer la prise en charge du matériel pour cette instruction, appelez la fonction intrinsèque __cpuid avec InfoType = 0x80000001 et vérifiez le bit 16 de CPUInfo[2] (ECX). Ce bit est égal à 1 lorsque l'instruction est prise en charge, sinon il est égal à 0.

Exemple

#include <stdio.h>
#include <intrin.h>
int main()
{
    __m256 a, b, c, d;
    int i;
    for (i = 0; i < 8; i++) {
        a.m256_f32[i] = i;
        b.m256_f32[i] = 2.;
        c.m256_f32[i] = 3.;
    }
    d = _mm256_maddsub_ps(a, b, c);
    for (i = 0; i < 8; i++) printf_s(" %.3f", d.m256_f32[i]);
    printf_s("\n");
}
  

Voir aussi

Référence

__cpuid, __cpuidex

Autres ressources

_mm_maddsub_ps

_mm256_msubadd_ps

_mm256_maddsub_pd

Fonctions FMA4 intrinsèques ajoutées pour Visual Studio 2010 SP1

Historique des modifications

Date

Historique

Motif

Mars 2011

Ce contenu a été ajouté.

Modifications de fonctionnalités dans le SP1.