Optimización de código con la biblioteca DirectXMath

En este tema se describen las consideraciones y estrategias de optimización con la biblioteca DirectXMath.

Uso de descriptores de acceso con moderación
Usar la configuración de compilación correcta
Uso de funciones Est cuando corresponda
Uso de tipos y operaciones de datos alineados
Alinear correctamente las asignaciones
Evitar sobrecargas de operador siempre que sea posible
Desnormales
Aprovechar la dualidad de punto flotante entero
Preferir formularios de plantilla
Uso de DirectXMath con Direct3D
Temas relacionados

Uso de descriptores de acceso con moderación

Las operaciones basadas en vectores usan los conjuntos de instrucciones SIMD y hacen uso de registros especiales. El acceso a componentes individuales requiere pasar de los registros SIMD a los escalares y volver a hacerlo de nuevo.

Cuando sea posible, es más eficaz inicializar todos los componentes de un XMVECTOR a la vez, en lugar de usar una serie de descriptores de acceso vectoriales individuales.

Usar la configuración de compilación correcta

Para los destinos de Windows x86, habilite /arch:SSE2. Para todos los destinos de Windows, habilite /fp:fast.

De forma predeterminada, la compilación en la biblioteca DirectXMath para destinos de Windows x86 se realiza con _XM_SSE_INTRINSICS_ definidos. Esto significa que todas las funciones de DirectXMath harán uso de las instrucciones de SSE2. Sin embargo, lo mismo no es cierto para otro código.

El código fuera de DirectXMath se controla mediante los valores predeterminados del compilador. Sin este modificador, el código generado a menudo puede usar el código x87 menos eficaz.

Se recomienda encarecidamente usar siempre la versión más reciente disponible del compilador.

Uso de funciones Est cuando corresponda

Muchas funciones tienen una función de estimación equivalente que termina en Est. Estas funciones intercambian cierta precisión para mejorar el rendimiento. Las funciones est son adecuadas para los cálculos no críticos en los que se puede sacrificar la precisión para la velocidad. La cantidad exacta de precisión perdida y el aumento de velocidad dependen de la plataforma.

Por ejemplo, la función XMVector3AngleBetweenNormalsEst podría usarse en lugar de la función XMVector3AngleBetweenNormals .

Uso de tipos y operaciones de datos alineados

Los conjuntos de instrucciones SIMD en versiones de windows compatibles con SSE2 normalmente tienen versiones alineadas y no asignadas de las operaciones de memoria. El uso de las operaciones alineadas es más rápido y debe preferirse siempre que sea posible.

La biblioteca DirectXMath proporciona funciones alineadas y no asignadas de acceso a través de tipos de vectores variantes, estructura y funciones. Estas variantes se indican mediante una "A" al final del nombre.

Por ejemplo, hay una estructura XMFLOAT4X4 no alineada y una estructura de XMFLOAT4X4A alineada, que las funciones XMStoreFloat4 y XMStoreFloat4A usan respectivamente.

Alinear correctamente las asignaciones

Las versiones alineadas de los intrínsecos de SSE subyacentes a la biblioteca DirectXMath son más rápidas que las no alineadas.

Por este motivo, las operaciones de DirectXMath que usan objetos XMVECTOR y XMMATRIX asumen que esos objetos están alineados de 16 bytes. Esto es automático para las asignaciones basadas en la pila, si el código se compila en la biblioteca DirectXMath mediante la configuración recomendada del compilador de Windows (consulte Usar la configuración de compilación correcta). Sin embargo, es importante asegurarse de que la asignación del montón que contenga objetos XMVECTOR y XMMATRIX , o que se convierta en estos tipos, cumpla estos requisitos de alineación.

Aunque las asignaciones de memoria de Windows de 64 bits están alineadas de 16 bytes, de forma predeterminada en versiones de 32 bits de memoria de Windows asignadas es solo de 8 bytes alineados. Para obtener información sobre cómo controlar la alineación de la memoria, consulte _aligned_malloc.

Al usar tipos DirectXMath alineados con la biblioteca de plantillas estándar (STL), deberá proporcionar un asignador personalizado que garantice la alineación de 16 bytes. Consulte el blog del equipo de Visual C++ para obtener un ejemplo de escritura de un asignador personalizado (en lugar de malloc/free, querrá usar _aligned_malloc y _aligned_free en la implementación).

Nota:

Algunas plantillas de STL modifican la alineación del tipo proporcionado. Por ejemplo, make_shared<> agrega información de seguimiento interna que puede o no respetar la alineación del tipo de usuario proporcionado, lo que da lugar a miembros de datos no asignados. En este caso, debe usar tipos no asignados en lugar de tipos alineados. Si derivas de clases existentes, incluidos muchos objetos de Windows Runtime, también puedes modificar la alineación de una clase o estructura.

Evitar sobrecargas de operador siempre que sea posible

Como característica de conveniencia, varios tipos como XMVECTOR y XMMATRIX tienen sobrecargas de operador para operaciones aritméticas comunes. Estas sobrecargas de operador tienden a crear numerosos objetos temporales. Se recomienda evitar estas sobrecargas de operador en código sensible al rendimiento.

Desnormales

Para admitir cálculos cercanos a 0, el estándar de punto flotante IEEE 754 incluye compatibilidad con subflujo gradual. El subflujo gradual se implementa mediante el uso de valores desnormalizados y muchas implementaciones de hardware son lentas al controlar desnormales. Una optimización que se debe tener en cuenta es deshabilitar el control de los desnormales para las operaciones vectoriales usadas por DirectXMath.

El cambio del control de los desnormales se realiza mediante el uso de la rutina _controlfp_s en un subproceso previo y puede dar lugar a mejoras en el rendimiento. Use este código para cambiar el control de los desnormales:

  #include <float.h>;
    unsigned int control_word;
    _controlfp_s( &control_word, _DN_FLUSH, _MCW_DN );

Nota:

En versiones de 64 bits de Windows, las instrucciones de SSE se usan para todos los cálculos, no solo para las operaciones vectoriales. Cambiar el control desnormal afecta a todos los cálculos de punto flotante del programa, no solo las operaciones vectoriales usadas por DirectXMath.

Aprovechar la dualidad de punto flotante entero

DirectXMath admite vectores de 4 valores de punto flotante de precisión sencilla o de cuatro valores de 32 bits (con signo o sin signo).

Dado que los conjuntos de instrucciones usados para implementar la biblioteca DirectXMath tienen la capacidad de tratar los mismos datos que varios tipos diferentes, por ejemplo, tratar el mismo vector que las optimizaciones de datos enteros y de punto flotante se pueden lograr. Puede obtener estas optimizaciones mediante las rutinas de inicialización de vectores enteros y operadores bit a bit para manipular valores de punto flotante.

El formato binario de números de punto flotante de precisión sencilla que usa la biblioteca DirectXMath se ajusta completamente al estándar IEEE 754:

     SIGN    EXPONENT   MANTISSA
     X       XXXXXXXX   XXXXXXXXXXXXXXXXXXXXXXX
     1 bit   8 bits     23 bits

Al trabajar con el número de punto flotante de precisión sencilla IEEE 754, es importante tener en cuenta que algunas representaciones tienen un significado especial (es decir, no se ajustan a la descripción anterior). Algunos ejemplos son:

El cero positivo es 0
El cero negativo es 0x80000000
Q_NAN es 07FC0000
+INF es 0x7F800000
-INF es 0xFF800000

Preferir formularios de plantilla

El formulario de plantilla existe para XMVectorSwizzle, XMVectorPermute, XMVectorInsert, XMVectorShiftLeft, XMVectorRotateLeft y XMVectorRotateRight. El uso de estos en lugar del formulario de función general permite al compilador crear implementaciones mucho más eficaces. En el caso de SSE, esto a menudo se contrae a uno o dos valores _mm_shuffle_ps. Para ARM-NEON, la plantilla XMVectorSwizzle puede usar una serie de casos especiales en lugar del VTBL más general swizzle/permute.

Uso de DirectXMath con Direct3D

Un uso común para DirectXMath es realizar cálculos gráficos para su uso con Direct3D. Con Direct3D 10.x y Direct3D 11.x, puede usar la biblioteca DirectXMath de estas maneras directas:

Use las constantes de espacio de nombres Colors directamente en el parámetro ColorRGBA en una llamada al método ID3D11DeviceContext::ClearRenderTargetView o ID3D10Device::ClearRenderTargetView . Para Direct3D 9, debe convertir al tipo XMCOLOR para usarlo como parámetro Color en una llamada al método IDirect3DDevice9::Clear .
Use los tipos XMFLOAT4/XMVECTOR y XMFLOAT4X4/XMMATRIX para configurar estructuras de búfer de constantes a las que hacen referencia los tipos float4 o matrix/float4x4 de HLSL.

Nota:

/ XMFLOAT4X4Los tipos XMMATRIX están en formato principal de fila. Por lo tanto, si usa el modificador del compilador /Zpr (la marca de compilación D3DCOMPILE_PACK_MATRIX_COLUMN_MAJOR ) o omite la palabra clave row_major al declarar el tipo de matriz en HLSL, debe transponer la matriz al establecerla en el búfer de constantes.
Con Direct3D 10.x y Direct3D 11.x, puede suponer que el puntero devuelto por el método Map (por ejemplo, ID3D11DeviceContext::Map) en el miembro pData (D3D10_MAPPED_TEXTURE2D.pData, D3D10_MAPPED_TEXTURE3D. pData o D3D11_MAPPED_SUBRESOURCE. pData) está alineado con 16 bytes si usa el nivel de característica 10_0 o superior o siempre que use D3D11_USAGE_STAGING recursos.

guía de programación de DirectXMath

Comentarios

¿Le ha resultado útil esta página?

Last updated on 2025-05-20