다음을 통해 공유


HLSL 셰이더 모델 6.4

HLSL 셰이더 모델 6.4에 추가된 기계 학습 내장 함수에 대해 설명합니다.

셰이더 모델 6.4

이러한 내장 함수는 셰이더 모델 6.4의 필수/지원되는 기능입니다. 따라서 셰이더 모델 6.4의 사용을 보장하는 것 외에는 별도의 기능 비트 검사가 필요하지 않습니다. 이러한 루틴에 대해 지원되는 최소 클라이언트는 Windows 10 버전 1903입니다.

음영 언어 내장 함수

무부호 4요소 정수 내적 및 누적

uint32 dot4add_u8packed(uint32 a, uint32 b, uint32 acc); // ubyte4 a, b;

  합산을 통한 4차원 무부호 정수 내적입니다. 두 개의 입력 DWORD에서 부호 없는 8비트 int 바이트의 각 쌍을 서로 곱하고 결과를 32비트 무부호 정수 누적기로 합산합니다. 이 명령은 단일 32비트 너비 SIMD 레인 내에서 작동합니다. 이 입력도 32비트 수량으로 간주됩니다.  

부호 있는 4요소 정수 내적 및 누적

int32 dot4add_i8packed(uint32 a, uint32 b, int32 acc); // signed byte4 a, b;

합산을 통한 4차원 부호 정수 내적입니다. 두 개의 입력 DWORD에서 부호 있는 8비트 int 바이트의 각 쌍을 서로 곱하고 결과를 32비트 부호 정수 누적기로 합산합니다. 이 명령은 단일 32비트 너비 SIMD 레인 내에서 작동합니다. 이 입력도 32비트 수량으로 간주됩니다.  

단정밀도 부동 소수점 2요소 내적 및 누적

float dot2add( half2 a, half2 b, float acc );

합산을 통한 half2 벡터의 2차원 부동 소수점 내적입니다. 두 개의 반정밀도 부동 소수점 입력 벡터의 요소를 곱하고 그 결과를 32비트 부동 소수점 누적기로 합산합니다. 이 명령은 단일 32비트 너비 SIMD 레인 내에서 작동합니다. 입력은 동일한 레인에 압축된 16비트 수량입니다.

이 내용은 (네이티브 절반 및 짧은 지원이 있음을 나타내는) 정밀도가 낮은 기능 비트에서 다룹니다.

SV_ShadingRate

uint shadingRate : SV_ShadingRate

픽셀 셰이더의 각 호출에 의해 기록되는 대상 픽셀 수를 나타내는 부호 없는 정수입니다. 유효한 값은 D3D12_SHADING_RATE 열거형 값 집합에 속합니다.

이 시스템 값은 D3D12_VARIABLE_SHADING_RATE_TIER_2 이상의 플랫폼에서 사용할 수 있습니다. 꼭짓점 또는 기하 도형 셰이더 단계 중 최대 하나에서 작성할 수 있습니다. 픽셀 셰이더 단계에서 읽을 수 있습니다. 자세한 내용은 가변 속도 음영을 참조하세요.