DML_BATCH_NORMALIZATION_TRAINING_OPERATOR_DESC 구조체(directml.h)
입력에서 일괄 처리 정규화를 수행합니다. 이 연산자는 다음 계산을 수행합니다 Output = FusedActivation(Scale * ((Input - Mean) / sqrt(Variance + Epsilon)) + Bias + FusedAdd)
.
ScaleTensor 및 BiasTensor의 모든 차원을 1로 설정하고 InputTensor와 일치하도록 자동으로 브로드캐스트할 수 있지만 그렇지 않으면 InputTensor에서 해당 차원의 크기와 같아야 합니다. MeanTensor 및 VarianceTensor는 ScaleTensor 및 BiasTensor 크기가 1인 차원 집합의 입력에서 계산 됩니다.
구문
struct DML_BATCH_NORMALIZATION_TRAINING_OPERATOR_DESC {
const DML_TENSOR_DESC *InputTensor;
const DML_TENSOR_DESC *ScaleTensor;
const DML_TENSOR_DESC *BiasTensor;
const DML_TENSOR_DESC *FusedAddTensor;
const DML_TENSOR_DESC *OutputTensor;
const DML_TENSOR_DESC *OutputMeanTensor;
const DML_TENSOR_DESC *OutputVarianceTensor;
FLOAT Epsilon;
const DML_OPERATOR_DESC *FusedActivation;
};
멤버
InputTensor
형식: const DML_TENSOR_DESC*
입력 데이터를 포함하는 텐서입니다.
ScaleTensor
형식: const DML_TENSOR_DESC*
크기 조정 데이터를 포함하는 텐서입니다.
BiasTensor
형식: const DML_TENSOR_DESC*
바이어스 데이터를 포함하는 텐서입니다.
FusedAddTensor
형식: _Maybenull_ const DML_TENSOR_DESC*
FusedActivation 이전의 결과에 추가된 데이터가 포함된 선택적 텐서(있는 경우)입니다.
OutputTensor
형식: const DML_TENSOR_DESC*
결과를 쓸 텐서입니다.
OutputMeanTensor
형식: const DML_TENSOR_DESC*
입력의 평균을 쓸 텐서입니다.
OutputVarianceTensor
형식: const DML_TENSOR_DESC*
입력의 분산을 쓸 텐서입니다.
Epsilon
형식: FLOAT
0으로 나누기를 방지하는 데 사용할 epsilon 값입니다.
FusedActivation
형식: _Maybenull_ const DML_OPERATOR_DESC*
정규화 후에 적용할 선택적 융합 활성화 계층입니다. 자세한 내용은 성능 향상을 위해 융합 연산자 사용을 참조하세요.
설명
가용성
이 연산자는 에서 DML_FEATURE_LEVEL_4_1
도입되었습니다.
텐서 제약 조건
- BiasTensor, FusedAddTensor, InputTensor, OutputMeanTensor, OutputTensor, OutputVarianceTensor 및 ScaleTensor 에는 동일한 DataType 및 DimensionCount가 있어야 합니다.
- BiasTensor, OutputMeanTensor, OutputVarianceTensor 및 ScaleTensor 의 크기는 같아야 합니다.
- FusedAddTensor, InputTensor 및 OutputTensor 의 크기는 같아야 합니다.
텐서 지원
DML_FEATURE_LEVEL_4_1 이상
텐서 | 종류 | 차원 | 지원되는 차원 수 | 지원되는 데이터 형식 |
---|---|---|---|---|
InputTensor | 입력 | { InputDimensions[] } | 1~8개 | FLOAT32, FLOAT16 |
ScaleTensor | 입력 | { ScaleDimensions[] } | 1~8개 | FLOAT32, FLOAT16 |
BiasTensor | 입력 | { ScaleDimensions[] } | 1~8개 | FLOAT32, FLOAT16 |
FusedAddTensor | 선택적 입력 | { InputDimensions[] } | 1~8개 | FLOAT32, FLOAT16 |
OutputTensor | 출력 | { InputDimensions[] } | 1~8개 | FLOAT32, FLOAT16 |
OutputMeanTensor | 출력 | { ScaleDimensions[] } | 1~8개 | FLOAT32, FLOAT16 |
OutputVarianceTensor | 출력 | { ScaleDimensions[] } | 1~8개 | FLOAT32, FLOAT16 |
요구 사항
요구 사항 | 값 |
---|---|
헤더 | directml.h |