다음을 통해 공유


DML_BATCH_NORMALIZATION_TRAINING_OPERATOR_DESC 구조체(directml.h)

입력에서 일괄 처리 정규화를 수행합니다. 이 연산자는 다음 계산을 수행합니다 Output = FusedActivation(Scale * ((Input - Mean) / sqrt(Variance + Epsilon)) + Bias + FusedAdd).

ScaleTensorBiasTensor의 모든 차원을 1로 설정하고 InputTensor와 일치하도록 자동으로 브로드캐스트할 수 있지만 그렇지 않으면 InputTensor에서 해당 차원의 크기와 같아야 합니다. MeanTensorVarianceTensorScaleTensor 및 BiasTensor 크기가 1인 차원 집합의 입력에서 계산 됩니다.

구문

struct DML_BATCH_NORMALIZATION_TRAINING_OPERATOR_DESC {
  const DML_TENSOR_DESC   *InputTensor;
  const DML_TENSOR_DESC   *ScaleTensor;
  const DML_TENSOR_DESC   *BiasTensor;
  const DML_TENSOR_DESC   *FusedAddTensor;
  const DML_TENSOR_DESC   *OutputTensor;
  const DML_TENSOR_DESC   *OutputMeanTensor;
  const DML_TENSOR_DESC   *OutputVarianceTensor;
  FLOAT                   Epsilon;
  const DML_OPERATOR_DESC *FusedActivation;
};

멤버

InputTensor

형식: const DML_TENSOR_DESC*

입력 데이터를 포함하는 텐서입니다.

ScaleTensor

형식: const DML_TENSOR_DESC*

크기 조정 데이터를 포함하는 텐서입니다.

BiasTensor

형식: const DML_TENSOR_DESC*

바이어스 데이터를 포함하는 텐서입니다.

FusedAddTensor

형식: _Maybenull_ const DML_TENSOR_DESC*

FusedActivation 이전의 결과에 추가된 데이터가 포함된 선택적 텐서(있는 경우)입니다.

OutputTensor

형식: const DML_TENSOR_DESC*

결과를 쓸 텐서입니다.

OutputMeanTensor

형식: const DML_TENSOR_DESC*

입력의 평균을 쓸 텐서입니다.

OutputVarianceTensor

형식: const DML_TENSOR_DESC*

입력의 분산을 쓸 텐서입니다.

Epsilon

형식: FLOAT

0으로 나누기를 방지하는 데 사용할 epsilon 값입니다.

FusedActivation

형식: _Maybenull_ const DML_OPERATOR_DESC*

정규화 후에 적용할 선택적 융합 활성화 계층입니다. 자세한 내용은 성능 향상을 위해 융합 연산자 사용을 참조하세요.

설명

가용성

이 연산자는 에서 DML_FEATURE_LEVEL_4_1도입되었습니다.

텐서 제약 조건

  • BiasTensor, FusedAddTensor, InputTensor, OutputMeanTensor, OutputTensor, OutputVarianceTensorScaleTensor 에는 동일한 DataTypeDimensionCount가 있어야 합니다.
  • BiasTensor, OutputMeanTensor, OutputVarianceTensorScaleTensor크기는 같아야 합니다.
  • FusedAddTensor, InputTensorOutputTensor크기는 같아야 합니다.

텐서 지원

DML_FEATURE_LEVEL_4_1 이상

텐서 종류 차원 지원되는 차원 수 지원되는 데이터 형식
InputTensor 입력 { InputDimensions[] } 1~8개 FLOAT32, FLOAT16
ScaleTensor 입력 { ScaleDimensions[] } 1~8개 FLOAT32, FLOAT16
BiasTensor 입력 { ScaleDimensions[] } 1~8개 FLOAT32, FLOAT16
FusedAddTensor 선택적 입력 { InputDimensions[] } 1~8개 FLOAT32, FLOAT16
OutputTensor 출력 { InputDimensions[] } 1~8개 FLOAT32, FLOAT16
OutputMeanTensor 출력 { ScaleDimensions[] } 1~8개 FLOAT32, FLOAT16
OutputVarianceTensor 출력 { ScaleDimensions[] } 1~8개 FLOAT32, FLOAT16

요구 사항

요구 사항
헤더 directml.h

추가 정보