다음을 통해 공유


DML_GRAPH_DESC 구조체(directml.h)

결합된 최적화된 연산자를 컴파일하는 데 사용되는 DirectML 연산자의 그래프를 설명합니다. IDMLDevice1::CompileGraph를 참조하세요.

구문

struct DML_GRAPH_DESC {
  UINT                      InputCount;
  UINT                      OutputCount;
  UINT                      NodeCount;
  const DML_GRAPH_NODE_DESC *Nodes;
  UINT                      InputEdgeCount;
  const DML_GRAPH_EDGE_DESC *InputEdges;
  UINT                      OutputEdgeCount;
  const DML_GRAPH_EDGE_DESC *OutputEdges;
  UINT                      IntermediateEdgeCount;
  const DML_GRAPH_EDGE_DESC *IntermediateEdges;
};

멤버

InputCount

형식: UINT

전체 그래프의 입력 수입니다. 각 그래프 입력은 가변적인 수의 내부 노드에 연결될 수 있으므로 InputEdgeCount와 다를 수 있습니다.

OutputCount

형식: UINT

전체 그래프의 출력 수입니다. 각 그래프 출력은 가변적인 수의 내부 노드에 연결될 수 있으므로 OutputEdgeCount와 다를 수 있습니다.

NodeCount

형식: UINT

그래프의 내부 노드 수입니다.

Nodes

형식: _Field_size_(NodeCount) const DML_GRAPH_NODE_DESC*

그래프의 내부 노드입니다.

InputEdgeCount

형식: UINT

그래프 입력과 그래프의 내부 노드 입력 간의 연결 수입니다.

InputEdges

형식: _Field_size_(InputEdgeCount) const DML_GRAPH_EDGE_DESC*

그래프 입력과 그래프의 내부 노드 입력 간의 연결 배열입니다. 각 요소 내의 형식 필드는 DML_GRAPH_EDGE_TYPE_INPUT 설정해야 합니다.

OutputEdgeCount

형식: UINT

그래프 출력과 그래프의 내부 노드 출력 간의 연결 수입니다.

OutputEdges

형식: _Field_size_(OutputEdgeCount) const DML_GRAPH_EDGE_DESC*

그래프 출력과 그래프의 내부 노드 출력 간의 연결 배열입니다. 각 요소 내의 형식 필드는 DML_GRAPH_EDGE_TYPE_OUTPUT 설정해야 합니다.

IntermediateEdgeCount

형식: UINT

그래프의 노드 간 내부 연결 수입니다.

IntermediateEdges

형식: _Field_size_(IntermediateEdgeCount) const DML_GRAPH_EDGE_DESC*

그래프에 있는 내부 노드의 입력과 출력 간의 연결 배열입니다. 각 요소 내의 Type 필드는 DML_GRAPH_EDGE_TYPE_INTERMEDIATE

설명

이 구조체에서 설명하는 그래프는 지시된 순환 그래프여야 합니다. 연결된 연산자에 대한 선택적 입력 및 출력을 제외하고 제공된 각 노드의 입력 및 출력에 대한 연결을 정의해야 합니다.

노드는 특정 입력에 DML_TENSOR_FLAG_OWNED_BY_DML 플래그를 사용하여 만든 연산자를 사용할 수 있습니다. 이 플래그를 사용하는 모든 연산자 입력은 그래프 입력에 연결되어야 합니다. 동일한 그래프 입력에 연결된 모든 연산자 입력은 이 플래그를 동일하게 사용하거나 생략해야 합니다.

연결된 입력 및 출력이 서로 다른 차원 수, 크기 및 데이터 형식을 사용하는 연산자를 연결하는 것은 합법적입니다. 이는 텐서 데이터 Blob이 각 연산자에 의해 다르게 해석됨을 의미합니다. 연결된 텐서 입력 및 출력의 TotalTensorSizeInBytes 필드는 동일해야 합니다. 연산자는 이전 연산자가 작성한 텐서 영역만 읽어야 합니다. 작업 출력의 패딩 영역(보폭 사용으로 인해 발생)은 다운스트림 연산자가 0으로 읽도록 보장되지 않습니다.

가용성

이 API는 DirectML 버전 1.1.0에서 도입되었습니다.

요구 사항

요구 사항
지원되는 최소 클라이언트 Windows 10 빌드 20348
지원되는 최소 서버 Windows 10 빌드 20348
머리글 directml.h

추가 정보