의미 체계 모델로부터의 의미 체계 데이터 전파
의미 체계 모델을 FabricDataFrame으로 읽으면 의미 체계 모델의 메타데이터 및 주석과 같은 의미 체계 정보가 자동으로 FabricDataFrame에 연결됩니다. 이 문서에서는 SemPy Python 라이브러리가 의미 체계 모델의 테이블과 열에 연결된 주석을 보존하는 방법을 알아봅니다.
Pandas 사용자를 위한 의미 체계 전파
SemPy Python 라이브러리는 의미 체계 링크 기능의 일부이며 Pandas 사용자에게 제공됩니다. SemPy는 Pandas에서 데이터에 대해 수행할 수 있는 작업을 지원합니다.
또한 SemPy를 사용하면 운영 중인 의미 체계 모델에서 의미 체계 데이터를 전파할 수 있습니다. 의미 체계 데이터를 전파하면 조각화, 병합, 연결과 같은 작업을 수행할 때 의미 체계 모델의 테이블과 열에 연결된 주석을 보존할 수 있습니다.
다음 두 가지 방법 중 하나를 사용하여 FabricDataFrame 데이터 구조를 만들 수 있습니다.
의미 체계 모델에서 테이블이나 측정값의 출력을 FabricDataFrame으로 읽어올 수 있습니다.
의미 체계 모델에서 FabricDataFrame으로 읽어오면 Power BI의 메타데이터가 자동으로 FabricDataFrame을 하이드레이션하거나 채웁니다. 즉, FabricDataFrame은 모델의 테이블이나 측정값에서 의미 체계 정보를 보존합니다.
Pandas DataFrames에서와 마찬가지로 메모리 내 데이터를 사용하여 FabricDataFrame을 만들 수 있습니다.
메모리 내 데이터에서 FabricDataFrame을 만들 때 FabricDataFrame에서 메타데이터 정보를 가져올 수 있는 의미 체계 모델의 이름을 제공해야 합니다.
SemPy에서 의미 체계 데이터를 보존하는 방식은 사용자가 수행하는 작업과 운영 중인 FabricDataFrames의 순서와 같은 요인에 따라 달라집니다.
병합을 통해 의미 체계 전파
두 개의 FabricDataFrames를 병합하면 DataFrames의 순서에 따라 SemPy가 의미 체계 정보를 전파하는 방식이 결정됩니다.
두 FabricDataFrames 모두에 주석이 달린 경우 왼쪽 FabricDataFrame의 테이블 수준 메타데이터가 우선합니다. 개별 열에도 동일한 규칙이 적용됩니다. 왼쪽 FabricDataFrame의 열 주석이 오른쪽 DataFrame의 열 주석보다 우선합니다.
하나의 FabricDataFrame에만 주석이 달린 경우 SemPy는 해당 메타데이터를 사용합니다. 개별 열에도 동일한 규칙이 적용됩니다. SemPy는 주석이 달린 FabricDataFrame에 있는 열 주석을 사용합니다.
연결을 통해 의미 체계 전파
여러 개의 FabricDataFrame을 연결할 때 각 열에 대해 SemPy는 열 이름과 일치하는 첫 번째 FabricDataFrame에서 메타데이터를 복사합니다. 일치하는 항목이 여러 개인데 메타데이터가 동일하지 않으면 SemPy에서 경고를 보냅니다.
FabricDataFrame을 먼저 배치하여 일반 Pandas DataFrames와 FabricDataFrames의 연결을 전파할 수도 있습니다.
Spark 사용자를 위한 의미 체계 전파
의미 체계 링크 Spark 네이티브 커넥터는 Spark 열의 메타데이터 사전을 하이드레이션합니다(또는 채웁니다). 현재 의미 체계 전파에 대한 지원은 제한적이며 스키마 정보가 전파되는 방식에 대한 Spark의 내부 구현에 따라 달라집니다. 예를 들어 열 집계는 메타데이터를 제거합니다.