Udostępnij za pośrednictwem


Propagacja danych semantycznych z modeli semantycznych

Podczas odczytywania modelu semantycznego do elementu FabricDataFrame semantyczne informacje, takie jak metadane i adnotacje z modelu semantycznego, są automatycznie dołączane do elementu FabricDataFrame. Z tego artykułu dowiesz się, jak biblioteka SemPy języka Python zachowuje adnotacje dołączone do tabel i kolumn modelu semantycznego.

Propagacja semantyczna dla użytkowników biblioteki pandas w Pythonie

Biblioteka SemPy języka Python jest częścią funkcji linku semantycznego i obsługuje użytkowników biblioteki pandas. Biblioteka SemPy obsługuje operacje, które biblioteka pandas umożliwia wykonywanie na danych.

SemPy umożliwia również propagację danych semantycznych z modeli semantycznych, na których działasz. Propagując dane semantyczne, można zachować adnotacje dołączone do tabel i kolumn w modelu semantycznym podczas wykonywania operacji, takich jak fragmentowanie, scalanie i łączenie.

Strukturę danych FabricDataFrame można utworzyć na jeden z dwóch sposobów:

  • Możesz odczytać tabelę lub dane wyjściowe miary z modelu semantycznego do FabricDataFrame.

    Podczas odczytywania z modelu semantycznego do elementu FabricDataFrame metadane z usługi Power BI automatycznie nawilżają lub wypełniają element FabricDataFrame. Innymi słowy element FabricDataFrame zachowuje semantyczne informacje z tabel lub miar modelu.

  • Możesz użyć danych w pamięci, aby utworzyć element FabricDataFrame, podobnie jak w przypadku ramek danych biblioteki pandas.

    Podczas tworzenia elementu FabricDataFrame na podstawie danych w pamięci należy podać nazwę modelu semantycznego, z którego element FabricDataFrame może ściągać informacje o metadanych.

Sposób zachowywania danych semantycznych przez bibliotekę SemPy różni się w zależności od czynników, takich jak wykonywane operacje i kolejność wykonywanych elementów FabricDataFrame.

Propagacja semantyczna z scaleniem

Podczas scalania dwóch FabricDataFrame'ów kolejność DataFrame'ów określa sposób propagacji informacji semantycznych przez bibliotekę SemPy.

  • Jeśli oba FabricDataFrame są oznaczone, pierwszeństwo mają metadane na poziomie tabelarycznym lewego FabricDataFrame. Ta sama reguła dotyczy poszczególnych kolumn; adnotacje kolumn w lewym elemencie FabricDataFrame mają pierwszeństwo przed adnotacjami kolumn w prawej ramce danych.

  • Jeśli tylko jedna ramka FabricDataFrame jest oznaczona, SemPy używa jej metadanych. Ta sama zasada dotyczy poszczególnych kolumn; SemPy używa adnotacji kolumn znajdujących się w anotowanym obiekcie FabricDataFrame.

Propagacja semantyczna z konkatenacją

Po połączeniu wielu obiektów FabricDataFrame dla każdej kolumny SemPy kopiuje metadane z pierwszego obiektu FabricDataFrame zgodnego z nazwą kolumny. Jeśli istnieje wiele dopasowań, a metadane nie są takie same, program SemPy wyświetla ostrzeżenie.

Można również propagować łączenie FabricDataFrame z zwykłymi ramkami danych biblioteki pandas, umieszczając FabricDataFrame na początku.

Propagacja semantyczna dla użytkowników platformy Spark

Łącznik semantyczny natywny Spark uzupełnia (lub wypełnia) słownik metadanych kolumny Spark. Obecnie obsługa propagacji semantycznej jest ograniczona i podlega wewnętrznej implementacji platformy Spark dotyczącej propagacji informacji o schemacie. Na przykład agregacja kolumn usuwa metadane.