Поделиться через


# Семантическое распространение данных из семантических моделей

При чтении семантической модели в FabricDataFrame семантические сведения, такие как метаданные и заметки из семантической модели, автоматически присоединяются к FabricDataFrame. Из этой статьи вы узнаете, как библиотека SemPy Python сохраняет заметки, присоединенные к таблицам и столбцам семантической модели.

Семантическая распространение для пользователей pandas

Библиотека Python SemPy является частью функции семантической связи и обслуживает пользователей pandas. SemPy поддерживает операции, которые панды позволяют выполнять данные.

SemPy также позволяет распространять семантические данные из семантических моделей, с которыми вы работаете. Распространяя семантические данные, можно сохранять заметки, присоединенные к таблицам и столбцам в семантической модели при выполнении таких операций, как срез, слияние и объединение.

Структуру данных FabricDataFrame можно создать двумя способами:

  • Вы можете считывать таблицу или выходные данные меры из семантической модели в FabricDataFrame.

    При чтении из семантической модели в FabricDataFrame метаданные из Power BI автоматически гидратирует или заполняет кадр FabricDataFrame. Другими словами, FabricDataFrame сохраняет семантические данные из таблиц или мер модели.

  • Данные в памяти можно использовать для создания FabricDataFrame так же, как и для кадров данных Pandas.

    При создании FabricDataFrame из данных в памяти необходимо указать имя семантической модели, из которой FabricDataFrame может извлекать метаданные.

Способ сохранения семантических данных SemPy зависит от таких факторов, как операции, которые вы выполняете, и порядок выполняемых операций FabricDataFrames.

Семантическое распространение с помощью слияния

При слиянии двух кадров FabricDataFrame порядок кадров данных определяет, как SemPy распространяет семантические сведения.

  • Если оба объекта FabricDataFrame помечены, метаданные уровня таблицы левого кадра FabricDataFrame имеют приоритет. То же правило применяется к отдельным столбцам; Заметки столбцов в левом элементе FabricDataFrame имеют приоритет над заметками столбцов в правом кадре данных.

  • Если только один элемент FabricDataFrame аннотирован, SemPy использует его метаданные. То же правило применяется к отдельным столбцам; SemPy использует заметки столбцов, присутствующих в аннотированных объектах FabricDataFrame.

Семантическое распространение с объединением

При объединение нескольких объектов FabricDataFrame для каждого столбца SemPy копирует метаданные из первого кадра FabricDataFrame, соответствующего имени столбца. Если имеется несколько совпадений и метаданные не совпадают, SemPy выдает предупреждение.

Кроме того, вы можете распространять сцепления кадров FabricDataFrames с обычными кадрами данных pandas, сначала разместив FabricDataFrame.

Семантическое распространение для пользователей Spark

Семантическая ссылка Spark в собственном соединителе Spark гидратирует (или заполняет) словарь метаданных столбца Spark. В настоящее время поддержка семантического распространения ограничена и подвержена внутренней реализации Spark по распространению сведений о схеме. Например, агрегирование столбцов удаляет метаданные.