Поделиться через


Что такое семантическая связь?

Семантическая связь — это функция, которая позволяет установить связь между семантических моделей и Synapse Обработка и анализ данных в Microsoft Fabric. Использование семантической ссылки поддерживается только в Microsoft Fabric.

Для Spark 3.4 и более поздних версий семантическая ссылка доступна в среде выполнения по умолчанию при использовании Fabric и не требуется устанавливать ее. Если вы используете Spark 3.3 или ниже или хотите обновить до последней версии семантической ссылки, можно выполнить следующую команду:

%pip install -U semantic-link

Основными целями семантической связи являются упрощение подключения к данным, распространение семантической информации и простая интеграция с установленными инструментами, используемыми специалистами по обработке и анализу данных, например записными книжками. семантическая связь помогает сохранять знания о семантике данных в стандартизированном режиме, который может ускорить анализ данных и уменьшить ошибки.

Поток данных начинается с семантических моделей, содержащих данные и семантические сведения. Семантическая связь мостит разрыв между Power BI и интерфейсом Обработка и анализ данных.

Схема, демонстрирующая поток данных из Power BI в записные книжки в Synapse Обработка и анализ данных и обратно в Power BI.

С помощью семантической связи можно использовать семантические модели из Power BI в интерфейсе Обработка и анализ данных для выполнения таких задач, как подробный статистический анализ и прогнозное моделирование с помощью методов машинного обучения. Выходные данные работы по обработке и анализу данных можно хранить в OneLake с помощью Apache Spark и приема в Power BI с помощью Direct Lake.

Возможность подключения к Power BI

Семантические модели служат одной табличной объектной моделью, предоставляя надежный источник для семантических определений, таких как меры Power BI. Чтобы подключиться к семантической модели, выполните приведенные действия.

  • Семантическая ссылка обеспечивает подключение данных к экосистеме Pandas Python через библиотеку Python SemPy, что упрощает работу с данными специалистами по обработке и анализу данных.
  • Семантическая ссылка обеспечивает доступ к семантической модели через собственный соединитель Spark для специалистов по обработке и анализу данных, которые более знакомы с экосистемой Apache Spark . Эта реализация поддерживает различные языки, включая PySpark, Spark SQL, R и Scala.

Приложения семантической информации

Семантическая информация в данных включает в себя категории данных Power BI, такие как адрес и почтовый индекс, связи между таблицами и иерархические сведения. Эти категории данных содержат метаданные, которые семантическая связь распространяется в среду Обработка и анализ данных для обеспечения новых возможностей и поддержания происхождения данных. Ниже приведены примеры приложений семантической связи:

  • Интеллектуальные предложения встроенных семантических функций.
  • Инновационная интеграция для расширения данных с помощью мер Power BI с помощью мер надстроек.
  • Средства проверки качества данных на основе связей между таблицами и функциональными зависимостями в таблицах.

Семантическая связь — это мощный инструмент, позволяющий бизнес-аналитикам эффективно использовать данные в комплексной среде обработки и анализа данных. Семантическая связь упрощает совместную работу между специалистами по обработке и анализу данных и бизнес-аналитиками, устраняя необходимость повторного выполнения бизнес-логики, внедренной в меры Power BI. Этот подход гарантирует, что обе стороны могут эффективно и продуктивно работать, максимизируя потенциал их аналитических сведений на основе данных.

FabricDataFrame Структура данных

FabricDataFrame — это основная структура данных семантической связи. Он подклассирует кадр данных Pandas и добавляет метаданные, такие как семантическая информация и происхождение. FabricDataFrame — это основная структура данных, которая использует семантику для распространения семантической информации из семантических моделей в среду Обработка и анализ данных.

Схема, показывющая поток данных из соединителей в семантические модели в FabricDataFrame на семантические функции.

FabricDataFrame поддерживает все операции pandas и многое другое. Она предоставляет семантические функции и метод меры надстроек, которые позволяют использовать меры Power BI в работе по обработке и анализу данных.