¿Qué es el vínculo semántico?

Vínculo semántico es una característica que permite establecer una conexión entre modelos semánticos y Ciencia de datos de Synapse en Microsoft Fabric. El uso del vínculo semántico solo se admite en Microsoft Fabric.

Para Spark 3.4 y versiones posteriores, el vínculo semántico está disponible en el entorno de ejecución predeterminado al usar Fabric y no es necesario instalarlo. Si usa Spark 3.3 o inferior, o si desea actualizar a la versión más reciente del vínculo semántico, puede ejecutar el comando:

%pip install -U semantic-link

Los principales objetivos de vínculo semántico son facilitar la conectividad de datos, habilitar la propagación de información semántica e integrar sin problemas con herramientas establecidas usadas por científicos de datos, como cuadernos. El vínculo semántico le ayuda a conservar el conocimiento del dominio sobre la semántica de datos de una manera estandarizada que puede acelerar el análisis de datos y reducir los errores.

El flujo de datos comienza con modelos semánticos que contienen datos e información semántica. EL vínculo semántico puentea la brecha entre Power BI y la experiencia de Ciencia de datos.

Diagrama que muestra el flujo de datos de Power BI a cuadernos de ciencia de datos de Synapse y de vuelta a Power BI.

Con el vínculo semántico, puede usar modelos semánticos de Power BI en la experiencia de Ciencia de datos para realizar tareas como el análisis estadístico detallado y el modelado predictivo con técnicas de aprendizaje automático. La salida del trabajo de Ciencia de datos se puede almacenar en OneLake mediante Apache Spark e ingerir en Power BI mediante Direct Lake.

Conectividad de Power BI

Los modelos semánticos sirven como modelo de objetos tabular único, lo que proporciona un origen confiable para las definiciones semánticas, como las medidas de Power BI. Para conectarse a modelos semánticos:

  • Vínculo semántico ofrece conectividad de datos con el ecosistema de Pandas de Python a través de la biblioteca de Python SemPy, lo que facilita a los científicos de datos trabajar con los datos.
  • Vínculo semántico proporciona acceso a los modelos semánticos a través del conector nativo de Spark para científicos de datos que están más familiarizados con el ecosistema de Apache Spark. Esta implementación admite varios lenguajes, como PySpark, Spark SQL, R y Scala.

Aplicaciones de información semántica

La información semántica de los datos incluye categorías de datos de Power BI, como dirección y código postal, relaciones entre tablas e información jerárquica. Estas categorías de datos componen los metadatos que vínculo semántico propaga en el entorno de Ciencia de datos para permitir nuevas experiencias y mantener el linaje de datos. Algunas aplicaciones de ejemplo de vínculo semántico son:

Vínculo semántico es una herramienta eficaz que permite a los analistas de negocios usar datos de forma eficaz en un entorno completo de ciencia de datos. Vínculo semántico facilita la colaboración sin problemas entre científicos de datos y analistas de negocios mediante la eliminación de la necesidad de volver a implementar la lógica de negocios insertada en medidas de Power BI. Este enfoque garantiza que ambas partes puedan trabajar de forma eficaz y productiva, maximizando el potencial de sus conclusiones controladas por datos.

Estructura de datos FabricDataFrame

FabricDataFrame es la estructura de datos principal de vínculo semántico. Realiza subclases de DataFrame de Pandas y agrega metadatos, como información semántica y linaje. FabricDataFrame es la estructura de datos principal que usa vínculo semántico para propagar la información semántica de los modelos semánticos al entorno de Ciencia de datos.

Diagrama que muestra el flujo de datos desde conectores de modelos semánticos a FabricDataFrame a funciones semánticas.

FabricDataFrame admite todas las operaciones de Pandas y mucho más. Expone funciones semánticas y el método de add-measure que le permiten usar medidas de Power BI en el trabajo de ciencia de datos.