¿Qué es el vínculo semántico?
Vínculo semántico es una característica que permite establecer una conexión entre modelos semánticos y Ciencia de datos de Synapse en Microsoft Fabric. El uso del vínculo semántico solo se admite en Microsoft Fabric.
Para Spark 3.4 y versiones posteriores, el vínculo semántico está disponible en el entorno de ejecución predeterminado al usar Fabric y no es necesario instalarlo.
Para Spark 3.3 y versiones anteriores, o para actualizar a la versión más reciente del vínculo semántico, ejecute el siguiente comando:
%pip install -U semantic-link
Los objetivos principales del vínculo semántico son:
- Facilitar la conectividad de datos.
- Habilitar la propagación de información semántica.
- Integrarse perfectamente con las herramientas establecidas que usan los científicos de datos, como los cuadernos.
El vínculo semántico le ayuda a conservar el conocimiento del dominio sobre la semántica de datos de una manera estandarizada que puede acelerar el análisis de datos y reducir los errores.
Flujo de datos del vínculo semántico
El flujo de datos del vínculo semántico comienza con modelos semánticos que contienen datos e información semántica. El vínculo semántico puentea la brecha entre Power BI y la experiencia de Synapse Ciencia de datos.
El vínculo semántico le permite usar modelos semánticos de Power BI en la experiencia de Synapse Ciencia de datos para realizar tareas como el análisis estadístico detallado y el modelado predictivo con técnicas de aprendizaje automático. Puede almacenar la salida del trabajo de Ciencia de datos en OneLake mediante Apache Spark e ingerir la salida almacenada en Power BI mediante Direct Lake.
Conectividad de Power BI
Un modelo semántico sirve como modelo de objetos tabular único, lo que proporciona un origen confiable para las definiciones semánticas, como las medidas de Power BI. El vínculo semántico se conecta a modelos semánticos en los siguientes ecosistemas, lo que facilita a los científicos de datos trabajar en el sistema con el que están más familiarizados.
- Ecosistema de pandas de Python a través de la biblioteca de Python de SemPy.
- Ecosistema de Apache Spark, a través del conector nativo de Spark. Esta implementación admite varios lenguajes, como PySpark, Spark SQL, R y Scala.
Aplicaciones de información semántica
La información semántica de los datos incluye categorías de datos de Power BI, como dirección y código postal, relaciones entre tablas e información jerárquica.
Estas categorías de datos componen los metadatos que vínculo semántico propaga en el entorno de Synapse Ciencia de datos para permitir nuevas experiencias y mantener el linaje de datos.
Algunas aplicaciones de ejemplo de vínculo semántico incluyen:
- Sugerencias inteligentes de funciones semánticas integradas.
- Integración innovadora para aumentar los datos con medidas de Power BI mediante el uso de medidas de adición.
- Herramientas para validación de calidad de datos en función de las relaciones entre tablas y dependencias funcionales dentro de las tablas.
Vínculo semántico es una herramienta eficaz que permite a los analistas de negocios usar datos de forma eficaz en un entorno completo de ciencia de datos.
Vínculo semántico facilita la colaboración sin problemas entre científicos de datos y analistas de negocios mediante la eliminación de la necesidad de volver a implementar la lógica de negocios insertada en medidas de Power BI. Este enfoque garantiza que ambas partes puedan trabajar de forma eficaz y productiva, maximizando el potencial de sus conclusiones controladas por datos.
Estructura de datos FabricDataFrame
FabricDataFrame es la estructura de datos principal que usa vínculo semántico para propagar la información semántica de los modelos semánticos al entorno de Synapse Ciencia de datos.
La clase FabricDataFrame
:
- Admite todas las operaciones de pandas.
- Realiza subclases de DataFrame de Pandas y agrega metadatos, como información semántica y linaje.
- Expone funciones semánticas y el método de add-measure que le permiten usar medidas de Power BI en el trabajo de ciencia de datos.
Contenido relacionado
- Explore la documentación de referencia del paquete de vínculos semánticos de Python (SemPy)
- Tutorial: Limpieza de datos con dependencias funcionales
- Conectividad de Power BI con el vínculo semántico y Microsoft Fabric
- Exploración y validación de datos mediante el vínculo semántico
- Exploración y validación de relaciones en modelos semánticos