Exploración de equipos de datos y Microsoft Fabric
La plataforma unificada de análisis de datos de Microsoft Fabric facilita la colaboración de profesionales de datos en proyectos. Fabric aumenta la colaboración entre profesionales de datos mediante la eliminación de silos de datos y la necesidad de varios sistemas.
Roles y desafíos tradicionales
En un proceso de desarrollo de análisis tradicional, los equipos de datos suelen enfrentar varios desafíos debido a la división de tareas y flujos de trabajo de datos.
Los ingenieros de datos procesan y curan datos para los analistas, que luego los usan para crear informes empresariales. Este proceso requiere una amplia coordinación, lo que suele dar lugar a retrasos y errores de interpretación.
Los analistas de datos suelen necesitar realizar transformaciones de datos de bajada antes de crear informes de Power BI. Este proceso consume mucho tiempo y puede carecer del contexto necesario, lo que dificulta que los analistas se conecten directamente con los datos.
Los científicos de datos se enfrentan a dificultades para integrar técnicas nativas de ciencia de datos con sistemas existentes, que a menudo son complejas y hacen que sea difícil proporcionar información basada en datos de forma eficaz.
Evolución de flujos de trabajo colaborativos
Microsoft Fabric simplifica el proceso de desarrollo de análisis mediante la unificación de herramientas en una plataforma SaaS. Fabric permite que diferentes roles colaboren eficazmente sin duplicar los esfuerzos.
Los ingenieros de datos pueden ingerir, transformar y cargar datos directamente en OneLake mediante canalizaciones, que automatizan los flujos de trabajo y admiten la programación. Pueden almacenar datos en lakehouses mediante el formato Delta-Parquet para un almacenamiento y control de versiones eficientes. Los cuadernos proporcionan funcionalidades avanzadas de scripting para transformaciones complejas.
Los analistas de datos pueden transformar los datos ascendentes mediante flujos de datos y conectarse directamente a OneLake con el modo Direct Lake, lo que reduce la necesidad de transformaciones de bajada. Pueden crear informes interactivos de forma más eficaz mediante Power BI.
Los científicos de datos pueden usar cuadernos integrados compatibles con Python y Spark para compilar y probar modelos de aprendizaje automático. Pueden almacenar y acceder a datos en lakehouses e integrarse con Azure Machine Learning para poner en marcha e implementar modelos.
Ingenieros de Análisis puentean la brecha entre la ingeniería de datos y el análisis mediante la selección de recursos de datos en lakehouses, la garantía de la calidad de los datos y la habilitación del análisis de autoservicio. Pueden crear modelos semánticos en Power BI para organizar y presentar datos de forma eficaz.
Usuarios de bajo códigoto-no y desarrolladores ciudadanos pueden descubrir conjuntos de datos seleccionados a través del OneLake Hub y usar plantillas de Power BI para crear rápidamente informes y paneles. También pueden usar flujos de datos para realizar tareas ETL sencillas sin depender de ingenieros de datos.