Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Una plataforma de datos unificada depende de estándares coherentes de ingesta, transformación y publicación para que los líderes puedan confiar en los datos de análisis e inteligencia artificial. Recomendación: Establezca estándares de toda la organización que controlen qué datos entran en OneLake, cómo los equipos refinan esos datos y cómo los productos de datos regulados llegan a los consumidores (consulte la figura 1). Para aplicar esta recomendación, use este artículo como lista de comprobación:
Figura 1. Tres pasos para establecer estándares operativos para los datos.
1. Establecimiento de estándares de ingesta de datos
OneLake actúa como lago de datos central para el análisis y la inteligencia artificial en Microsoft Fabric, por lo que los líderes deben controlar lo que entra. Recomendación: Establezca límites claros para que los equipos solo procesen datos que apoyen resultados empresariales definidos. Para aplicar esta recomendación, use la siguiente lista de comprobación.
¿Qué datos se unifican? La unificación de datos en OneLake significa seleccionar datos que admitan un producto de datos vinculado a un resultado empresarial medible. Procedimientos recomendados: Solo incorpore datos a OneLake si admite un producto de datos y agrega valor empresarial. Trate la ingesta de datos como una decisión de producto en lugar de un valor predeterminado técnico. Guía de decisión: Decida ingerir datos cuando explique o mida un proceso empresarial o un resultado que los líderes realicen. Elija dejar los datos en sistemas operativos o almacenamiento departamental cuando no exista ningún caso de uso activo. Esta opción reduce el costo de almacenamiento y la sobrecarga de gobernanza.
Mantenga el contenido de colaboración y conocimiento en Microsoft 365. Los datos de Microsoft 365 admiten agentes de Microsoft 365 Copilot. Estos agentes recuperan documentos, correos electrónicos y artefactos de colaboración al tiempo que respetan los permisos existentes. Consulte Arquitectura de Microsoft 365 Copilot. Procedimientos recomendados: Use Microsoft 365 como sistema de registro para el contenido cuyo propósito principal es la colaboración, la referencia o la recuperación de conocimientos. Use la guía de adopción de Microsoft 365 para preparar estos datos.
Integre las bases de datos operativas a través de patrones admitidos. Las bases de datos operativas suelen proporcionar escenarios de análisis e inteligencia artificial, pero el acceso directo crea riesgos e inestabilidad. Procedimientos recomendados: Use patrones compatibles con Microsoft Fabric, como accesos directos para el acceso virtual y la creación de reflejo para el acceso replicado. Las bases de datos de Azure suelen requerir la creación de reflejo para una integración confiable. Guía de decisión: Elija accesos directos cuando el acceso virtual satisfaga las necesidades de rendimiento. Elija duplicación cuando el rendimiento del análisis, el aislamiento o la reutilización posterior requieran una copia física en OneLake.
Integre los lagos de datos existentes. Muchas organizaciones ya operan lagos de datos, como Azure Data Lake Storage (ADLS), Google Cloud Storage o Amazon S3. Procedimientos recomendados: Trate los lagos existentes como parte del patrimonio de datos unificado en lugar de forzar la migración inmediata. Use métodos abreviados o creación de reflejo. Guía de decisión: Decida en función de la preparación y el riesgo. Para evitar la duplicación, elija métodos abreviados. Elija la creación de reflejo cuando la coherencia, el rendimiento o el cumplimiento superen el costo de duplicación.
Surface Azure Databricks genera salidas en OneLake. Azure Databricks a menudo genera datos de análisis curados. Procedimientos recomendados: Mantenga las canalizaciones de Databricks como están y presente las salidas Gold finales en OneLake. Guía de decisión: Elija métodos abreviados para evitar la replicación y cuando el acceso remoto satisfaga las necesidades. Elija la creación de reflejo cuando los patrones de gobernanza o consumo exijan datos locales.
Separe la ingesta de datos internos y externos. Los datos de análisis interno y los datos externos requieren controles diferentes. Procedimientos recomendados: Cree áreas de trabajo independientes o áreas de lago para productos de datos externos. Almacene solo conjuntos de datos externos aprobados en esas ubicaciones. Guía de decisión: Decida con antelación si los datos admiten decisiones internas o uso compartido externo. Elija la separación física para reducir la exposición accidental y simplificar la aplicación de directivas de seguridad.
2. Establecimiento de estándares de transformación de datos
La obtención de datos en OneLake es solo el primer paso. El valor real procede de transformar los datos sin procesar en productos de datos de alta calidad y listos para usar. Los líderes no diseñan canalizaciones, pero definen plataformas y estándares arquitectónicos que impiden la fragmentación. Recomendación: Estandarizar las plataformas de transformación y aplicar una arquitectura de refinamiento coherente. Para aplicar esta recomendación, use la siguiente lista de comprobación:
2.1. Uso de la plataforma de datos adecuada
Su elección de plataforma establece requisitos operativos para los productos de datos en entornos de Microsoft y Azure. Recomendación: Para cada producto de datos, equilibre la simplicidad y la integración con la necesidad de capacidades de ingeniería especializadas. Para aplicar esta recomendación, use la siguiente lista de comprobación:
Tejido (valor predeterminado). Fabric proporciona motores integrados de ingeniería de datos, análisis y BI que funcionan directamente en OneLake, que actúa como el patrimonio de datos regulado unificado para la organización. Procedimientos recomendados: Use Fabric para la preparación de datos, informes y análisis estándar. Favorece los motores nativos de Fabric, como Dataflows Gen2, Spark y SQL para simplificar el control de acceso, el linaje y la administración de costos. Use OneLake como capa de almacenamiento única. Guía de decisión: Elija Fabric cuando los requisitos se ajusten a las capacidades integradas y cuando el liderazgo valore la gobernanza y la facturación unificadas. Acepte una personalización limitada a cambio de una menor sobrecarga operativa.
Azure Databricks. Muchas personas prefieren Azure Databricks. Admite el procesamiento a gran escala y escenarios avanzados de aprendizaje automático. Procedimientos recomendados: Siga usando Databricks donde ya existe experiencia o escalado. Requerir que las salidas se alojen en OneLake o se conecten a través de accesos directos a OneLake para que la gobernanza, la seguridad y la detección permanezcan centralizadas. Guía de decisión: Elija Databricks cuando Fabric no cumpla los requisitos actuales. Acepte una mayor integración y sobrecarga en habilidades como compensación.
Aplicar límites de propiedad de la plataforma. Definir claramente los límites de la plataforma evita los costos duplicados y la lógica inconsistente entre sistemas. Procedimientos recomendados: Asigne la responsabilidad de cada clase de carga de trabajo a una plataforma. Requerir una revisión de arquitectura antes de aprobar el procesamiento multiplataforma. Guía de decisión: Decida qué plataforma posee resultados de ingesta, transformación y análisis. Evite las transformaciones duplicadas y las canalizaciones superpuestas que proporcionan el mismo resultado empresarial.
2.2. Aplicación de la arquitectura de medallion
La arquitectura medallion establece confianza, coherencia y gobernanza en todos los productos de datos mediante la definición de una progresión clara de los datos sin procesar a las salidas listas para la empresa. Recomendación: Requerir que todos los productos de datos de OneLake sigan una estructura bronce, plata y oro y prohíben accesos directos que omiten estas capas. Para aplicar esta recomendación, use la siguiente lista de comprobación:
Exigir una capa de bronce como el sistema de registro (ingesta sin procesar): la capa de bronce captura los datos exactamente al llegar a OneLake y conserva la fidelidad original de la fuente. Procedimientos recomendados: Almacene los datos como solo adjuntos e inmutables. Prohibir correcciones o enriquecimiento en esta fase. Requerir que todos los conjuntos de datos entrantes se almacenen inicialmente en el área de bronce. Guía de decisión: Decida que el bronce solo existe para preservar la verdad de los sistemas de origen. Acepte una facilidad de uso más lenta a cambio de auditabilidad y rastreabilidad.
Establezca la capa plateada como vista confiable. La capa plateada contiene datos validados, estandarizados y limpios de la que los equipos dependen para realizar un análisis coherente. Procedimientos recomendados: Aplique reglas de calidad de datos, alineación de formato y validación empresarial básica. Documente los conjuntos de datos silver claramente y administre los cambios a través de procesos de gobernanza. Guía de decisión: Elija plata como capa limpia autoritativa. Prohíbe que los equipos vuelvan a limpiar de manera independiente los datos sin procesar, lo que crea interpretaciones conflictivas.
Gold (contexto empresarial, productos de datos): Certifique los conjuntos de datos gold como productos de datos empresariales. La capa gold ofrece productos de datos regulados que los líderes usan para tomar decisiones, realizar un seguimiento del rendimiento e informar. Prácticas recomendadas: Alinee los datos dorados con las definiciones y métricas aprobadas del negocio. Optimice las estructuras para el consumo. Registre todos los conjuntos de datos gold como un producto de datos en Microsoft Purview con los detalles de propiedad, propósito y actualización. Guía de decisión: Decida que cualquier conjunto de datos usado en todos los equipos o para las decisiones debe existir en oro. Rechazar conjuntos de datos no administrados o no validados que omiten la gobernanza.
Cree productos saneados para su uso externo. El uso compartido externo requiere una separación deliberada de los datos operativos internos. Procedimientos recomendados: Genere conjuntos de datos mantenidos que quiten o enmascaran campos confidenciales y reduzcan los detalles cuando sea necesario. Asigne la propiedad y aplique etiquetas claras, como uso público o externo. Almacene estos conjuntos de datos en ubicaciones aprobadas. Guía de decisión: Elija tratar los conjuntos de datos externos como productos independientes. Acepte los pasos de gobernanza agregados para reducir el riesgo legal y de seguridad.
Fabric admite este modelo mediante vistas de lago materializadas que pueden administrar automáticamente las transformaciones. Consulte Medallion Lakehouse Architecture in Fabric. Para obtener una arquitectura de análisis, consulte Análisis de un extremo a otro con Microsoft Fabric.
Tabla. Ejemplo de arquitectura medallion. La capa gold combina datos de dos conjuntos de datos.
| Conjunto de datos | Nivel | Ejemplo de datos | ¿Qué pasó |
|---|---|---|---|
| Transacciones de ventas | Bronce | OrderID=984321 · StoreID=17 · Amount="1,200" · TxnDate="2026-01-05T14:32:09Z" | Este registro llegó del sistema de ventas exactamente como se envió. El valor es texto. La marca de tiempo sigue el formato del sistema. No se aplica ningún significado. |
| Plata | OrderID=984321 · StoreID=17 · Importe=1200.00 · FechaTransacción=05-01-2026 | La transacción está estandarizada y validada. La cantidad es numérica. La fecha sigue las reglas de la empresa. Los datos ahora son de confianza. | |
| Referencia de la tienda | Bronce | StoreID="17" · RegionName="EAST " | Este registro llegó desde un sistema de ubicación. El formato refleja el origen. |
| Plata | StoreID=17 · Region=East | Los identificadores de almacén se alinean con los datos de ventas. Los valores de región están limpiados y son coherentes. | |
| Ingresos diarios por región | Oro | Region=East · Date=2026-01-05 · TotalRevenue=425000 | Este valor combina las transacciones de ventas Silver con los datos de referencia de la tienda Silver. Los registros individuales se resumen para responder a una pregunta empresarial. |
2.3. Considere la posibilidad de una capa dorada adaptable
Adaptive Gold se incluye aquí como consideración de futuro. La idea es que use agentes de inteligencia artificial para crear capas doradas. Los agentes pueden observar patrones que tú quizás no puedas. Si los usuarios suelen pedir "principales problemas de cliente por región al mes", los agentes de inteligencia artificial pueden materializar ese conjunto de datos. Esta funcionalidad no se proporciona de forma predeterminada en Microsoft Fabric hoy mismo. Requeriría la creación de un agente de INTELIGENCIA ARTIFICIAL personalizado que funcione en la telemetría de Fabric y Power BI.
3. Establecimiento de estándares de publicación de productos de datos
Los estándares de publicación definen cómo su organización expone productos de datos de confianza a través de Microsoft Fabric OneLake y Microsoft Purview. El objetivo es escalar la reutilización, aplicar la gobernanza y reducir el riesgo en las cargas de trabajo de análisis e inteligencia artificial. Recomendación: Establezca un único estándar de publicación que haga que todos los productos de datos aprobados sean reconocibles, regulados y claramente diseñados para un público definido antes de un uso amplio. Para aplicar esta recomendación, use la siguiente lista de comprobación:
Estandarizar la publicación a través del catálogo de OneLake. OneLake Catalog proporciona una superficie de acceso unificada para los productos de datos en Fabric y plataformas de procesamiento externas, como Databricks. Procedimientos recomendados: Use OneLake como capa de ejecución y consumo predeterminadas para todos los productos de datos aprobados. Trate Microsoft Purview como el sistema de registro para las definiciones empresariales y de gobernanza. Esta alineación permite que Power BI, los agentes de datos de Fabric y Azure AI Search consuman datos de forma coherente al tiempo que permiten la visibilidad centralizada de la gobernanza.
Asegúrese de la detectabilidad. La detectabilidad garantiza que los responsables de la toma de decisiones y los consumidores puedan encontrar productos de datos de confianza sin depender de conocimientos informales. Procedimientos recomendados: Configure la visibilidad del área de trabajo de Fabric para que las audiencias pertinentes puedan detectar elementos. No necesitan acceso, solo la capacidad de solicitar acceso. Habilite los flujos de trabajo de solicitud de acceso de Purview para que los usuarios puedan solicitar permiso directamente desde el catálogo. Guía de decisión: Elija una amplia detectabilidad cuando el objetivo se reutilice entre dominios. Elija la detectabilidad limitada cuando se apliquen restricciones de confidencialidad o normativas. Equilibre la visibilidad con los controles de acceso en lugar de ocultar los recursos.
Exigir el enriquecimiento de metadatos en la publicación. Los metadatos proporcionan contexto que permite a los líderes evaluar la idoneidad, la confianza y la reutilización de un producto de datos. Procedimientos recomendados: Requerir metadatos descriptivos en la publicación. Use etiquetas en Fabric para clasificar los productos por dominio empresarial o iniciativa. Asegúrese de que las descripciones explican el propósito y el ámbito de los datos. Esta práctica admite la búsqueda de catálogos y mejora la confianza en la reutilización. Guía de decisión: Decida si los requisitos de metadatos siguen siendo mínimos o aplican un esquema estándar. Elija un esquema estándar cuando la organización opera varios dominios y necesita coherencia. Elija un enfoque más claro para las primeras fases de madurez.
Avale y certifique cuando proceda. Defina criterios de aprobación y certificación. La aprobación indica el nivel de confianza y la madurez de la gobernanza a la organización. Procedimientos recomendados: Usar 'Promocionado' para indicar productos recomendados por el ámbito. Use Certified para indicar los productos que pasaron una revisión formal de gobernanza. Aplique la certificación a los conjuntos de datos Gold que admiten informes ejecutivos o análisis críticos. Guía sobre el respaldo de Fabric en Respaldo. Guía de decisión: Decida qué productos requieren certificación. Elija la certificación obligatoria para cargas de trabajo ejecutivas o normativas. Elija la certificación opcional cuando la velocidad y la experimentación tienen prioridad. Acepte la incorporación más lenta como compensación para una mayor confianza.
Publicar como un producto de datos en Purview. Los productos de datos de Purview proporcionan una vista de nivel superior que agrupa los recursos en un ciclo de vida de producto administrado. Procedimientos recomendados: Cree una entrada de producto de datos de Purview para cada producto de datos publicado. Incluya el nombre del producto, la descripción, los propietarios, el estado de calidad y los recursos relacionados, como tablas, modelos e informes. Productos de Datos de Referencia en el Catálogo Unificado. Guía de decisión: Decida si los productos de datos de Purview son necesarios para todos los recursos publicados o solo para productos estratégicos. Elija cobertura completa cuando la visibilidad de la cartera sea importante. Elija la cobertura selectiva cuando la capacidad de gobernanza esté limitada.
Declare la audiencia y el uso previstos. La intención clara evita el uso incorrecto y admite el cumplimiento en escenarios de análisis e inteligencia artificial. Procedimientos recomendados: Requerir que cada producto de datos indique su público previsto y el tipo de carga de trabajo admitido. Especifique el uso interno, asociado o público. Identifique escenarios web públicos, de inteligencia artificial, de análisis o de inteligencia empresarial. Use los metadatos de Purview, los términos del glosario y las etiquetas de confidencialidad juntos para expresar esta intención de forma coherente. Guía de decisión: Decida si el uso externo o del agente requiere aprobación adicional. Elija la aprobación más estricta cuando los datos salgan de los límites de la organización. Acepte una publicación más lenta como equilibrio para reducir el riesgo.