Editar

Compartir vía


Preguntas más frecuentes sobre Data Factory en Microsoft Fabric

Este artículo le ofrece respuestas a las preguntas más frecuentes sobre Data Factory en Microsoft Fabric.

Data Factory en Fabric

¿Cuál es la diferencia entre la pestaña factoría de datos e ingeniería de datos en Fabric?

Data Factory le ayuda a resolver escenarios complejos de integración de datos y ETL con servicios de movimiento y transformación de datos a escala en la nube, mientras que la ingeniería de datos le ayuda a crear una instancia de almacén de lago, y usar Apache Spark para transformar y preparar los datos. Las diferencias entre cada una de las terminologías o experiencias de Fabric están disponibles en terminología de Microsoft Fabric.

¿Cómo se realiza un seguimiento y supervisión de la capacidad de Fabric usada con las canalizaciones?

Los administradores de capacidad de Microsoft Fabric pueden usar la aplicación Métricas de capacidad de Microsoft Fabric, también conocida como aplicación de métricas, para ver los recursos de capacidad. Esta aplicación permite a los administradores ver la cantidad de uso de CPU, tiempo de procesamiento y memoria que usan las canalizaciones de datos, los flujos de datos y otros elementos de sus áreas de trabajo habilitadas para la capacidad de Fabric. Vea las causas de sobrecarga, los tiempos de demanda máxima, el consumo de recursos y mucho más e identifique fácilmente los elementos más exigentes o más populares.

¿Qué enfoque se recomienda para asignar roles dentro de Data Factory en Fabric?

Puede separar las distintas cargas de trabajo entre áreas de trabajo y usar roles como miembro y visor para tener un área de trabajo destinada a la ingeniería de datos, que prepare los datos para un área de trabajo que se use en informes o en el entrenamiento de inteligencia artificial. Con el rol de visor, puede consumir datos del área de trabajo de ingeniería de datos.

¿Es posible conectarse a los recursos habilitados para punto de conexión privado (PE) existentes en Fabric Data Factory?

Actualmente, la puerta de enlace de red virtual ofrece un método inyectable para integrarse sin problemas en la red virtual, lo que proporciona una sólida vía para usar puntos de conexión privados con los que establecer conexiones seguras a los almacenes de datos. Es importante tener en cuenta que, en este momento, la puerta de enlace de red virtual solo admite flujos de datos de Fabric. Sin embargo, tenemos pensado ampliar sus funcionalidades para abarcar canalizaciones de Fabric.

¿Cómo puedo conectarme a orígenes de datos locales en Fabric Data Factory?

Actualizaciones y precios de la versión

¿Dónde puedo encontrar actualizaciones mensuales disponibles en Fabric?

Las actualizaciones mensuales de Fabric están disponibles en blog de Microsoft Fabric.

¿Qué es el modelo de facturación y precios de Data Factory de Fabric?

Precios de Data Factory en Microsoft Fabric proporciona una guía completa sobre cómo se calculan los costes para las canalizaciones de datos y Flujo de datos Gen2. Incluye varios escenarios de ejemplos de precios para ayudarte a comprender mejor el modelo de precios.

¿Dónde puedo encontrar más información sobre las próximas características planeadas para Data Factory en Microsoft Fabric?

Novedades y previsiones para Data Factory en Microsoft Fabric proporciona información sobre las próximas características y sus escalas de tiempo de lanzamiento estimadas durante los próximos meses.

Canalizaciones de datos

¿Con qué rapidez puedo ingerir datos en canalizaciones de datos de Fabric?

Fabric Data Factory hace posible el desarrollo de canalizaciones que maximizan el rendimiento del movimiento de datos para su entorno. Estas canalizaciones hacen un uso completo de los siguientes recursos:

  • Ancho de banda de red entre los almacenes de datos de origen y destino
  • Operaciones de entrada/salida del almacén de datos de origen o destino por segundo (IOPS) y ancho de banda. Con este uso completo puede calcular el rendimiento total al medir el rendimiento mínimo disponible con los siguientes recursos:
  • Almacén de datos de origen
  • Almacén de datos de destino
  • Ancho de banda de red entre los almacenes de datos de origen y destino. Mientras tanto, trabajamos continuamente en innovaciones para darle mejor rendimiento posible. En la actualidad, el servicio puede mover un conjunto de datos TPC-DI (archivos parquet) de 1 TB a la tabla de almacén de datos de Fabric y al almacenamiento de datos en un plazo de cinco minutos, es decir, mover mil millones de filas en menos de un minuto. Tenga en cuenta que este rendimiento se ofrece solo como referencia y se logra al ejecutar el conjunto de datos de prueba anterior. El rendimiento real seguirá dependiendo de los factores enumerados anteriormente. Además, siempre puede mejorar el rendimiento si ejecuta varias actividades de copia en paralelo. Por ejemplo, mediante el bucle ForEach.

¿Estará disponible la característica CDC dentro de Data Factory en Fabric?

Nuestro enfoque actual implica el desarrollo activo de la funcionalidad CDC dentro de Data Factory en Fabric. Esta funcionalidad, que se añadirá más adelante, permite mover datos entre varios orígenes de datos al combinar diferentes patrones de copia, como el patrón de copia masiva o por lotes, el patrón de copia incremental o continua (CDC) y el patrón de copia en tiempo real en una experiencia de 5x5.

Dataflows Gen2

¿Fabric Dataflow Gen2 es similar a Power Query insertado en Azure Data Factory?

La actividad de Power Query dentro de ADF tiene algunos parecidos con Dataflow Gen2, pero también características adicionales que permiten acciones como escribir en destinos de datos específicos, etc. Esta comparación se alinea de forma más precisa con Dataflow Gen1 (flujos de datos de Power BI o flujos de datos de Power Apps). Consulte aquí para obtener más detalles: Diferencias entre Dataflow Gen1 y Dataflow Gen2.

En Flujo de datos Gen2 de Fabric, en ocasiones veo características como DataflowsStaginglakehouse/ DataflowsStagingwarehouse. ¿Cuáles son estas características?

En determinadas experiencias de usuario, es posible que veas artefactos del sistema que no están diseñados para la interacción. Es mejor ignorar estos artefactos, ya que en última instancia se retirarán de las experiencias Obtener datos en el futuro.

Error en la actualización con el mensaje de error “Error en la actualización del flujo de datos debido a permisos insuficientes para acceder a los artefactos de almacenamiento provisional”. ¿Cuál debo hacer?

Este mensaje de error se produce cuando el usuario que creó el primer flujo de datos del área de trabajo no ha iniciado sesión en Fabric durante más de 90 días o ha dejado la organización. Para resolverlo, el usuario mencionado en el mensaje de error debe iniciar sesión en Fabric. Si el usuario ha dejado la organización, abra una incidencia de soporte técnico.

Compatibilidad con canalizaciones de ADF/Synapse y ruta de migración

¿Cuál es el futuro de las canalizaciones de Azure Data Factory (ADF) y Synapse?

Las canalizaciones de Azure Data Factory (ADF) y Azure Synapse mantienen una hoja de ruta de plataforma como servicio (PaaS) independiente. Estas dos soluciones siguen coexistiendo junto con Fabric Data Factory, que actúa como oferta de software como servicio (SaaS). Las canalizaciones de ADF y Synapse siguen siendo totalmente compatibles y no hay planes para dejarlas en desuso. Es importante resaltar que, para los próximos proyectos, nuestra sugerencia es iniciarlos mediante Fabric Data Factory. Además, hemos creado estrategias para facilitar la transición de canalizaciones de ADF y Synapse a Fabric Data Factory, lo que les permite aprovechar las nuevas funcionalidades de Fabric. Puede obtener más información sobre ellas aquí.

Dadas las funcionalidades que faltan en Data Factory para Fabric, ¿cuáles son las razones para elegirla en lugar de las canalizaciones de ADF o Synapse?

A medida que nos esforzamos por añadir funcionalidades que falten e incorporar las sólidas funcionalidades de orquestación y flujo de trabajo de canalización de datos de ADF o Azure Synapse en Fabric Data Factory, reconocemos que ciertas características presentes en las canalizaciones de ADF o Synapse podrían ser esenciales para sus necesidades. Aunque le recomendamos seguir usando canalizaciones de ADF o Synapse si necesita estas características, le animamos a explorar antes las nuevas posibilidades de integración de datos en Fabric. Sus comentarios sobre qué características necesita para tener éxito son inestimables. Por todo ello, trabajamos de forma activa en la introducción de una nueva funcionalidad, que permita también la migración de las factorías de datos existentes de Azure a las áreas de trabajo de Fabric.

¿Las nuevas características de Fabric Data Factory también están disponibles en ADF o Synapse?

No aplicamos características nuevas de canalizaciones de Fabric a canalizaciones de ADF o Synapse. Mantenemos dos hojas de ruta independientes para Fabric Data Factory y ADF o Synapse. Evaluamos solicitudes de aplicar estas características en respuesta a los comentarios que recibimos.

¿Las canalizaciones de datos de Fabric son las mismas que las de Azure Synapse?

La función principal de la canalización de Fabric es similar a la canalización de Azure Synapse, pero mediante la canalización de Fabric los usuarios pueden aplicar todas las funcionalidades de análisis de datos de la plataforma Fabric. Puede encontrar diferencias importantes y asignaciones de características entre la canalización de Fabric y la canalización de Azure Synapse aquí: Diferencias entre Data Factory en Fabric y Azure.

¿Cómo se migran las canalizaciones existentes de Azure Data Factory o un área de trabajo de Azure Synapse a Fabric Data Factory?

Para facilitar la transición de los clientes a Microsoft Fabric desde Azure Data Factory (ADF), ofrecemos una variedad de características esenciales y mecanismos de soporte técnico. En primer lugar, proporcionamos compatibilidad completa con la mayoría de las actividades que se usan en ADF dentro de Fabric, junto con la adición de nuevas actividades adaptadas para notificaciones, como las funcionalidades de Teams y Outlook. Los clientes pueden acceder a una lista detallada de las actividades disponibles en Data Factory dentro de Fabric. Además, hemos introducido los conectores Fabric Lakehouse/Warehouse en Azure Data Factory, lo que permite la integración sin problemas de datos en el entorno OneLake de Fabric para los clientes de ADF. También proporcionamos una guía para los clientes de ADF que ayudan a asignar las transformaciones de flujo de datos de asignación existentes a nuevas transformaciones de Flujo de datos Gen2. Con la mirada puesta en el futuro, en nuestra hoja de ruta se incluye la capacidad de montar recursos de ADF en Fabric, lo que permitirá a los clientes conservar la funcionalidad de sus canalizaciones de ADF existentes en Azure mientras exploran Fabric y planean estrategias de actualización exhaustivas. Colaboramos estrechamente con los clientes y la comunidad para determinar las formas más eficaces de admitir la migración de canalizaciones de datos de ADF a Fabric. Como parte de este esfuerzo, proporcionaremos una experiencia de actualización que le permitirá probar las canalizaciones de datos existentes en Fabric mediante su montaje y actualización.