Compartir a través de


Escenario de precios usando una canalización de datos para cargar 1 TB de datos de Parquet en un almacén de datos

En este escenario, se usó una actividad de copia dentro de una canalización de datos para cargar 1 TB de datos de tabla de formato Parquet almacenados en Azure Data Lake Storage (ADLS) Gen2 en un almacén de datos de Microsoft Fabric.

Los precios usados en el ejemplo siguiente son hipotéticos y no pretenden implicar precios reales exactos. Estos son solo para demostrar cómo puede calcular, planear y administrar el costo de los proyectos de Data Factory en Microsoft Fabric. Además, dado que las capacidades de Fabric tienen un precio único entre regiones, utilizamos el modelo de pago por uso para una capacidad de Fabric en EE. UU. Oeste 2 (una región típica de Azure), a 0,18 USD por CU por hora. Consulte la página de precios de Microsoft Fabric para explorar otras opciones de precios de capacidad de Fabric.

Configuración

Para lograr este escenario, debe crear una canalización con la siguiente configuración:

Captura de pantalla que muestra la configuración de una canalización que copia datos de Parquet desde ADLS Gen2 a un almacenamiento de datos.

Estimación de costos mediante la aplicación de Métricas de Fabric

Captura de pantalla que muestra la duración y el consumo de CU del trabajo en la aplicación De métricas de Fabric.

La operación de movimiento de datos utilizó 3.960 segundos de CU y tuvo una duración de 662,64 segundos, mientras que la ejecución de la actividad fue nula, ya que no hubo actividades no relacionadas con la copia en la ejecución de la canalización.

Los precios se basan en la optimización de rendimiento inteligente usada, que depende de su máximo configurado en la actividad de copia. Se puede obtener del resultado de la actividad en usedDataIntegrationUnits. Para más información, consulte este artículo. En este ejemplo, la optimización de rendimiento inteligente usada es 4.

Los segundos de CU utilizados se pueden derivar mediante el siguiente cálculo:

Según el modelo de precios de canalización de datos, cada unidad de rendimiento de optimización inteligente consume 1,5 CU horas. Dado que la optimización de rendimiento inteligente utilizada es 4, y la duración de la operación de movimiento de datos es de 662,64 segundos (aproximadamente 11 minutos), el total de horas cu utilizadas será:

Horas CU utilizadas = 4 * 1,5 * (11/60) = 1,1

Para convertir las horas CU en segundos CU, multiplique por 3600 (el número de segundos en una hora).

Segundos de CU utilizados = 1,1 * 3600 = 3960

Nota:

Aunque se notifica como métrica, la duración real de la ejecución no es pertinente al calcular las horas de CU efectivas con la aplicación Métricas de Fabric, ya que la métrica de segundos de CU que también notifica ya tiene en cuenta su duración.

Métrica Operación de movimiento de datos
Segundos de CU 3.960 segundos de CU
Horas de CU efectivas (3,960) / (60*60) CU-horas = 1,1 CU-horas

Costo total de ejecución a $0,18/CU hora = (1.1 CU-hora) * ($0,18/CU hora) ~= $0,20