Partager via


Tarification de Dataflow Gen2 pour Data Factory dans Microsoft Fabric

Le flux de données Gen2 vous permet de tirer profit d’une interface à faible code et de plus de 300 transformations basées sur les données et sur l’IA, ce qui vous permet de transformer les données plus facilement et avec davantage de flexibilité que n’importe quel autre outil. Dataflow Gen2 est créé à l’aide de l’expérience Power Query bien connue qui est aujourd’hui disponible dans plusieurs produits et services Microsoft tels que les applications Excel, Power BI, Power Platform, Dynamics 365 Insights et bien plus encore. Une fois que vous avez publié un flux de données, la définition du flux de données est générée : il s’agit du programme qui s’exécutera une fois le flux de données actualisé pour produire des tables dans le stockage intermédiaire et/ou la destination de sortie. Pendant l’actualisation, la définition d’un flux de données est utilisée par le moteur de flux de données pour générer un plan d’orchestration, gérer les ressources et orchestrer l’exécution de requêtes entre les sources de données, les passerelles et les moteurs de calcul, et pour créer des tables dans le stockage intermédiaire ou la destination des données.

Schéma de l’architecture Dataflow Gen2.

Le diagramme illustré ici capture les différents composants de l’architecture Dataflow Gen2 dans Data Factory, y compris le lakehouse utilisé pour mettre en scène les données ingérées, et l’artefact d’entrepôt utilisé comme moteur de calcul et moyen de mettre à jour les résultats dans des destinations de sortie intermédiaires ou prises en charge plus rapidement. Lorsque le calcul de l’entrepôt ne peut pas être utilisé ou lorsque la préproduction est désactivée pour une requête, le moteur Mashup extrait, transforme ou charge les données dans des destinations intermédiaires ou de données. Vous pouvez en savoir plus sur le fonctionnement de Dataflow Gen2 dans ce billet de blog : Data Factory à la une : Dataflow Gen2.

Lorsque vous actualisez ou publiez un élément Dataflow Gen2, les unités de capacité Fabric sont consommées pour les moteurs suivants.

  • Calcul standard : vous êtes facturé pour celui-ci en fonction du temps d’évaluation des requêtes sur toutes vos requêtes de flux de données exécutées via le moteur Mashup.
  • Calcul de flux de données à grande échelle : vous êtes facturé lorsque la préproduction est activée en fonction de la durée de consommation du moteur SQL lakehouse (stockage intermédiaire) et entrepôt (calcul de stockage).

Modèle de tarification de Dataflow Gen2

Le tableau suivant indique que pour déterminer les coûts d’exécution de Dataflow Gen2, chaque exécution de requête utilise le moteur mashup pour le calcul standard et que la durée d’exécution du calcul est traduite en un taux de consommation de 16 CU par heure. Deuxièmement, pour les scénarios de calcul à grande échelle lorsque la préproduction est activée, la durée d’exécution du moteur SQL lakehouse/entrepôt doit également être prise en compte. La durée d’exécution du calcul est traduite en un taux de consommation de 6 CU par heure. À la fin de chaque exécution de Dataflow Gen2, la consommation en unités de capacité (CU) pour chaque type de moteur est additionnée et facturée en fonction du prix traduit de la capacité Fabric dans la région où elle est déployée.

Type de moteur Dataflow Gen2 Compteurs de consommation Taux de consommation en CU Fabric Granularité des rapports de consommation
Compute Standard En fonction de chaque durée d’exécution de requête du moteur mashup en secondes. 16 CU par heure Par élément Dataflow Gen2
Calcul des flux de données à grande échelle En fonction de la durée d’exécution (sans préproduction activée) du moteur SQL lakehouse/entrepôt en secondes. 6 CU par heure Par espace de travail
Déplacement des données En fonction de la durée d’exécution de la copie rapide en heures et des ressources de débit d’optimisation intelligente utilisées. 1,5 CU par heure Par élément Dataflow Gen2

Tarification de la passerelle de données du réseau virtuel avec Dataflow Gen2

La passerelle de données du réseau virtuel (VNET) est facturée comme une redevance d'infrastructure additive, associée à une capacité de tissu. Cela signifie qu'il dispose de son propre compteur et qu'il fait l'objet d'une facture cohérente et supplémentaire pour toutes les courses de Fabric item.

La facture totale pour l'exécution de Dataflows Gen2 via la passerelle de données VNET est calculée comme suit : Frais Dataflows Gen2 + Frais VNET Data Gateway.

Les frais de la passerelle de données VNET sont proportionnels à votre utilisation de la passerelle de données VNET, l'utilisation étant définie comme le temps de fonctionnement, ou chaque fois que la passerelle de données VNET est activée.

Taux de consommation de CU de la passerelle de données VNET : (4 CU-heure) * (capacité de tissu par prix unitaire)

Pour en savoir plus, consultez le site Prix et facturation des passerelles de données du réseau virtuel.

Modifications apportées au taux de consommation des charges de travail Microsoft Fabric

Les taux de consommation sont susceptibles de changer à tout moment. Microsoft utilise des efforts raisonnables pour fournir une notification par e-mail et dans le produit. Les modifications sont effectives à la date indiquée dans les notes de publication et le blog Microsoft Fabric. Si une modification apportée à un taux de consommation de charge de travail Microsoft Fabric augmente matériellement les unités de capacité (CU) requises pour utiliser une charge de travail particulière, les clients peuvent utiliser les options d’annulation disponibles pour le mode de paiement choisi.

Calcul des coûts estimés à l’aide de l’application de métriques Fabric

L’application de métriques de capacité Microsoft Fabric offre une visibilité de l’utilisation de la capacité pour tous les espaces de travail Fabric liés à une capacité. Elle est principalement utilisée par les administrateurs de capacité pour surveiller les performances des charges de travail et leur utilisation, par rapport à la capacité achetée. L’utilisation de l’application de métriques est le moyen le plus précis d’estimer les coûts des exécutions d’actualisation de Dataflow Gen2. Lorsque vous testez la charge de votre scénario, créez l’élément Dataflow Gen2 dans un nouvel espace de travail pour réduire tout bruit signalé dans l’application de métriques Fabric.

Le tableau suivant peut être utilisé comme modèle pour calculer les coûts estimés à l’aide de l’application de métriques Fabric pour une actualisation Dataflow Gen2 :

Métrique Compute Standard Calcul à grande échelle
CU total s CU secondes h CU secondes
CU heures effectives facturées s / (60*60) = S CU heures h / (60*60) = H CU heures

Coût total d’actualisation = (S + H CU heures) * (prix de capacité Fabric par unité)