Démarrage rapide : créer un flux de données
Remarque
Les flux de données fonctionnent avec Apache Airflow. Apache Airflow est une plateforme open source utilisée pour créer, planifier et superviser par programmation des workflows de données complexes. Elle vous permet de définir un ensemble de tâches, appelées opérateurs, qui peuvent être combinées en graphes orientés acyclique (DAG) pour représenter des pipelines de données.
Les flux de travail constituent un moyen simple et efficace de créer et de gérer des environnements Apache Airflow, ce qui vous permet d’exécuter facilement vos flux de données à grande échelle. Dans ce guide de démarrage rapide, vous allez créer votre premier flux de données et exécuter un graphe orienté acyclique (DAG) pour vous familiariser avec l’environnement et les fonctionnalités des flux de travail de données.
Prérequis
- Activez les flux de données dans votre client.
Remarque
Étant donné que Flux de données est en mode aperçu, vous devez l’activer via votre admin client. Si vous remarquez déjà Flux de données, votre admin client peut l’avoir déjà activé.
- Accédez au portail d’administration –> Paramètres du client –> Sous Microsoft Fabric –> Développez la section « Les utilisateurs peuvent créer et utiliser des flux de données (aperçu) ».
- Sélectionnez Appliquer.
Créer un flux de données
Vous pouvez utiliser un espace de travail existant ou créer un nouvel espace de travail.
Développez le menu déroulant
+ New
–> Cliquez sur Plus d’options –> Sous la sectionData Factory
–> Sélectionnez Flux de données (aperçu)Donnez un nom approprié à votre projet, puis cliquez sur le bouton « Créer ».
Créer un fichier DAG
Cliquez sur « Nouveau fichier DAG » carte –> donnez le nom au fichier, puis cliquez sur le bouton « Créer ».
Un code DAG standard vous est présenté. Vous pouvez modifier le fichier en fonction de vos besoins.
Cliquez sur « l’icône Enregistrer ».
Exécuter un DAG
Commencez par cliquer sur le bouton « Exécuter le DAG ».
Une fois lancée, une notification s’affiche rapidement indiquant que le DAG est en cours d’exécution.
Pour surveiller la progression de l’exécution du DAG, cliquez simplement sur « Afficher les détails » dans le centre de notification. Cette action vous redirige vers l’interface utilisateur (IU) Apache Airflow, où vous pouvez suivre facilement l’état et les détails de l’exécution du DAG.
Surveiller votre DAG de flux de données dans l’interface utilisateur (IU) Apache Airflow
Les fichiers DAG enregistrés sont chargés dans l’interface utilisateur (IU) Apache Airflow. Vous pouvez les surveiller en cliquant sur le bouton « Surveiller dans Apache Airflow ».
Contenu associé
Commentaires
https://aka.ms/ContentUserFeedback.
Prochainement : Tout au long de l'année 2024, nous supprimerons progressivement les GitHub Issues en tant que mécanisme de retour d'information pour le contenu et nous les remplacerons par un nouveau système de retour d'information. Pour plus d’informations, voir:Soumettre et afficher des commentaires pour