Conception d’une architecture DataOps
DataOps est une approche de l’analytique données basée sur le cycle de vie. Elle utilise des pratiques agiles pour orchestrer les outils, le code et l’infrastructure afin de fournir rapidement des données de haute qualité avec une sécurité renforcée. Quand vous implémentez et rationalisez les processus DataOps, votre entreprise peut fournir des insights analytiques facilement et à moindre coût. DataOps vous permet d’adopter des techniques de données avancées qui peuvent révéler des insights et de nouvelles opportunités.
Il existe de nombreux outils et fonctionnalités pour implémenter des processus DataOps, comme :
- Apache NiFi. Apache NiFi fournit un système de traitement et de distribution des données.
- Azure Data Factory. Azure Data Factory est un service d’ETL et d’intégration de données basé sur le cloud. Il vous permet de créer des workflows basés sur les données afin d’orchestrer le déplacement et la transformation des données à grande échelle.
- Azure Databricks. Utilisez Azure Databricks pour obtenir des insights provenant de toutes vos données et créez des solutions d'intelligence artificielle (IA). Vous pouvez également configurer rapidement votre environnement Apache Spark, procédez à une mise à l'échelle automatique et collaborez sur des projets partagés.
- Azure Data Lake. Utilisez une plateforme de stockage de données unique pour optimiser les coûts et protéger vos données avec un chiffrement au repos et une protection avancée contre les menaces.
- Azure Synapse Analytics. Un service d’analytique illimité, qui réunit l’intégration de données, l’entreposage de données d’entreprise et des fonctionnalités analytiques pour le Big Data.
- Microsoft Purview. Microsoft Purview est une solution de gouvernance des données unifiée qui vous permet de gérer et de gouverner vos données locales, multiclouds et SaaS (software as a service).
- Power BI. Unifiez des données de nombreuses sources pour créer des tableaux de bord et des rapports interactifs et immersifs qui fournissent des insights actionnables et boostent les résultats commerciaux.
Apache®, Apache Spark®, Apache NiFi® et NiFi® sont soit des marques déposées, soit des marques commerciales d’Apache Software Foundation aux États-Unis et/ou dans d’autres pays. L’utilisation de ces marques n’implique aucune approbation de l’Apache Software Foundation.
Introduction à DataOps sur Azure
Si vous débutez avec DataOps, le meilleur endroit où commencer est Microsoft Learn. Cette plateforme en ligne gratuite offre des vidéos, des tutoriels et des formations pratiques pour différents produits et services.
Les ressources suivantes peuvent vous aider à découvrir les principaux services pour DataOps :
- Intégrer des données à un pipeline Azure Data Factory ou Azure Synapse
- Engineering données avec Azure Databricks
- Présentation d’Azure Synapse Analytics
- Analyser et optimiser le stockage de l’entrepôt de données dans Azure Synapse Analytics
- Lire et écrire des données dans Azure Databricks
- Intégrer Azure Databricks à Azure Synapse
- Transformez vos connaissances en actions en combinant les données SAP et autres
- Examiner les visualisations de données avec Power BI
Parcours de production
Pour vous aider à bien démarrer avec la production de DataOps, tenez compte des ressources suivantes :
- Évaluez votre processus DataOps à l’aide de la liste de contrôle DataOps.
- Obtenez de l’aide pour choisir la solution de données appropriée avec Choisir une analytique de données et une technologie de création de rapports dans Azure.
- Commencez à créer votre système de stockage de données avec Créer un système scalable pour les données volumineuses.
Meilleures pratiques
Selon la technologie DataOps que vous utilisez, consultez les ressources suivantes sur les bonnes pratiques :
- Guide de l’administrateur système NiFi
- Architecture et meilleures pratiques des comptes Microsoft Purview
- Intégration et déploiement continus dans Azure Data Factory
- Intégration de dépôts pour Git
- Déployer et gérer les capacités Power BI Premium
- Intégration et livraison continues pour un espace de travail Azure Synapse Analytics
Vous pouvez également en savoir plus sur les piliers d’Azure Well-Architected Framework, un ensemble de principes directeurs que vous pouvez utiliser pour améliorer la qualité d’une charge de travail. Pour plus d'informations, consultez Microsoft Azure Well-Architected Framework.
Implémentations spécifiques
Pour en savoir plus sur les architectures spécifiques aux scénarios, consultez les solutions dans les domaines suivants.
Gouvernance des données
Vous pouvez intégrer la gestion des données Profisee à Azure Purview pour créer une base de gestion et de gouvernance des données.
Entrepôt de données moderne
Appliquez des principes DevOps à des pipelines de données basés sur le modèle architectural de l’entrepôt de données moderne (MDW) avec Microsoft Azure.
Moderniser un mainframe
Modernisez les données des systèmes mainframe et midrange IBM, et migrez ces données vers Azure selon une approche basée sur les données (« Data First »).
Modifier des données directement à partir de Power BI
Découvrez une solution qui offre une fonctionnalité d’écriture différée de données pour les rapports Power BI. Vous pouvez mettre à jour les données dans Power BI, puis renvoyer les modifications dans votre source de données.
Rester informé sur DataOps
Reportez-vous aux mises à jour Azure pour rester à jour sur les technologies Azure liées à DataOps.
Ressources supplémentaires
DataOps utilise de nombreux outils et techniques pour fournir des données. Les ressources suivantes peuvent vous fournir de l’aide sur votre parcours DataOps.
Exemples de solutions
- Surveillance d’Azure Data Explorer
- Charges de travail d’analyse des données pour les secteurs d’activité réglementés
- Gestion des données sur Azure Data Lake avec Azure Purview
- Pipelines d’ingestion, ETL et de traitement de flux avec Azure Databricks
Professionnels Amazon Web Services (AWS) ou Google Cloud
Ces articles fournissent un mappage de service et une comparaison entre Azure et d’autres services cloud. Cette référence peut vous aider à progresser rapidement sur Azure.
Commentaires
https://aka.ms/ContentUserFeedback.
Bientôt disponible : Tout au long de 2024, nous allons supprimer progressivement GitHub Issues comme mécanisme de commentaires pour le contenu et le remplacer par un nouveau système de commentaires. Pour plus d’informations, consultezEnvoyer et afficher des commentaires pour