Partager via


Qu’est-ce que la mise en miroir dans Fabric ?

En tant que solution de réplication de données, la mise en miroir dans Fabric est une solution à faible coût et à faible latence pour regrouper les données de différents systèmes dans une plateforme d’analytique unique. Vous pouvez répliquer en continu votre patrimoine de données existant directement dans OneLake de Fabric, y compris les données d’Azure SQL Database, d’Azure Cosmos DB, d’Azure Databricks et de Snowflake.

Avec les données les plus à jour dans un format interrogeable dans OneLake, vous pouvez désormais utiliser tous les différents services de Fabric, tels que l’exécution d’analyses avec Spark, l’exécution de notebooks, l’ingénierie des données, la visualisation par le biais de rapports Power BI, etc.

La mise en miroir dans Fabric permet aux utilisateurs de profiter d'un produit hautement intégré, de bout en bout et simple d'utilisation, conçu pour simplifier vos besoins en matière d'analyse. Conçue pour l’ouverture et la collaboration entre Microsoft et les solutions technologiques qui peuvent lire le format de table Delta Lake open source, la mise en miroir est une solution clé en main à faible coût et à faible latence qui vous permet de créer un réplica de vos données dans OneLake, qui peut être utilisé pour tous vos besoins analytiques.

Les tables Delta peuvent ensuite être utilisées partout dans Fabric, ce qui permet aux utilisateurs d’accélérer leur parcours dans Fabric.

Pourquoi utiliser la mise en miroir dans Fabric ?

Aujourd’hui, de nombreuses organisations ont des données opérationnelles ou analytiques critiques situées dans des silos.

L’accès et l’utilisation de ces données nécessitent aujourd’hui des pipelines ETL complexes (extraire la charge de transformation), des processus métier et des silos de décision, créant :

  • Accès restreint et limité aux données importantes, en constante évolution
  • Friction entre les personnes, le processus et la technologie
  • Temps d’attente longs pour créer des pipelines de données et des processus vers des données extrêmement importantes
  • Aucune liberté d’utiliser les outils dont vous avez besoin pour analyser et partager confortablement des insights
  • Manque de base appropriée pour que les gens partagent et collaborent sur des données
  • Aucun format de données ouvert commun pour tous les scénarios analytiques : BI, IA, Intégration, Ingénierie et même Applications

La mise en miroir dans Fabric offre une expérience simple pour accélérer la durée de vie des insights et des décisions, et pour décomposer les silos de données entre les solutions technologiques :

  • Réplication en quasi-temps réel des données dans un lac de données SaaS, avec l’analytique prédéfinie intégrée pour la BI et l’IA

La plateforme Microsoft Fabric repose sur une base de Software as a Service (SaaS), qui amène la simplicité et l’intégration à un tout nouveau niveau. Pour en savoir plus sur Microsoft Fabric, consultez Qu’est-ce que Microsoft Fabric ?

La mise en miroir crée trois éléments dans votre espace de travail Fabric :

Outre l'éditeur de requête SQL de Microsoft Fabric, il existe un vaste écosystème d'outils, notamment SQL Server Management Studio, Azure Data Studio, et même GitHub Copilot.

Le partage permet de faciliter le contrôle d’accès et la gestion pour vous assurer que vous pouvez contrôler l’accès aux informations sensibles. Le partage permet également une prise de décision sécurisée et démocratisée au sein de votre organisation.

Actuellement, les bases de données externes suivantes sont disponibles :

Plateforme Réplication en quasi-temps réel Tutoriel de bout en bout
Bases de données mises en miroir Microsoft Fabric à partir d’Azure Cosmos DB (préversion) Oui Didacticiel : Azure Cosmos DB
Bases de données mises en miroir Microsoft Fabric à partir d’Azure Databricks (préversion) Oui Didacticiel : Azure Databricks
Bases de données mises en miroir Microsoft Fabric à partir d’Azure SQL Database (préversion) Oui Didacticiel : base de données Azure SQL
Bases de données mises en miroir de Microsoft Fabric à partir de Snowflake Oui Didacticiel : Snowflake

Comment fonctionne la réplication en quasi-temps réel de la mise en miroir ?

La mise en miroir est activée en créant une connexion sécurisée à votre source de données opérationnelle. Vous choisissez de répliquer une base de données entière ou des tables individuelles et la mise en miroir conserve automatiquement vos données synchronisées. Une fois configurées, les données sont répliquées en continu dans OneLake pour la consommation d’analytique.

Voici les principes fondamentaux de la mise en miroir :

  • L’activation de la mise en miroir dans Fabric est simple et intuitive, sans avoir à créer de pipelines ETL complexes, à allouer d’autres ressources de calcul et à gérer le déplacement des données.

  • La mise en miroir dans Fabric est un service entièrement géré. Vous n’avez donc pas à vous soucier de l’hébergement, de la maintenance ou de la gestion de la réplication de la connexion mise en miroir.

Partage

Le partage permet une facilité de contrôle d’accès et de gestion, tandis que les contrôles de sécurité tels que la sécurité au niveau des lignes (RLS) et la sécurité au niveau de l’objet (OLS), et plus encore, veillez à contrôler l’accès aux informations sensibles. Le partage permet également une prise de décision sécurisée et démocratisée au sein de votre organisation.

En partageant, les utilisateurs accordent à d'autres utilisateurs ou à un groupe d'utilisateurs l'accès à une base de données mise en miroir sans donner accès à l'espace de travail et au reste de ses éléments. Quand un utilisateur partage une base de données mise en miroir, il accorde également l’accès au point de terminaison d’analytique SQL et au modèle sémantique par défaut associé.

Accédez à la boîte de dialogue Partage avec le bouton Partager en regard du nom de la base de données mise en miroir dans l’affichage Espace de travail. Les bases de données mises en miroir partagées peuvent être trouvées via OneLake Data Hub ou la section Éléments partagés avec moi dans Microsoft Fabric.

Pour plus d’informations, consultez Partager votre entrepôt et gérer les autorisations.

Requêtes entre plusieurs bases de données

Avec les données de votre base miroir stockées dans le OneLake, vous pouvez écrire des requêtes inter-bases de données, en joignant les données des bases miroirs, des entrepôts et des points de terminaison analytiques SQL des Lakehouses dans une seule requête T-SQL. Pour plus d’informations, consultez Écrire une requête sur une base de données croisée.

Par exemple, vous pouvez référencer la table à partir de bases de données et d’entrepôts mise en miroir à l’aide d’un nommage en trois parties. Dans l'exemple suivant, utilisez le nom en trois parties pour désigner ContosoSalesTable dans l'entrepôt ContosoWarehouse. À partir d’autres bases de données ou entrepôts, la première partie de la convention d’affectation de noms en trois parties SQL standard est le nom de la base de données mise en miroir.

SELECT * 
FROM ContosoWarehouse.dbo.ContosoSalesTable AS Contoso
INNER JOIN Affiliation
ON Affiliation.AffiliationId = Contoso.RecordTypeID;

Ingénierie des données avec les données de votre base de données mise en miroir

Microsoft Fabric propose diverses fonctionnalités d'ingénierie des données pour garantir que vos données sont facilement accessibles, bien organisées et de haute qualité. À partir de l'Ingénierie des données de Fabric, vous pouvez :

  • Créez et gérez vos données comme Spark à l'aide d'un lakehouse
  • Concevoir des pipelines pour copier des données dans votre instance de lakehouse
  • Utiliser les définitions de tâches Spark pour soumettre une tâche par lots/streaming au cluster Spark
  • Utiliser des notebooks afin d’écrire du code pour l’ingestion, la préparation et la transformation des données

Science des données avec les données de votre base de données mise en miroir

Microsoft Fabric offre Science des données Synapse pour permettre aux utilisateurs d’effectuer des workflows de science des données de bout en bout à des fins d’enrichissement des données et d’insights métier. Vous pouvez effectuer un large éventail d’activités dans l’ensemble du processus de science des données, allant de l’exploration, de la préparation et du nettoyage des données à l’expérimentation, à la modélisation, au scoring des modèles et à la distribution d’insights prédictifs aux rapports décisionnels.

Les utilisateurs de Microsoft Fabric peuvent accéder aux charges de travail Science des données. À partir de là, ils peuvent découvrir et accéder à diverses ressources pertinentes. Par exemple, ils peuvent créer des expériences, des modèles et des notebooks d’apprentissage automatique. Ils peuvent également importer des notebooks existants sur la page d’accueil Science des données.