Partager via


Qu’est-ce que la mise en miroir dans Fabric ?

La mise en miroir dans Fabric est une solution à faible coût et à faible latence pour regrouper les données de différents systèmes dans une plateforme d’analytique unique. Vous pouvez répliquer en continu votre patrimoine de données existant directement dans OneLake de Fabric à partir de diverses bases de données Azure et sources de données externes.

Avec les données les plus up-to-date dans un format interrogeable dans OneLake, vous pouvez désormais utiliser tous les différents services de Fabric, tels que l’exécution d’analyses avec Spark, l’exécution de notebooks, l’ingénierie des données, la visualisation par le biais de Rapports Power BI, etc.

La mise en miroir dans Fabric permet aux utilisateurs de profiter d’un produit hautement intégré, de bout en bout et facile à utiliser conçu pour simplifier vos besoins d’analyse. Conçue pour l’ouverture et la collaboration entre Microsoft et les solutions technologiques qui peuvent lire le format de table Delta Lake open source, la mise en miroir est une solution clé en main à faible coût et à faible latence qui vous permet de créer un réplica de vos données dans OneLake, qui peut être utilisé pour tous vos besoins analytiques.

Les tables Delta peuvent ensuite être utilisées partout dans Fabric, ce qui permet aux utilisateurs d’accélérer leur parcours dans Fabric.

Pourquoi utiliser la mise en miroir dans Fabric ?

Aujourd’hui, de nombreuses organisations ont des données opérationnelles ou analytiques critiques situées dans des silos.

L’accès et l’utilisation de ces données nécessitent aujourd’hui des pipelines ETL complexes (extraire la charge de transformation), des processus métier et des silos de décision, créant :

  • Accès restreint et limité aux données importantes, en constante évolution
  • Friction entre les personnes, le processus et la technologie
  • Temps d’attente longs pour créer des pipelines et des processus pour des données extrêmement importantes
  • Aucune liberté d’utiliser les outils dont vous avez besoin pour analyser et partager confortablement des insights
  • Manque de base appropriée pour que les gens partagent et collaborent sur des données
  • Aucun format de données ouvert commun pour tous les scénarios analytiques : BI, IA, Intégration, Ingénierie et même Applications

La mise en miroir dans Fabric offre une expérience simple pour accélérer la durée de vie des insights et des décisions, et pour décomposer les silos de données entre les solutions technologiques :

  • Réplication en temps quasi réel des données et des métadonnées dans un lac de données SaaS, avec des analyses intégrées pour la bi et l’IA

La plateforme Microsoft Fabric repose sur une base de Software as a Service (SaaS), qui prend en charge la simplicité et l’intégration à un tout nouveau niveau. Pour en savoir plus sur Microsoft Fabric, consultez Qu’est-ce que Microsoft Fabric ?

La mise en miroir crée ces éléments dans votre espace de travail Fabric :

  • La mise en miroir gère la réplication des données et des métadonnées dans OneLake et la conversion en Parquet, dans un format prêt pour l’analytique. Cela permet des scénarios en aval tels que l’ingénierie des données, la science des données et bien plus encore.
  • Un point de terminaison d’analytique SQL

En plus de l’éditeur de requête SQL, il existe un vaste écosystème d’outils, notamment SQL Server Management Studio (SSMS),l’extension mssql avec Visual Studio Code et même GitHub Copilot.

Le partage permet de faciliter le contrôle d’accès et la gestion pour vous assurer que vous pouvez contrôler l’accès aux informations sensibles. Le partage permet également une prise de décision sécurisée et démocratisée au sein de votre organisation.

Types de mise en miroir

Fabric propose trois approches différentes pour intégrer des données dans OneLake via la mise en miroir.

  • Mise en miroir de bases de données : la mise en miroir de bases de données dans Microsoft Fabric permet la réplication de bases de données et de tables entières, ce qui vous permet de regrouper les données de différents systèmes dans une plateforme analytique unique.
  • Mise en miroir de métadonnées : la mise en miroir de métadonnées dans Fabric synchronise les métadonnées (telles que les noms de catalogue, les schémas et les tables) au lieu de déplacer physiquement les données. Cette approche tire parti des raccourcis, ce qui garantit que les données restent dans sa source tout en étant facilement accessibles dans Fabric.
  • Mise en miroir ouverte : la mise en miroir ouverte dans Fabric est conçue pour étendre la mise en miroir en fonction du format de table Delta Lake ouvert. Cette fonctionnalité permet aux développeurs d’écrire les données modifiées de leur application directement dans un élément de base de données mis en miroir dans Microsoft Fabric, en fonction de l’approche de mise en miroir ouverte et des API publiques.

Actuellement, les bases de données externes suivantes sont disponibles :

Platform Réplication en temps quasi réel Type de mise en miroir Tutoriel de bout en bout
Bases de données mises en miroir Microsoft Fabric à partir d’Azure Cosmos DB (préversion) Oui Mise en miroir de bases de données Tutoriel : Azure Cosmos DB
Bases de données mises en miroir Microsoft Fabric à partir d’Azure Databricks Oui Mise en miroir de métadonnées Tutoriel : Azure Databricks
Bases de données mises en miroir Microsoft Fabric à partir d’un serveur flexible Azure Database pour PostgreSQL (préversion) Oui Mise en miroir de bases de données Tutoriel : Serveur flexible Azure Database pour PostgreSQL
Bases de données mises en miroir Microsoft Fabric à partir d’Azure SQL Database Oui Mise en miroir de bases de données Tutoriel : Azure SQL Database
Bases de données mises en miroir Microsoft Fabric à partir d’Azure SQL Managed Instance Oui Mise en miroir de bases de données Tutoriel : Azure SQL Managed Instance
Bases de données de Microsoft Fabric mises en miroir à partir de Google BigQuery (préversion) Oui Mise en miroir de bases de données Tutoriel : Google BigQuery
Bases de données Oracle en miroir dans Microsoft Fabric (préversion) Oui Mise en miroir de bases de données Tutoriel : Oracle
Bases de données mises en miroir Microsoft Fabric à partir de Snowflake Oui Mise en miroir de bases de données Tutoriel : Snowflake
Bases de données mises en miroir Microsoft Fabric à partir de SQL Server (préversion) Oui Mise en miroir de bases de données Tutoriel : SQL Server
Ouvrir des bases de données mises en miroir Oui Ouvrir la mise en miroir Tutoriel : Ouvrir la mise en miroir
Bases de données mises en miroir Microsoft Fabric à partir de la base de données Fabric SQL (préversion) Oui Mise en miroir de bases de données Configuré automatiquement

Comment fonctionne la réplication en quasi-temps réel de la mise en miroir de bases de données ?

La mise en miroir est activée en créant une connexion sécurisée à votre source de données opérationnelle. Vous choisissez de répliquer une base de données entière ou des tables individuelles et la mise en miroir conserve automatiquement vos données synchronisées. Une fois configurées, les données sont répliquées en continu dans OneLake pour la consommation d’analytique.

Voici les principes fondamentaux de la mise en miroir :

  • L’activation de la mise en miroir dans Fabric est simple et intuitive, sans avoir à créer de pipelines ETL complexes, à allouer d’autres ressources de calcul et à gérer le déplacement des données.

  • La mise en miroir dans Fabric est un service entièrement géré. Vous n’avez donc pas à vous soucier de l’hébergement, de la maintenance ou de la gestion de la réplication de la connexion mise en miroir.

Comment fonctionne la mise en miroir de métadonnées ?

La mise en miroir permet non seulement la réplication des données, mais peut également être obtenue par le biais de raccourcis ou de mise en miroir de métadonnées plutôt que de réplication complète des données, ce qui permet aux données d’être disponibles sans déplacement physique ni duplication. La mise en miroir dans ce contexte fait référence à la réplication de métadonnées uniquement, telles que les noms de catalogue, les schémas et les tables, plutôt que les données réelles proprement dites. Cette approche permet à Fabric de rendre les données provenant de différentes sources accessibles sans la dupliquer, en simplifiant la gestion des données et en réduisant les besoins de stockage.

Par exemple, lors de l’accès aux données inscrites dans Unity Catalog, Fabric met uniquement en miroir la structure du catalogue à partir d’Azure Databricks, ce qui permet d’accéder aux données sous-jacentes via des raccourcis. Cette méthode garantit que toutes les modifications apportées aux données sources sont instantanément reflétées dans Fabric sans nécessiter de déplacement de données, en conservant la synchronisation en temps réel et en améliorant l’efficacité de l’accès aux informations de up-to-date.

Comment fonctionne la mise en miroir ouverte ?

Outre la mise en miroir de l’activation de la réplication des données en créant une connexion sécurisée à votre source de données, vous pouvez également sélectionner un fournisseur de données existant ou écrire votre propre application pour atterrir des données dans une base de données mise en miroir. Une fois que vous avez créé une base de données mise en miroir ouverte via l’API publique ou via le portail Fabric, vous pourrez obtenir une URL de zone d’atterrissage dans OneLake, où vous pouvez atterrir les données de modification par spécification de mise en miroir ouverte.

Une fois que les données se situent dans la zone d’atterrissage avec le format approprié, la réplication commence à s’exécuter et à gérer la complexité de la fusion des modifications avec les mises à jour, l’insertion et la suppression à refléter dans des tables delta. Cette méthode garantit que toutes les données écrites dans la zone d’atterrissage seront immédiatement et conserveront les données dans Fabric up-to-date.

Partage

Le partage permet une facilité de contrôle d’accès et de gestion, tandis que les contrôles de sécurité tels que la sécurité au niveau des lignes (RLS) et la sécurité au niveau de l’objet (OLS), et plus encore, veillez à contrôler l’accès aux informations sensibles. Le partage permet également une prise de décision sécurisée et démocratisée au sein de votre organisation.

En partageant, les utilisateurs accordent à d’autres utilisateurs ou à un groupe d’utilisateurs l’accès à une base de données mise en miroir sans donner accès à l’espace de travail et au reste de ses éléments. Lorsqu’une personne partage une base de données mise en miroir, elle accorde également l’accès au point de terminaison d’analyse SQL.

Pour plus d’informations, consultez Partager votre base de données mise en miroir et gérer les autorisations.

Requêtes inter-bases de données

Avec les données de votre base de données mise en miroir stockée dans OneLake, vous pouvez écrire des requêtes inter-bases de données, joindre des données à partir de bases de données mises en miroir, d’entrepôts et de points de terminaison d’analyse SQL de Lakehouses dans une requête T-SQL unique. Pour plus d’informations, consultez Écrire une requête inter-bases de données.

Par exemple, vous pouvez référencer la table à partir de bases de données et d’entrepôts mis en miroir à l’aide d’un nommage en trois parties. Dans l’exemple suivant, utilisez le nom en trois parties pour faire référence à ContosoSalesTable l’entrepôt ContosoWarehouse. À partir d’autres bases de données ou entrepôts, la première partie de la convention d’affectation de noms en trois parties SQL standard est le nom de la base de données mise en miroir.

SELECT * 
FROM ContosoWarehouse.dbo.ContosoSalesTable AS Contoso
INNER JOIN Affiliation
ON Affiliation.AffiliationId = Contoso.RecordTypeID;

Coût de la mise en miroir

Pour la mise en miroir de bases de données et la mise en miroir ouverte, le stockage Fabric et OneLake sont gratuits jusqu’à une limite basée sur la capacité.

  • Le stockage pour les réplicas est libre jusqu’à une limite en fonction de la taille de la capacité. La mise en miroir offre un téraoctet gratuit de stockage de mise en miroir pour chaque unité de capacité (CU) que vous avez achetée. Par exemple, si vous achetez une capacité F64, vous obtenez 64 téraoctets gratuits de stockage, exclusivement utilisés pour la mise en miroir. Le stockage OneLake est facturé si la limite de stockage de mise en miroir gratuite est dépassée ou lorsque la capacité est suspendue. Pour plus d’informations, consultez Tarification de Microsoft Fabric.
  • Le calcul Fabric en arrière-plan utilisé pour répliquer vos données dans Fabric OneLake est gratuit et ne consomme pas de capacité. Les demandes directement adressées à OneLake pour les données mises en miroir consomment de la capacité comme consommation normale de calcul OneLake. Le calcul pour l’interrogation de données à l’aide de SQL, Power BI ou Spark est facturé à des tarifs réguliers.
  • Une capacité Fabric en cours d’exécution est requise uniquement pour la configuration initiale de la mise en miroir.

Ingénierie des données avec vos données de base de données mises en miroir

Microsoft Fabric fournit différentes fonctionnalités d’ingénierie des données pour garantir que vos données sont facilement accessibles, bien organisées et de haute qualité. À partir de Fabric Data Engineering, vous pouvez :

  • Créer et gérer vos données en tant que Spark à l’aide d’un lakehouse
  • Concevoir des pipelines pour copier des données dans votre lakehouse
  • Utiliser les définitions de travaux Spark pour envoyer un travail de traitement par lots/streaming au cluster Spark
  • Utiliser des notebooks pour écrire du code pour l’ingestion, la préparation et la transformation des données

Science des données avec vos données de base de données mises en miroir

Microsoft Fabric offre La science des données Fabric pour permettre aux utilisateurs d’effectuer des workflows de science des données de bout en bout à des fins d’enrichissement des données et d’insights métier. Vous pouvez effectuer un large éventail d’activités dans l’ensemble du processus de science des données, de l’exploration des données, de la préparation et du nettoyage à l’expérimentation, à la modélisation, au scoring des modèles et au service d’insights prédictifs aux rapports BI.

Les utilisateurs de Microsoft Fabric peuvent accéder aux charges de travail de science des données. À partir de là, ils peuvent découvrir et accéder à diverses ressources pertinentes. Par exemple, ils peuvent créer des expériences, des modèles et des notebooks machine learning. Ils peuvent également importer des notebooks existants sur la page d’accueil de la science des données.

Direct Lake avec vos données de base de données mises en miroir

Le mode Direct Lake peut être utilisé avec des bases de données mises en miroir dans Microsoft Fabric pour permettre l’interrogation hautes performances sur les données mises en miroir sans avoir besoin de déplacer ou de duplication des données. Lorsqu’une base de données mise en miroir est créée, ses données sont stockées au format Delta Lake dans OneLake. Ce format natif permet à Power BI et à d’autres outils d’analytique de se connecter via le mode Direct Lake, offrant des insights quasiment en temps réel en accédant directement aux fichiers sous-jacents. Cette intégration combine la simplicité de mise en miroir avec la vitesse et l’extensibilité de Direct Lake, ce qui permet un rapport rapide et up-to-date sur les données opérationnelles.

Rétention des données mises en miroir

La mise en miroir dans Fabric réplique en continu votre patrimoine de données existant dans OneLake au format de table Delta Lake. Pour conserver efficacement les données mises en miroir stockées et toujours prêtes pour l’analytique, la mise en miroir s’exécute automatiquement sous vide pour supprimer les anciens fichiers qui ne sont plus référencés par un journal Delta.

Vous pouvez personnaliser le paramètre de rétention en fonction de vos besoins. Par exemple, vous pouvez choisir une période de rétention plus courte pour réduire la consommation de stockage de mise en miroir ou prolonger la période de rétention afin d’utiliser les fonctionnalités de voyage à temps de Delta pour l’analytique.

Pour les bases de données mises en miroir créées à partir du portail Fabric après la mi-juin 2025, la rétention par défaut est un jour. Pour les anciennes bases de données mises en miroir, la valeur par défaut est de sept jours. Pour vérifier ou mettre à jour le paramètre de rétention, dans le portail Fabric, accédez à votre base de données mise en miroir -> ->Onglet Maintenance et spécifiez le seuil de rétention. Vous pouvez également le configurer via l’API publique en spécifiant la retentionInDays propriété.

Base de données SQL dans Fabric

Vous pouvez également créer et gérer directement une base de données SQL dans Microsoft Fabric (préversion) dans le portail Fabric. Basée sur Azure SQL Database, la base de données SQL dans Fabric est automatiquement mise en miroir à des fins d’analytique et vous permet de créer facilement votre base de données opérationnelle dans Fabric. La base de données SQL est la base de données SQL dans Fabric pour les charges de travail OLTP et peut s’intégrer à l’intégration du contrôle de code source de Fabric.