Partager via


Captures instantanées d’entrepôt

s’applique à :✅ Warehouse dans Microsoft Fabric

Un instantané d’entrepôt est une représentation en lecture seule d’un élément d’entrepôt à un moment donné, conservée jusqu’à 30 jours. Pour commencer, créez un instantané d’entrepôt.

Les captures instantanées de l’entrepôt peuvent être « transférées » en toute transparence à la demande, ce qui permet aux consommateurs de se connecter à la même capture instantanée ou d’utiliser une chaîne de connexion d’entrepôt cohérente pour accéder à une version antérieure des données. Lorsque l’horodatage de l’instantané est avancé, les mises à jour sont appliquées immédiatement, comme si elles intervenaient dans le cadre d'une transaction atomique. La capture instantanée de l'entrepôt de données garantit que les ingénieurs en données peuvent fournir aux utilisateurs analytiques un jeu de données cohérent, même lorsque des mises à jour en temps réel ont lieu. Les analystes peuvent exécuter SELECT requêtes basées sur l’instantané sans aucune interférence ETL.

Un instantané peut être utile dans les scénarios où un processus ETL peut avoir créé une altération des données. Cet élément enfant en mode lecture seule assure la stabilité et la cohérence des données qui pourraient autrement être modifiées par certains processus ETL.

Guide de décision pour l’aperçu de l’entrepôt

Ce tableau compare le point de terminaison d’analytique SQL du Lakehouse à un instantané d’entrepôt.

Caractéristique Point de terminaison d’analytique SQL de Lakehouse Instantané de l’entrepôt
Date de création Généré automatiquement par le système Élément enfant créé par l’utilisateur de l’entrepôt parent
Fonctionnalités principales Interrogation de tables Delta dans Lakehouse. Prend en charge l’analytique sur les tables Delta Lakehouse et les dossiers Delta Lake référencés via des raccourcis Interroger un point dans le temps de l’entrepôt parent
Modification des données Lecture seule Lecture seule
Format de stockage Delta Aucun stockage distinct, s’appuie sur l’entrepôt source, aucun fichier Parquet
Chargement des données Spark, pipelines, flux de données, raccourcis Données chargées dans l’entrepôt parent
Prise en charge de T-SQL Langage d’interrogation de données (DQL) complet, aucun langage de manipulation de données (DML), langage de définition de données (DDL) limité tel que la prise en charge des vues, des fonctions retournant des tables DQL complet, pas de DML, pas de DDL (sauf pour mettre à jour le timestamp de l’instantané par un administrateur, un membre ou un contributeur), aucune création de vues ou de fonctions avec valeur de table.
Cas d’utilisation Exploration et interrogation de tables delta à partir de la lakehouse, données intermédiaires, architecture de lac de médaillon avec des zones pour le bronze, l’argent et l’analyse de l’or Accéder à une version stable d’un entrepôt, cohérence ETL, analyse historique, précision des rapports, répondre à des besoins métier spécifiques en créant des instantanés d’entrepôt horaires, quotidiens ou hebdomadaires

Autorisations

Les autorisations de sécurité doivent être définies dans la base de données source.

  • Un utilisateur disposant de rôles d’espace de travail d’administrateur, de membre ou de contributeur peut créer et gérer un instantané d’entrepôt.
  • Un utilisateur disposant d’un rôle administrateur, membre ou contributeur peut modifier l’horodatage d’instantané via T-SQL et le portail Fabric.
  • Un utilisateur disposant du rôle d'administrateur, de membre, de contributeur ou de visionneur sur l'espace de travail, ou ayant un accès partagé à l'entrepôt parent, peut interroger l'instantané enfant.

Mettre à jour l’horodatage de capture

Mettre à jour l'horodatage de l’instantané peut fournir aux consommateurs d'analyse une version des données stable. Les requêtes en cours se termineront toujours en utilisant la version des données sur laquelle elles ont été lancées. Lorsque l’horodatage d’instantané est transféré, les mises à jour de données sont disponibles immédiatement, sans latence ni incohérence dans les données.

Les utilisateurs peuvent mettre à jour l’horodatage d’un instantané d’entrepôt existant à tout moment. Cette opération se termine instantanément.

Pour mettre à jour l’horodatage d’un instantané d’entrepôt, consultez mettre à jour l'horodatage de l’instantané.

Lorsqu’une requête T-SQL est exécutée, des informations sur la version actuelle des données accessibles sont incluses. Par exemple, vous pouvez voir l’horodatage dans les Messages de l’éditeur de requête du portail Fabric :

Capture d’écran de l’éditeur de requête du portail Fabric montrant les résultats des messages d’une requête sur un instantané du dépôt.

Sécurité et gouvernance

  • Les instantanés héritent des autorisations de l’entrepôt source. Les instantanés d’entrepôt sont en lecture seule pour tous les consommateurs, quel que soit leur niveau d’autorisation dans l’entrepôt source. La seule exception est que l’administrateur/membre/contributeur peut mettre à jour l’horodatage de l’instantané via TSQL ou le portail Fabric.
  • Toutes les modifications d’autorisation dans l’entrepôt source s’appliquent instantanément à l’instantané. Les actions d'accès utilisateur telles que GRANT, DENY, REVOKE et UNMASK reflètent toutes l’état de l’entrepôt source, indépendamment de la date et heure de l’instantané. 
    • Les utilisateurs ne peuvent pas interroger l’instantané s’ils perdent l’accès ultérieurement.
    • Par exemple, si les autorisations d’un consommateur sont refusées pour accéder aux données à 12h00, cela s’applique à la fois à l’entrepôt et à l’instantané. Si l’horodatage de l’instantané est défini à 11h00, les privilèges refusés sont appliqués immédiatement dans cet instantané.

Remarque

La promesse de création de rapports stable dans Fabric Data Warehouse s’applique aux données, et non au schéma. Par exemple, si un rapport fait référence à une table, une vue ou une colonne à partir d’un instantané, et que cet objet est supprimé, renommé ou modifié à partir de l’entrepôt parent, l’instantané reflète cette modification. En conséquence, le rapport pourrait échouer. Ce comportement est attendu, car le mécanisme d’instantané est conçu pour préserver la cohérence des données, et non la stabilité du schéma.

Gérer les instantanés

  • Les instantanés d’entrepôt nécessitent des noms uniques, différents de ceux de l’entrepôt et du point de terminaison SQL Analytics.
  • Les instantanés d’entrepôt n’existent pas sans l’entrepôt source. Lorsque l’entrepôt est supprimé, tous les instantanés sont supprimés. Les instantanés de l’entrepôt doivent être recréés si l’entrepôt est restauré.
  • Les instantanés de l’entrepôt sont valides jusqu’à 30 jours dans le passé. La date et l'heure de l’instantané peuvent être définies sur n’importe quelle date des 30 derniers jours ou à l'heure de création de la base de données (selon ce qui est le plus récent).

Remarques

  • Les tables, vues et procédures stockées modifiées après l’horodatage d’instantané deviennent invalides dans l’instantané.
  • Les instantanés d’entrepôt nécessitent le mode Requête directe ou Importation dans le Power BI et ne prennent pas en charge le mode Direct Lake.
  • Les instantanés d’entrepôt ne sont pas pris en charge sur l'interface d’analyse SQL de Lakehouse.
  • Les copies d’entrepôts ne sont pas compatibles en tant que source pour les raccourcis OneLake.

Étape suivante