Partager via


Raccourcis dans un lakehouse

Les raccourcis vous permettent de référencer des données dans un lakehouse sans les copier. Au lieu d’ingérer des données à partir d’une autre source, vous créez un pointeur qui fait apparaître les données sous forme de dossier ou de table local. Cette approche est utile lorsque vous souhaitez :

  • Interrogez des données à partir d’autres lakehouses, entrepôts ou espaces de travail sans duplication.
  • Accédez au stockage externe (par exemple, ADLS Gen2 ou Amazon S3) directement à partir de votre lakehouse.
  • Combinez les données de plusieurs sources en une seule vue de type Lakehouse sans les déplacer.
  • Réduisez les coûts de stockage et évitez l’obsolescence des données des copies redondantes.

Pour obtenir une vue d’ensemble conceptuelle complète des raccourcis, notamment la mise en cache, la sécurité et les limitations, consultez raccourcis OneLake.

Où placer des raccourcis dans un lac

Un lakehouse a deux dossiers de niveau supérieur ( tables et fichiers ) et les raccourcis se comportent différemment dans chacun d’eux :

  • Tables : les raccourcis doivent être créés au niveau supérieur (aucun sous-répertoire). Si la cible de raccourci contient des données au format Delta, le lakehouse le reconnaît automatiquement en tant que table. Vous pouvez ensuite l’interroger via Spark et le point de terminaison d’analytique SQL.
  • Fichiers : les raccourcis peuvent être créés à n’importe quel niveau de la hiérarchie de dossiers. Les données de la section Fichiers ne sont pas automatiquement inscrites en tant que table, mais Spark peut la lire directement pour les charges de travail de science des données ou de transformation.

Conseil / Astuce

Utilisez la section Tables pour les données structurées que vous souhaitez interroger avec SQL. Utilisez la section Fichiers pour les données brutes ou semi-structurées que vous envisagez de traiter avec Spark.

Emplacement Option de menu Ce qu’il crée
Section des Tables Nouveau raccourci de tableau Raccourci vers une seule table Delta, automatiquement enregistrée en tant que table dans le lakehouse.
Section de Tables Nouveau raccourci de schéma Raccourci vers un dossier contenant plusieurs tables Delta, qui apparaissent sous la forme d’un nouveau schéma dans la lakehouse. Pour plus d’informations, consultez les schémas Lakehouse.
Section Fichiers Nouveau raccourci Raccourci vers n’importe quel dossier, dans n’importe quel format. Les données ne sont pas automatiquement enregistrées en tant que table.

Sources de raccourci prises en charge

Vous pouvez créer des raccourcis vers des éléments fabric internes et des systèmes de stockage externes.

Sources internes (utilisez l’identité de l’utilisateur appelant pour l’autorisation) :

  • Maisons au bord du lac
  • Entrepôts
  • Bases de données KQL
  • Bases de données mises en miroir
  • Catalogues Azure Databricks mis en miroir
  • Bases de données SQL
  • Modèles sémantiques

Sources externes (utilisez une connexion cloud avec des informations d’identification stockées) :

Créer un raccourci

Pour créer un raccourci, ouvrez une lakehouse et accédez à l’affichage Explorateur . Sélectionnez les points de suspension (...) en regard des tables ou des fichiers. L’étiquette de menu dépend de l’emplacement où vous créez le raccourci :

L’exemple suivant montre comment créer un raccourci dans la section Fichiers .

Capture d’écran montrant l’option Nouveau raccourci dans la section Fichiers de l’explorateur lakehouse.

Pour obtenir des instructions détaillées sur chaque type de source, consultez Créer un raccourci OneLake interne ou sélectionnez l’un des liens sources externes dans la section Sources de raccourci prises en charge .

Note

Les tables Delta externes créées avec du code Spark ne sont pas automatiquement visibles dans le point de terminaison d’analytique SQL. Créez un raccourci dans la section Tables pour rendre les tables Delta externes disponibles pour les requêtes SQL. Pour plus d'informations, consultez les raccourcis OneLake .

Quand utiliser des raccourcis et copier des données

Scénario Approche recommandée
Les données sont déjà dans Fabric (un autre lakehouse, un entrepôt ou un espace de travail) Raccourci : évite la duplication et conserve les données synchronisées
Les données se situent dans le stockage cloud externe et vous avez besoin d’un accès quasi-en temps réel Raccourci : aucun flux d’ingestion à gérer
Les données ont besoin de transformations complexes avant d’être utilisées Copie : utiliser des pipelines, des flux de données ou des notebooks pour transformer et charger
La conformité ou la sécurité nécessite que les données résident dans une région spécifique Copier : les raccourcis ne déplacent pas de données, de sorte que les données restent dans sa région source
Vous avez besoin d’un contrôle total sur l’évolution du schéma et la maintenance des tables Attention : les opérations de maintenance de table Delta ne fonctionnent que sur des tables locales

Pour obtenir d’autres façons d’importer des données dans un Lakehouse, consultez Options pour importer des données dans le Lakehouse.

Contrôle d’accès

  • Les raccourcis internes utilisent l’identité de l’utilisateur appelant. L’utilisateur doit disposer d’autorisations de lecture sur la cible de raccourci pour accéder aux données.
  • Les raccourcis externes utilisent les informations d’identification de connexion cloud spécifiées lors de la création du raccourci. Tout utilisateur disposant d’un accès au lakehouse peut lire les données via le raccourci à l’aide de ces informations d’identification stockées.

Pour plus d’informations sur les autorisations de raccourci, consultez la sécurité des raccourcis OneLake.