Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
OneLake est un lac de données unique, unifié et logique pour l'ensemble de votre organisation. Comme OneDrive, OneLake est fourni automatiquement avec chaque locataire Microsoft Fabric et est conçu pour être le seul emplacement pour toutes vos données d’analyse.
OneLake apporte aux clients :
- Un lac de données pour l’organisation entière
- Une copie de données à utiliser avec plusieurs moteurs analytiques
Un lac de données pour l’organisation entière
Avant OneLake, de nombreuses organisations ont créé plusieurs lacs pour différents groupes d’entreprises, ce qui a entraîné une surcharge supplémentaire pour la gestion de plusieurs ressources. OneLake supprime ces défis en améliorant la collaboration :
- Chaque tenant Fabric obtient automatiquement un OneLake
- Vous ne pouvez pas créer plusieurs OneLakes ni supprimer votre OneLake
- Aucune ressource supplémentaire pour approvisionner ou gérer
Cette simplicité aide votre organisation à collaborer sur un seul lac de données unifié.
Régi par défaut avec la propriété distribuée pour la collaboration
Le niveau supérieur de l’organisation et de la gouvernance pour les données Fabric est le locataire. Toutes les données qui atterrissent dans OneLake sont automatiquement protégées par des stratégies au niveau du locataire pour la sécurité, la conformité et la gestion des données.
Au sein d’un locataire, la collaboration se produit dans les espaces de travail. Vous pouvez créer n’importe quel nombre d’espaces de travail pour organiser vos données. Les espaces de travail permettent aux différentes parties de l'organisation de distribuer des politiques de propriété et d'accès. Chaque espace de travail fait partie d’une capacité liée à une région spécifique et facturée séparément.
Dans un espace de travail, vous créez et accédez à toutes les données par le biais d’éléments de données. Comme pour la façon dont Office stocke les fichiers Word, Excel et PowerPoint dans OneDrive, Fabric stocke les lakehouses, les entrepôts et d’autres articles dans OneLake. Chaque type d’élément fournit des expériences personnalisées pour différentes personnes, telles que l’expérience de développeur Apache Spark dans un lakehouse.
Basé sur des normes et des formats ouverts
OneLake est basé sur Azure Data Lake Storage (ADLS) Gen2 et peut prendre en charge n’importe quel type de fichier, structuré ou non structuré. Tous les éléments de données Fabric tels que les entrepôts de données et les lakehouses stockent automatiquement leurs données dans OneLake au format delta parquet. Si un ingénieur données charge des données dans un lakehouse à l’aide d’Apache Spark, puis qu’un développeur SQL utilise T-SQL pour charger des données dans un entrepôt de données transactionnel complet, les deux contribuent au même lac de données. OneLake stocke toutes les données tabulaires au format Delta Parquet.
OneLake prend en charge les mêmes API et SDK ADLS Gen2 pour être compatibles avec les applications ADLS Gen2 existantes, y compris Azure Databricks. Vous pouvez traiter les données dans OneLake comme s’il s’agit d’un compte de stockage ADLS volumineux pour l’ensemble de l’organisation. Chaque espace de travail apparaît sous la forme d’un conteneur dans ce compte de stockage, et différents éléments de données apparaissent sous forme de dossiers dans ces conteneurs.
Pour plus d’informations sur les API et les points de terminaison, consultez Accès et API OneLake. Pour obtenir des exemples d’intégrations de OneLake à Azure, consultez les articles Azure Synapse Analytics, Explorateur stockage Azure, Azure Databricks et Azure HDInsight.
Explorateur de fichiers OneLake pour Windows
Vous pouvez explorer les données OneLake à partir de Windows à l’aide de l’Explorateur de fichiers OneLake pour Windows. Vous pouvez parcourir tous vos espaces de travail et éléments de données, charger, télécharger ou modifier facilement des fichiers comme vous le faites dans Office. L’Explorateur de fichiers OneLake simplifie l’utilisation des lacs de données, ce qui permet même aux utilisateurs professionnels non techniques de les utiliser.
Pour plus d’informations, consultez Explorateur de fichiers OneLake.
Une copie de données
OneLake vise à vous donner la plus grande valeur possible à partir d’une seule copie de données sans déplacement ou duplication de données. Vous n’avez pas besoin de copier des données simplement pour l’utiliser avec un autre moteur ou pour analyser des données à partir de plusieurs sources.
Les raccourcis connectent les données entre les domaines sans déplacement de données
Un raccourci est une référence aux données stockées dans d’autres emplacements de fichiers. Ces emplacements de fichiers peuvent se trouver dans le même espace de travail ou dans différents espaces de travail, dans OneLake ou externe à OneLake, comme ADLS, S3 ou Dataverse. Quel que soit l’emplacement, les raccourcis rendent les fichiers et les dossiers comme si vous les avez stockés localement.
Les raccourcis permettent à votre organisation de partager des données entre les utilisateurs et les applications sans avoir à déplacer et à dupliquer inutilement des informations. Lorsque les équipes travaillent indépendamment dans des espaces de travail distincts, les raccourcis vous permettent de combiner des données dans différents groupes d’entreprises et domaines dans un produit de données virtuel pour répondre aux besoins spécifiques d’un utilisateur.
Pour plus d’informations sur l’utilisation des raccourcis, consultez Raccourcis OneLake.
Connecter des données à plusieurs moteurs analytiques
Les données sont souvent optimisées pour un seul moteur, ce qui rend difficile la réutilisation des mêmes données pour plusieurs applications. Avec Fabric, les différents moteurs analytiques (T-SQL, Apache Spark, Analysis Services et autres) stockent des données au format Delta Parquet ouvert pour vous permettre d’utiliser les mêmes données sur plusieurs moteurs.
Vous n’avez pas besoin de copier des données simplement pour les utiliser avec un autre moteur ou de vous sentir bloqué par l'utilisation d'un moteur particulier, parce que c'est là que vos données se trouvent. Par exemple, imaginez une équipe d’ingénieurs SQL qui crée un entrepôt de données transactionnel complet. Ils peuvent utiliser le moteur T-SQL et toute la puissance de T-SQL pour créer des tables, transformer des données et charger les données dans des tables. Si un scientifique des données souhaite utiliser ces données, il n’est pas nécessaire de passer par un pilote Spark/SQL spécial. OneLake stocke toutes les données au format Delta Parquet. Le scientifique des données peut utiliser la puissance totale du moteur Spark et de ses bibliothèques open source directement sur les données.
Les utilisateurs professionnels peuvent créer des rapports Power BI directement sur OneLake à l’aide du mode Direct Lake dans le moteur Analysis Services. Le moteur Analysis Services alimente les modèles sémantiques Power BI et offre toujours deux modes d’accès aux données : importer et diriger une requête. Ce troisième mode, le mode Direct Lake, donne aux utilisateurs toute la vitesse d’importation sans avoir à copier les données, en combinant le meilleur de l’importation et de la requête directe. Pour plus d’informations, consultez Direct Lake.
Étapes suivantes
Prêt à commencer à utiliser OneLake ? Voici comment procéder :