Kontoverwaltungsvorgänge für Azure Data Lake Storage Gen1 mit Python
Es wird beschrieben, wie Sie das Python SDK für Azure Data Lake Storage Gen1 verwenden, um grundlegende Kontoverwaltungsvorgänge durchzuführen, z.B. ein Data Lake Storage Gen1-Konto erstellen, Data Lake Storage Gen1-Konten auflisten usw. Eine Anleitung, wie Sie Dateisystemvorgänge in Data Lake Storage Gen1 mit Python durchführen, finden Sie unter Dateisystemvorgänge in Data Lake Storage Gen1 mit Python.
Voraussetzungen
Python. Sie können Python hier herunterladen. In diesem Artikel wird Python 3.6.2 verwendet.
Ein Azure-Abonnement. Siehe Kostenlose Azure-Testversion.
Eine Azure-Ressourcengruppe. Anweisungen finden Sie unter Verwalten von Azure-Ressourcen über das Portal.
Installieren der Module
Zum Verwenden von Data Lake Storage Gen1 mit Python müssen Sie drei Module installieren.
- Das Modul
azure-mgmt-resource
, in dem Azure-Module für Active Directory usw. enthalten sind. - Das Modul
azure-mgmt-datalake-store
, das die Kontoverwaltungsvorgänge für Azure Data Lake Storage Gen1 enthält. Weitere Informationen zu diesem Modul finden Sie in der Referenz zum Verwaltungsmodul für Azure Data Lake Storage Gen1. - Das Modul
azure-datalake-store
, das die Dateisystemvorgänge für Azure Data Lake Storage Gen1 enthält. Weitere Informationen zu diesem Modul finden Sie in der Referenz zum azure-datalake-store-Dateisystemmodul.
Verwenden Sie die folgenden Befehle, um die Module zu installieren:
pip install azure-identity
pip install azure-mgmt-resource
pip install azure-mgmt-datalake-store
pip install azure-datalake-store
Erstellen einer neuen Python-Anwendung
Erstellen Sie in der IDE Ihrer Wahl eine neue Python-Anwendung, z.B. mysample.py.
Fügen Sie den folgenden Codeausschnitt hinzu, um die erforderlichen Module zu importieren:
# Acquire a credential object for the app identity. When running in the cloud, # DefaultAzureCredential uses the app's managed identity (MSI) or user-assigned service principal. # When run locally, DefaultAzureCredential relies on environment variables named # AZURE_CLIENT_ID, AZURE_CLIENT_SECRET, and AZURE_TENANT_ID. from azure.identity import DefaultAzureCredential ## Required for Data Lake Storage Gen1 account management from azure.mgmt.datalake.store import DataLakeStoreAccountManagementClient from azure.mgmt.datalake.store.models import CreateDataLakeStoreAccountParameters ## Required for Data Lake Storage Gen1 filesystem management from azure.datalake.store import core, lib, multithread # Common Azure imports import adal from azure.mgmt.resource.resources import ResourceManagementClient from azure.mgmt.resource.resources.models import ResourceGroup # Use these as needed for your application import logging, getpass, pprint, uuid, time
Speichern Sie Ihre Änderungen an „mysample.py“.
Authentifizierung
In diesem Abschnitt werden die verschiedenen Methoden zur Authentifizierung bei Microsoft Entra ID erläutert. Die verfügbaren Optionen sind:
- Informationen zur Authentifizierung von Endbenutzern für Ihre Anwendung finden Sie unter Authentifizierung von Endbenutzern mit Data Lake Storage Gen1 über Python.
- Informationen zur Dienst-zu-Dienst-Authentifizierung für Ihre Anwendung finden Sie unter Dienst-zu-Dienst-Authentifizierung mit Data Lake Storage Gen1 über Python.
Erstellen eines Clients und eines Data Lake Storage Gen1-Kontos
Der folgende Codeausschnitt erstellt zunächst den Data Lake Storage Gen1-Kontoclient. Er verwendet das Clientobjekt zum Erstellen eines Data Lake Storage Gen1-Kontos. Schließlich erstellt der Codeausschnitt ein Dateisystem-Clientobjekt.
## Declare variables
subscriptionId = 'FILL-IN-HERE'
adlsAccountName = 'FILL-IN-HERE'
resourceGroup = 'FILL-IN-HERE'
location = 'eastus2'
credential = DefaultAzureCredential()
## Create Data Lake Storage Gen1 account management client object
adlsAcctClient = DataLakeStoreAccountManagementClient(credential, subscription_id=subscriptionId)
## Create a Data Lake Storage Gen1 account
adlsAcctResult = adlsAcctClient.accounts.begin_create(
resourceGroup,
adlsAccountName,
CreateDataLakeStoreAccountParameters(
location=location
)
)
Auflisten der Data Lake Storage Gen1-Konten
## List the existing Data Lake Storage Gen1 accounts
result_list_response = adlsAcctClient.accounts.list()
result_list = list(result_list_response)
for items in result_list:
print(items)
Löschen des Data Lake Storage Gen1-Kontos
## Delete an existing Data Lake Storage Gen1 account
adlsAcctClient.accounts.begin_delete(resourceGroup, adlsAccountName)