عمليات نظام الملفات على Azure Data Lake Storage Gen1 باستخدام Python
في هذه المقالة، ستتعلم كيفية استخدام Python SDK لتنفيذ عمليات نظام الملفات على Azure Data Lake Storage Gen1. للحصول على إرشادات حول كيفية تنفيذ عمليات إدارة الحساب على Data Lake Storage Gen1 باستخدام Python، راجع عمليات إدارة الحساب على Data Lake Storage Gen1 باستخدام Python.
المتطلبات الأساسية
لغة برمجة بايثون. يمكنك تنزيل Python من هنا. تستخدم هذه المقالة Python 3.6.2.
اشتراك Azure. راجع الحصول على الإصدار التجريبي المجاني من Azure .
حساب Azure Data Lake Storage Gen1. اتبع الإرشادات في بدء Azure Data Lake Storage Gen1 باستخدام مدخل Microsoft Azure.
قم بتثبيت الوحدات
للعمل مع Data Lake Storage Gen1 باستخدام Python، تحتاج إلى تثبيت ثلاث وحدات نمطية.
-
azure-mgmt-resource
الوحدة النمطية، التي تتضمن وحدات Azure ل Active Directory، وما إلى ذلك. -
azure-mgmt-datalake-store
الوحدة النمطية، والتي تتضمن عمليات إدارة حساب Azure Data Lake Storage Gen1. لمزيد من المعلومات حول هذه الوحدة النمطية، راجع مرجع الوحدة النمطية azure-mgmt-datalake-store. -
azure-datalake-store
الوحدة النمطية، التي تتضمن عمليات نظام ملفات Azure Data Lake Storage Gen1. لمزيد من المعلومات حول هذه الوحدة النمطية، راجع مرجع الوحدة النمطية azure-datalake-store file-system.
استخدم الأوامر التالية لتثبيت الوحدات النمطية.
pip install azure-mgmt-resource
pip install azure-mgmt-datalake-store
pip install azure-datalake-store
إنشاء تطبيق Python جديد
في IDE الذي تختاره، أنشئ تطبيق Python جديدا، على سبيل المثال، mysample.py.
أضف الأسطر التالية لاستيراد الوحدات النمطية المطلوبة
## Use this only for Azure AD service-to-service authentication from azure.common.credentials import ServicePrincipalCredentials ## Use this only for Azure AD end-user authentication from azure.common.credentials import UserPassCredentials ## Use this only for Azure AD multi-factor authentication from msrestazure.azure_active_directory import AADTokenCredentials ## Required for Azure Data Lake Storage Gen1 account management from azure.mgmt.datalake.store import DataLakeStoreAccountManagementClient from azure.mgmt.datalake.store.models import DataLakeStoreAccount ## Required for Azure Data Lake Storage Gen1 filesystem management from azure.datalake.store import core, lib, multithread ## Common Azure imports from azure.mgmt.resource.resources import ResourceManagementClient from azure.mgmt.resource.resources.models import ResourceGroup ## Use these as needed for your application import logging, getpass, pprint, uuid, time
احفظ التغييرات في mysample.py.
المصادقة
في هذا القسم، نتحدث عن الطرق المختلفة للمصادقة مع Microsoft Entra ID. الخيارات المتاحة هي:
- للحصول على مصادقة المستخدم النهائي لتطبيقك، راجع مصادقة المستخدم النهائي مع Data Lake Storage Gen1 باستخدام Python.
- للحصول على مصادقة خدمة إلى خدمة لتطبيقك، راجع مصادقة خدمة إلى خدمة مع Data Lake Storage Gen1 باستخدام Python.
إنشاء عميل نظام الملفات
تنشئ القصاصة البرمجية التالية أولا عميل حساب Data Lake Storage Gen1. يستخدم كائن العميل لإنشاء حساب Data Lake Storage Gen1. وأخيرا، تنشئ القصاصة البرمجية كائن عميل نظام ملفات.
## Declare variables
subscriptionId = 'FILL-IN-HERE'
adlsAccountName = 'FILL-IN-HERE'
## Create a filesystem client object
adlsFileSystemClient = core.AzureDLFileSystem(adlCreds, store_name=adlsAccountName)
إنشاء دليل
## Create a directory
adlsFileSystemClient.mkdir('/mysampledirectory')
تحميل ملف
## Upload a file
multithread.ADLUploader(adlsFileSystemClient, lpath='C:\\data\\mysamplefile.txt', rpath='/mysampledirectory/mysamplefile.txt', nthreads=64, overwrite=True, buffersize=4194304, blocksize=4194304)
تنزيل ملف
## Download a file
multithread.ADLDownloader(adlsFileSystemClient, lpath='C:\\data\\mysamplefile.txt.out', rpath='/mysampledirectory/mysamplefile.txt', nthreads=64, overwrite=True, buffersize=4194304, blocksize=4194304)
حذف دليل
## Delete a directory
adlsFileSystemClient.rm('/mysampledirectory', recursive=True)