Udostępnij za pośrednictwem


Biblioteka klienta skanowania usługi Azure Purview dla języka Python — wersja 1.0.0b2

Skanowanie w usłudze Azure Purview to w pełni zarządzana usługa w chmurze, której użytkownicy mogą skanować dane w twoim majątku danych (nazywanym również katalogiem). Skanowanie to proces, za pomocą którego wykaz łączy się bezpośrednio ze źródłem danych zgodnie z harmonogramem określonym przez użytkownika.

  • Skanowanie danych w katalogu
  • Badanie danych
  • Wyodrębnianie schematów z danych

W dużej mierze polegaj na dokumentacji usługi i dokumentacji klienta , aby korzystać z tej biblioteki

Kod | źródłowy Pakiet (PyPI) | Dokumentacja referencyjna interfejsu| API Dokumentacja produktu

Zrzeczenie odpowiedzialności

Obsługa pakietów języka Python zestawu Azure SDK dla języka Python 2.7 kończy się 01 stycznia 2022 r. Aby uzyskać więcej informacji i pytań, zapoznaj się z artykułem https://github.com/Azure/azure-sdk-for-python/issues/20691

Wprowadzenie

Wymagania wstępne

  • Do korzystania z tego pakietu wymagany jest język Python w wersji 2.7 lub 3.6 lub nowszej.
  • Aby korzystać z tego pakietu, musisz mieć subskrypcję platformy Azure i usługę Purview .

Tworzenie zasobu usługi Purview

Postępuj zgodnie z tymi instrukcjami, aby utworzyć zasób usługi Purview

Instalowanie pakietu

Zainstaluj bibliotekę klienta skanowania usługi Azure Purview dla języka Python przy użyciu narzędzia pip:

pip install azure-purview-scanning

Uwierzytelnianie klienta

Aby użyć poświadczeń tokenu usługi Azure Active Directory (AAD), podaj wystąpienie żądanego typu poświadczeń uzyskanego z biblioteki azure-identity .

Aby uwierzytelnić się za pomocą usługi AAD, musisz najpierw zainstalowaćazure-identity i włączyć uwierzytelnianie usługi AAD w zasobie usługi Purview

Po skonfigurowaniu można wybrać typ poświadczeń z witryny azure.identity do użycia. Na przykład wartość DefaultAzureCredential może służyć do uwierzytelniania klienta:

Ustaw wartości identyfikatora klienta, identyfikatora dzierżawy i wpisu tajnego klienta aplikacji usługi AAD jako zmienne środowiskowe: AZURE_CLIENT_ID, AZURE_TENANT_ID, AZURE_CLIENT_SECRET

Użyj zwróconego poświadczenia tokenu, aby uwierzytelnić klienta:

from azure.purview.scanning import PurviewScanningClient
from azure.identity import DefaultAzureCredential

credential = DefaultAzureCredential()
client = PurviewScanningClient(endpoint="https://<my-account-name>.scan.purview.azure.com", credential=credential)

Kluczowe pojęcia

Klient

Ten pakiet oferuje konstruktorów żądań, dzięki czemu można tworzyć żądania HTTP i wysyłać te żądania do usługi przy użyciu send_request metody . Aby uzyskać więcej informacji na temat korzystania z konstruktorów żądań i naszych klientów, zobacz tutaj.

Przykłady

W poniższej sekcji pokazano, jak zainicjować i uwierzytelnić klienta, a następnie wyświetlić listę wszystkich źródeł danych.

Wyświetlanie listy wszystkich źródeł danych

from azure.purview.scanning import PurviewScanningClient
from azure.identity import DefaultAzureCredential
from azure.core.exceptions import HttpResponseError

credential = DefaultAzureCredential()
client = PurviewScanningClient(endpoint="https://<my-account-name>.scan.purview.azure.com", credential=credential)
try:
    response = client.data_sources.list_all()
    result = [item for item in response]
    print(result)
except HttpResponseError as e:
    print(e)

Rozwiązywanie problemów

Ogólne

Klient skanowania usługi Purview zgłosi wyjątki zdefiniowane w usłudze [Azure Core][azure_core], jeśli wywołasz .raise_for_status() odpowiedzi.

Rejestrowanie

Ta biblioteka używa standardowej biblioteki rejestrowania do rejestrowania. Podstawowe informacje o sesjach HTTP (adresach URL, nagłówkach itp.) są rejestrowane na poziomie INFORMACJI.

Szczegółowe rejestrowanie na poziomie DEBUG, w tym treści żądań/odpowiedzi i nieredagowanych nagłówków, można włączyć na kliencie z argumentem logging_enable kluczowym:

import sys
import logging
from azure.identity import DefaultAzureCredential
from azure.purview.scanning import PurviewScanningClient

# Create a logger for the 'azure' SDK
logger = logging.getLogger('azure')
logger.setLevel(logging.DEBUG)

# Configure a console output
handler = logging.StreamHandler(stream=sys.stdout)
logger.addHandler(handler)

endpoint = "https://<my-account-name>.scan.purview.azure.com"
credential = DefaultAzureCredential()

# This client will log detailed information about its HTTP sessions, at DEBUG level
client = PurviewScanningClient(endpoint=endpoint, credential=credential, logging_enable=True)

Podobnie może logging_enable włączyć szczegółowe rejestrowanie dla pojedynczego send_request wywołania, nawet jeśli nie jest włączone dla klienta:

result = client.data_sources.list_all(logging_enable=True)

Następne kroki

Aby uzyskać więcej ogólnych przykładów, zobacz dokumentację klienta.

Współtworzenie

W tym projekcie zachęcamy do współtworzenia i zgłaszania sugestii. Współtworzenie w większości przypadków wymaga zgody na umowę licencyjną dotyczącą współautorów (CLA, Contributor License Agreement), zgodnie z którą współautor ma prawo udzielić i faktycznie udziela nam praw do używania wytworzonej przez siebie zawartości. Aby uzyskać szczegółowe informacje, odwiedź stronę cla.microsoft.com.

Po przesłaniu żądania ściągnięcia robot CLA automatycznie określi, czy musisz przekazać umowę CLA, i doda odpowiednie informacje do tego żądania (na przykład etykietę czy komentarz). Po prostu postępuj zgodnie z instrukcjami robota. Wystarczy zrobić to raz dla wszystkich repozytoriów, w przypadku których jest używana nasza umowa CLA.

W tym projekcie przyjęto Kodeks postępowania oprogramowania Open Source firmy Microsoft. Aby uzyskać więcej informacji, zobacz Często zadawane pytania dotyczące kodeksu postępowania lub skontaktuj się z opencode@microsoft.com dodatkowymi pytaniami lub komentarzami.