Sdílet prostřednictvím


Klientská knihovna pro prohledávání Azure Purview pro Python – verze 1.0.0b2

Azure Purview Scanning je plně spravovaná cloudová služba, jejíž uživatelé můžou skenovat vaše data do vašeho datového majetku (označovaného také jako váš katalog). Skenování je proces, kterým se katalog připojuje přímo ke zdroji dat podle plánu zadaného uživatelem.

  • Skenování dat do katalogu
  • Prozkoumání dat
  • Extrahování schémat z dat

Při používání této knihovny se do značné míry spoléhejte na dokumentaci ke službě a naši klientskou dokumentaci .

Zdrojový kód | Balíček (PyPI) | Referenční dokumentace k| rozhraní API Dokumentace k produktu

Právní omezení

Podpora balíčků Azure SDK Python pro Python 2.7 končí 1. ledna 2022. Další informace a dotazy najdete na https://github.com/Azure/azure-sdk-for-python/issues/20691

Začínáme

Požadavky

  • K použití tohoto balíčku se vyžaduje Python 2.7 nebo 3.6 nebo novější.
  • Abyste mohli tento balíček použít, musíte mít předplatné Azure a Purview .

Vytvoření prostředku Purview

Podle těchto pokynů vytvořte prostředek Purview.

Instalace balíčku

Nainstalujte klientskou knihovnu Azure Purview Scanning pro Python pomocí nástroje pip:

pip install azure-purview-scanning

Ověření klienta

Pokud chcete použít přihlašovací údaje tokenu Azure Active Directory (AAD), zadejte instanci požadovaného typu přihlašovacích údajů získané z knihovny azure-identity .

Pokud se chcete ověřit pomocí AAD, musíte nejprve nainstalovat azure-identity a povolit ověřování AAD ve vašem prostředku Purview.

Po nastavení můžete zvolit, jaký typ přihlašovacích údajů z azure.identity chcete použít. Například DefaultAzureCredential se dá použít k ověření klienta:

Nastavte hodnoty ID klienta, ID tenanta a tajného klíče klienta aplikace AAD jako proměnné prostředí: AZURE_CLIENT_ID, AZURE_TENANT_ID AZURE_CLIENT_SECRET

K ověření klienta použijte vrácené přihlašovací údaje tokenu:

from azure.purview.scanning import PurviewScanningClient
from azure.identity import DefaultAzureCredential

credential = DefaultAzureCredential()
client = PurviewScanningClient(endpoint="https://<my-account-name>.scan.purview.azure.com", credential=credential)

Klíčové koncepty

Klient

Tento balíček nabízí tvůrce žádostí, abyste mohli vytvářet požadavky HTTP a odesílat je do služby pomocí metody .send_request Další informace o tom, jak používat tvůrce požadavků a naše klienty, najdete tady.

Příklady

V následující části se dozvíte, jak inicializovat a ověřit klienta a pak vypsat všechny zdroje dat.

Vypsat všechny zdroje dat

from azure.purview.scanning import PurviewScanningClient
from azure.identity import DefaultAzureCredential
from azure.core.exceptions import HttpResponseError

credential = DefaultAzureCredential()
client = PurviewScanningClient(endpoint="https://<my-account-name>.scan.purview.azure.com", credential=credential)
try:
    response = client.data_sources.list_all()
    result = [item for item in response]
    print(result)
except HttpResponseError as e:
    print(e)

Poradce při potížích

Obecné

Klient prohledávání Purview vyvolá výjimky definované v [Azure Core][azure_core] při volání .raise_for_status() odpovědí.

protokolování

Tato knihovna používá k protokolování standardní knihovnu protokolování . Základní informace o relacích HTTP (adresy URL, hlavičky atd.) se protokolují na úrovni INFO.

Podrobné protokolování úrovně DEBUG, včetně těl požadavků/odpovědí a nezopravovaných hlaviček, je možné povolit v klientovi s argumentem klíčového logging_enable slova:

import sys
import logging
from azure.identity import DefaultAzureCredential
from azure.purview.scanning import PurviewScanningClient

# Create a logger for the 'azure' SDK
logger = logging.getLogger('azure')
logger.setLevel(logging.DEBUG)

# Configure a console output
handler = logging.StreamHandler(stream=sys.stdout)
logger.addHandler(handler)

endpoint = "https://<my-account-name>.scan.purview.azure.com"
credential = DefaultAzureCredential()

# This client will log detailed information about its HTTP sessions, at DEBUG level
client = PurviewScanningClient(endpoint=endpoint, credential=credential, logging_enable=True)

Podobně logging_enable může povolit podrobné protokolování pro jedno send_request volání, i když není povolené pro klienta:

result = client.data_sources.list_all(logging_enable=True)

Další kroky

Obecnější ukázky najdete v naší dokumentaci ke klientům.

Přispívání

Tento projekt vítá příspěvky a návrhy. Většina příspěvků vyžaduje souhlas s licenční smlouvou s přispěvatelem (CLA), která stanoví, že máte právo udělit nám práva k používání vašeho příspěvku a skutečně tak činíte. Podrobnosti najdete v cla.microsoft.com.

Při odesílání žádosti o přijetí změn robot CLA automaticky určí, jestli je potřeba poskytnout smlouvu CLA, a příslušným způsobem žádost o přijetí změn upraví (např. přidáním jmenovky nebo komentáře). Stačí postupovat podle pokynů robota. Pro všechna úložiště používající naši smlouvu CLA to stačí udělat jenom jednou.

Tento projekt přijal pravidla chování pro Microsoft Open Source. Další informace najdete v nejčastějších dotazech k pravidlům chování nebo kontaktujte s opencode@microsoft.com případnými dalšími dotazy nebo připomínkami.