Vytvoření úložiště dat

Dokončeno

V Azure Machine Learning jsou úložiště dat abstrakcí pro cloudové zdroje dat. Zapouzdřují informace potřebné pro připojení ke zdrojům dat a bezpečně uloží tyto informace o připojení, abyste je nemuseli kódovat ve skriptech.

Výhody používání úložišť dat jsou:

  • Poskytuje snadno použitelné identifikátory URI pro vaše úložiště dat.
  • Usnadňuje zjišťování dat ve službě Azure Machine Learning.
  • Bezpečně ukládá informace o připojení, aniž byste museli vystavit tajné kódy a klíče datovým vědcům.

Při vytváření úložiště dat s použitím existujícího účtu úložiště v Azure máte na výběr mezi dvěma různými metodami ověřování:

Diagram dvou různých metod ověřování, které úložiště dat ve službě Azure Machine Learning používají pro připojení k externím zdrojům dat

  • Na základě přihlašovacích údajů: K ověření přístupu k účtu úložiště použijte instanční objekt, token sdíleného přístupového podpisu (SAS) nebo klíč účtu.
  • Založené na identitě: Použijte identitu Microsoft Entra nebo spravovanou identitu.

Principy typů úložišť dat

Azure Machine Learning podporuje vytváření úložišť dat pro více druhů zdrojů dat Azure, mezi které patří:

  • Azure Blob Storage
  • Sdílená složka Azure
  • Azure Data Lake (Gen 2)

Použití integrovaných úložišť dat

Každý pracovní prostor má čtyři předdefinované úložiště dat (dvě připojení ke kontejnerům objektů blob služby Azure Storage a dvě připojení ke sdíleným složkám azure Storage), které azure Machine Learning používá jako systémová úložiště.

Ve většině projektů strojového učení potřebujete pracovat s vlastními zdroji dat. Řešení strojového učení můžete například integrovat s daty z existujících aplikací nebo kanálů přípravy dat.

Vytvoření úložiště dat

Úložiště dat jsou připojena k pracovním prostorům a slouží k ukládání informací o připojení ke službám úložiště. Při vytváření úložiště dat zadáte název, který se dá použít k načtení informací o připojení.

Úložiště dat umožňují snadné připojení ke službám úložiště, aniž byste museli poskytovat všechny potřebné podrobnosti pokaždé, když chcete číst nebo zapisovat data. Vytvoří také ochrannou vrstvu, pokud chcete, aby uživatelé používali data, ale nepřipojí se přímo k podkladové službě úložiště.

Vytvoření úložiště dat pro kontejner Azure Blob Storage

Úložiště dat můžete vytvořit prostřednictvím grafického uživatelského rozhraní, rozhraní příkazového řádku Azure (CLI) nebo sady Sdk (Software Development Kit).

V závislosti na službě úložiště, ke které se chcete připojit, existují různé možnosti ověřování ve službě Azure Machine Learning.

Pokud například chcete vytvořit úložiště dat pro připojení k kontejneru Azure Blob Storage, můžete použít klíč účtu:

blob_datastore = AzureBlobDatastore(
    			name = "blob_example",
    			description = "Datastore pointing to a blob container",
    			account_name = "mytestblobstore",
    			container_name = "data-container",
    			credentials = AccountKeyConfiguration(
        			account_key="XXXxxxXXXxXXXXxxXXX"
    			),
)
ml_client.create_or_update(blob_datastore)

Alternativně můžete vytvořit úložiště dat pro připojení ke kontejneru Azure Blob Storage pomocí tokenu SAS k ověření:

blob_datastore = AzureBlobDatastore(
name="blob_sas_example",
description="Datastore pointing to a blob container",
account_name="mytestblobstore",
container_name="data-container",
credentials=SasTokenConfiguration(
sas_token="?xx=XXXX-XX-XX&xx=xxxx&xxx=xxx&xx=xxxxxxxxxxx&xx=XXXX-XX-XXXXX:XX:XXX&xx=XXXX-XX-XXXXX:XX:XXX&xxx=xxxxx&xxx=XXxXXXxxxxxXXXXXXXxXxxxXXXXXxxXXXXXxXXXXxXXXxXXxXX"
),
)
ml_client.create_or_update(blob_datastore)

Tip

Přečtěte si další informace o vytváření úložišť dat pro připojení k jiným typům řešení cloudového úložiště.