Sdílet prostřednictvím


Export do tabulky Azure

Důležité

Podpora studia Machine Learning (Classic) skončí 31. srpna 2024. Doporučujeme do tohoto data přejít na službu Azure Machine Learning.

Od 1. prosince 2021 nebude možné vytvářet nové prostředky studia Machine Learning (Classic). Do 31. srpna 2024 můžete pokračovat v používání stávajících prostředků studia Machine Learning (Classic).

Dokumentace ke studiu ML (Classic) se vyřazuje z provozu a v budoucnu se nemusí aktualizovat.

Tento článek popisuje, jak použít možnost Exportovat do Azure v modulu Export dat v Machine Learning Studiu (classic).

Poznámka

Platí pro: Machine Learning Studio (classic)

Podobné moduly s přetahováním jsou k dispozici v Azure Machine Learning návrháři.

Tato možnost je užitečná, když chcete exportovat výsledky nebo přechodná data z experimentu strojového učení do tabulky Azure. Azure Table Service je služba pro správu dat v Azure, která může ukládat velké objemy strukturovaných, nerelačních dat. Jedná se o úložiště dat NoSQL, které přijímá ověřená volání z azure i mimo Azure.

Export dat do tabulky Azure

  1. Přidejte do experimentu modul Export dat. Tento modul najdete v kategorii Vstup a výstup dat v nástroji Studio (classic).

  2. Připojení do modulu, který vytváří data, která chcete exportovat do úložiště tabulek v Azure.

  3. Nastavením možnosti Typ ověřování určete, jestli chcete exportovat data do veřejného sdíleného prostředku nebo do privátního účtu úložiště, který vyžaduje přihlašovací údaje.

    • Veřejná (ADRESA URL SAS): Tuto možnost vyberte, pokud účet podporuje přístup přes adresu URL SAS. Do pole Identifikátor URI SAS tabulky zadejte nebo vložte úplný identifikátor URI, který definuje účet a veřejný objekt blob.

      Adresa URL SAS je krát vázaný přístupový odkaz, který můžete vygenerovat pomocí nástroje úložiště Azure. Na stránce přístupné přes adresu URL SAS je možné ukládat data pouze v těchto formátech: CSV, TSV a ARFF.

    • Účet: Tuto možnost vyberte, pokud jsou vaše data v privátním účtu. Musíte také zadat přihlašovací údaje, včetně názvu účtu a klíče.

  4. Pokud chcete exportovat data do zabezpečeného privátního úložiště, zadejte přihlašovací údaje potřebné pro přístup k účtu:

    • Název účtu tabulky: Zadejte nebo vložte název účtu, který obsahuje objekt blob, ke které chcete získat přístup. Pokud je například úplná adresa URL účtu úložiště https://myshared.table.core.windows.net, zadejte myshared.

    • Klíč účtu tabulky: Vložte přístupový klíč přidružený k účtu úložiště.

    • Název tabulky: Zadejte název konkrétní tabulky, kterou chcete přečíst.

  5. Pomocí vlastností sloupce určete, které sloupce se mají uložit do úložiště tabulek a které se mají použít při definování schématu tabulky.

    • Klíč oddílu: Zvolte sloupec, který se má použít k rozdělení uložené datové sady pro tabulku v Azure Storage. Tabulky v Azure jsou rozdělené tak, aby podporovaly vyrovnávání zatížení mezi uzly úložiště. Všechny entity tabulky jsou uspořádané podle oddílů. Proto se pro všechny operace s tabulkami vyžaduje vlastnost PartitionKey.

    • Klíč řádku tabulky Azure: Zvolte sloupec, který se má použít pro vlastnost RowKey . Vlastnost RowKey je systémová vlastnost, která se vyžaduje pro každou entitu v tabulce. Společně s vlastností PartitionKey tvoří jedinečný index pro každý řádek v tabulce.

    Poznámka

    Pro RowKey a PartitionKey musíte použít různé sloupce. Ujistěte se, že seznam cílových sloupců obsahuje také sloupec, který vyberete pro RowKey nebo PartitionKey, nebo že dojde k chybě.

    • Sloupce původu tabulek Azure: Vyberte všechny další sloupce z datové sady, které chcete uložit do tabulky Azure. Musíte také zahrnout sloupce vybrané pro PartitionKey aRowKey.

    Další informace o tabulkách v Azure Storage tématu Vysvětlení datového modelu služby Table Service.

  6. Zadejte názvy sloupců, které se mají zapsat do tabulky.

    Důležité

    Musíte zadat název sloupce pro každý sloupec, který do tabulky vysílíte, včetně rowKey, PartitionKey a všech sloupců původu.

    Pokud počet názvů sloupců, které poskytnete, neodpovídá počtu výstupních sloupců, dojde k chybě.

    Pokud zadáte nové názvy sloupců, musí být zadané v pořadí indexů sloupců zdrojových sloupců.

  7. Režim zápisu do tabulek Azure: Určete, jak se má funkce Export dat chovat, když data v tabulce Azure již existují.

    • Vložení: Operace Insert Entity vloží novou entitu s jedinečným primárním klíčem, který se vytvoří z kombinace vlastností PartitionKey a RowKey .

    • Sloučení: Operace Merge Entity aktualizuje existující entitu tím, že aktualizuje vlastnosti entity. Tato operace nenahrazuje existující entitu.

    • Nahradit: Operace Update Entity nahradí obsah dané entity v tabulce.

    • InsertOrReplace: Operace InsertOrReplace Entity vloží entitu, pokud entita neexistuje. Pokud entita existuje, nahradí stávající entitu.

    • InsertOrMerge: Operace InsertOrMerge Entity vloží entitu, pokud entita neexistuje. Pokud entita existuje, sloučí poskytnuté vlastnosti entity s již existujícími vlastnostmi.

  8. Použít výsledky uložené v mezipaměti: Určete, jestli chcete data při každém spuštění experimentu aktualizovat.

    Pokud vyberete tuto možnost, modul Export dat uloží data do zadané tabulky při prvním spuštění experimentu a následně nebude provádět zápisy, pokud nejsou provedeny upstreamové změny.

    Pokud výběr této možnosti zrušíte, data se při každém spuštění experimentu zapisují do cíle bez ohledu na to, jestli jsou stejná.

  9. Spusťte experiment.

Technické poznámky

Tato část obsahuje podrobnosti o implementaci, tipy a odpovědi na nejčastější dotazy.

Časté dotazy

Proč se mi při zápisu do existující tabulky zobrazuje chyba

Zkontrolujte schéma tabulky a ujistěte se, že názvy sloupců a datové typy jsou stejné. Například ve službě Azure Table Storage se očekává, že sloupec ID bude řetězec.

Pokud se zobrazí chyba Chyba 0027: Velikost předáných objektů je nekonzistentní, ověřte, že tabulka v zadaném kontejneru existuje. Azure ML může v současné době zapisovat pouze do existujících tabulek.

Proč se mi zobrazí chyba, že se nenašel existující sloupec

Pokud jste experiment ještě nespouštěli, export dat někdy nezjme nadřazené sloupce. Pokud v experimentu změníte upstream, možná budete muset odebrat modul Export dat a pak ho přidat a překonfigurovat.

Jak se můžu vyhnout zbytečnému zápisu stejných dat?

Pokud se data v experimentu z nějakého důvodu změní, modul Export dat nová data vždy zapíše.

Pokud však experiment používáte s jinými změnami, které nemají vliv na výsledky, nastavte možnost Použít výsledky uložené v mezipaměti na hodnotu TRUE. Modul zkontroluje, jestli se experiment dříve spouštěl se stejnými možnostmi, a pokud se našel předchozí výsledek, data se nezapisují do tabulky Azure.

Můžu exportovat data do jiné geografické oblasti?

Ano. Pokud se ale účet úložiště nachází v jiné oblasti než výpočetní uzel použitý pro experiment strojového učení, může být přístup k datům pomalejší. Dál se vám účtují poplatky za příchozí a příchozí přenos dat v předplatném.

Příklady

Příklady použití těchto modulů strojového učení najdete v Azure AI Gallery.

Parametry modulu

Veřejný nebo SAS – Veřejné možnosti

Name Rozsah Typ Výchozí Description
Identifikátor URI SAS tabulky Libovolný Řetězec

Účet – Možnosti privátního účtu

Name Rozsah Typ Výchozí Description
Název účtu tabulky
Klíč účtu tabulky Libovolný SecureString

Možnosti úložiště

Name Rozsah Typ Výchozí Description
Název tabulky Řetězec žádné
Klíč oddílu Libovolný SecureString žádné Vyberte sloupec, který má být použit jako klíč při vytváření oddílů tabulky. Pokud není vybraný žádný sloupec, název sloupce jako klíč oddílu pro všechny položky
Klíč řádku tabulky Azure Libovolný ColumnPicker žádné Vyberte sloupec, který obsahuje jedinečný identifikátor pro řádky tabulky. Použije se výchozí klíč řádku založený na identifikátoru GUID.
Sloupce pro počátek tabulky Azure Libovolný ColumnPicker žádné Zadejte sloupce, které se mají zahrnout do tabulky, a to buď podle názvu, nebo podle indexu sloupce.
Cílové sloupce tabulky Azure Libovolný Řetězec žádné Zadejte názvy sloupců, které se použijí v cílové tabulce.
Režim zápisu tabulky Azure Seznam: vložení, sloučení, nahrazení, InsertOrReplace, InsertOrMerge Výčet žádné
Použití výsledků uložených v mezipaměti TRUE NEBO FALSE Logická hodnota FALSE Modul se spustí pouze v případě, že neexistuje platná mezipaměť. Jinak použijte data uložená v mezipaměti z předchozího spuštění.

Výjimky

Výjimka Description
Chyba 0027 K výjimce dojde, pokud musí být dva objekty stejné velikosti, ale nejsou.
Chyba 0003 K výjimce dojde v případě, že jeden nebo více vstupů má hodnotu null nebo je prázdné.
Chyba 0029 K výjimce dojde, pokud je předán neplatný identifikátor URI.
Chyba 0030 v případě, že není možné stáhnout soubor, dojde k výjimce.
Chyba 0,002 K výjimce dojde v případě, že jeden nebo více parametrů nelze analyzovat nebo převést ze zadaného typu na typ vyžadovaný cílovou metodou.
Chyba 0009 Pokud je název účtu služby Azure Storage nebo název kontejneru nesprávně zadán, dojde k výjimce.
Chyba 0048 Pokud není možné otevřít soubor, dojde k výjimce.
Chyba 0046 K výjimce dojde, pokud není možné vytvořit adresář v zadané cestě.
Chyba 0049 Pokud není možné analyzovat soubor, dojde k výjimce.

seznam chyb, které jsou specifické pro moduly studia (classic), najdete v článku kódy chyb Machine Learning.

seznam výjimek rozhraní API najdete v tématu Machine Learning REST API chybové kódy.

Viz také

Import dat
Exportovat data
Exportovat do Azure SQL Database
Exportovat do Azure Blob Storage
Dotaz export do podregistru