Sdílet prostřednictvím


Export dat

Důležité

Podpora studia Machine Learning (Classic) skončí 31. srpna 2024. Doporučujeme do tohoto data přejít na službu Azure Machine Learning.

Od 1. prosince 2021 nebude možné vytvářet nové prostředky studia Machine Learning (Classic). Do 31. srpna 2024 můžete pokračovat v používání stávajících prostředků studia Machine Learning (Classic).

Dokumentace ke studiu ML (Classic) se vyřazuje z provozu a v budoucnu se nemusí aktualizovat.

Zapisuje datovou sadu do různých forem cloudového úložiště v Azure, jako jsou tabulky, objekty blob a Azure SQL databáze.

Kategorie: Vstup a výstup dat

Poznámka

Platí pro: Machine Learning Studio (classic)

Podobné moduly s přetahováním jsou k dispozici v Azure Machine Learning návrháři.

Přehled modulu

Tento článek popisuje, jak pomocí modulu Export dat v Machine Learning Studiu (klasickém) ukládat výsledky, zprostředkující data a pracovní data z experimentů do cílů cloudového úložiště mimo Machine Learning Studio (klasické).

Tento modul podporuje export nebo ukládání dat do následujících cloudových datových služeb:

  • Export do dotazu Hive: Zapisujte data do tabulky Hive v clusteru HDInsight Hadoop.

  • Exportovat do Azure SQL Database: Uložte data do Azure SQL Database nebo do Azure SQL Data Warehouse.

  • Export do tabulky Azure: Uložte data do služby Table Storage v Azure. Úložiště tabulek je vhodné pro ukládání velkých objemů dat. Poskytuje tabulkový formát, který je škálovatelný, levný a vysoce dostupný.

  • Exportovat do Azure Blob Storage: Ukládá data do Blob service v Azure. Tato možnost je užitečná pro obrázky, nestrukturovaný text nebo binární data. Data v Blob service lze sdílet veřejně nebo ukládat v zabezpečených aplikačních datových obchodech.

Poznámka

Pokud je povolená možnost Požadováno zabezpečený přenos, modul exportu dat nepodporuje připojení k účtu služby Azure Blob Storage.

  • Stažení dat: Pokud chcete stáhnout data, abyste je mohli otevřít v aplikaci Excel nebo jiné aplikaci, použijte modul, jako je převod na CSV nebo převod na TSV, abyste připravili data v konkrétním formátu, a pak si data stáhněte.

  • Výsledky libovolného modulu, který vystupuje jako výstup datové sady, si můžete stáhnout tak, že kliknete pravým tlačítkem na výstup a vyberete Stáhnout datovou sadu. Ve výchozím nastavení se data exportuje ve formátu CSV.

  • Stáhněte si definici modulu nebo graf experimentu: Nová knihovna PowerShellu umožňuje stáhnout úplná metadata experimentu nebo podrobnosti pro konkrétní modul. PowerShell pro Machine Learning je experimentální verze, ale obsahuje mnoho užitečných rutin:

    • Get-AmlExperiment vypíše všechny experimenty v pracovním prostoru.
    • Export-AmlExperimentGraph exportuje definici úplného experimentu do souboru JSON.
    • Download-AmlExperimentNodeOutput umožňuje extrahovat informace uvedené na výstupních portech libovolného modulu.

Konfigurace exportu dat

  1. Do experimentu v nástroji Studio (Classic) přidejte modul Export dat. Tento modul najdete v kategorii Vstup a Výstup.

  2. Připojení modul, který obsahuje data, která chcete exportovat, exportujte data.

  3. Dvojím kliknutím na Exportovat data otevřete podokno Vlastnosti.

  4. V části Cíl dat vyberte typ cloudového úložiště, kam data uložíte. Pokud tuto možnost změníte, resetují se všechny ostatní vlastnosti. Proto si nejprve zvolte tuto možnost.

  5. Zadejte název účtu a metodu ověřování vyžadované pro přístup k zadanému účtu úložiště.

    V závislosti na typu úložiště a na tom, jestli je účet zabezpečený, možná budete muset zadat název účtu, typ souboru, přístupový klíč nebo název kontejneru. U zdrojů, které nevyžadují ověřování, obecně stačí znát adresu URL.

    Příklady jednotlivých typů najdete v následujících tématech:

  6. Možnost Použít výsledky uložené v mezipaměti umožňuje experiment opakovat, aniž byste pokaždé přepisovali stejné výsledky.

    Pokud výběr této možnosti zrušíte, výsledky se zapisují do úložiště při každém spuštění experimentu bez ohledu na to, jestli se změnila výstupní data.

    Pokud vyberete tuto možnost, export dat bude používat data uložená v mezipaměti, pokud jsou k dispozici. Nové výsledky se generují pouze v případě, že dojde k upstreamové změně, která by ovlivnila výsledky.

  7. Spusťte experiment.

Příklady

Příklady použití modulu Export dat najdete v Azure AI Gallery:

  • Klasifikace textu: Tato ukázka používá export dat k ukládání mezilehlých výsledků a pak je pomocí importu dat načtou z úložiště pro pozdější kroky experimentu.

  • Retail Forecasting Krok 1 z 6 – předběžné zpracování dat: Šablona prognóz maloobchodního prodeje znázorňuje úlohu strojového učení založenou na datech uložených v Azure SQL Database. Demonstruje několik užitečných technik, jako je vytvoření databáze Azure SQL pro strojové učení, použití databáze Azure SQL k předání datových sad mezi experimenty v různých účtech, ukládání a kombinování předpovídek.

  • Sestavení a nasazení modelu strojového učení pomocí SQL Server na virtuálním počítači Azure: Tento článek ukazuje, jak můžete použít databázi SQL Server hostovanou na virtuálním počítači Azure jako zdroj pro ukládání trénovací data a předpovědi vygenerované experimentem. Ukazuje také, jak lze relační databázi použít k vytvoření funkcí a výběru funkcí.

  • Jak používat Azure ML s Azure SQL Data Warehouse: Tento článek ukazuje, jak vytvořit model strojového učení pomocí dat v Azure SQL Data Warehouse.

Technické poznámky

Tato část obsahuje podrobnosti o implementaci, tipy a odpovědi na nejčastější dotazy.

Podrobnosti o implementaci

  • Tento modul se dříve nazýl Writer. Pokud máte existující experiment, který používá modul Writer , modul se při aktualizaci experimentu přejmenuje na Export dat.

  • Ne všechny moduly vytvářejí výstup, který je kompatibilní s cíli exportu dat. Export dat například nemůže uložit datovou sadu, která byla převedena do formátu SVMLight. Export dat podporuje tyto formáty:

    • Datová sada (azure ML interní formát)
    • .NET DataTable
    • CSV se záhlavími nebo bez
    • TSV se záhlavími nebo bez

Známé problémy

  • Když jako umístění pro výstup dat vyberete Azure Table, občas může při zápisu do zadané tabulky do textu do příkazového řádku ()). Když k tomu dojde, můžou se data zapsat do objektu blob.

    Pokud k této chybě dojde a později se vám nedaří číst z očekávané tabulky, zkuste pomocí nástroje úložiště Azure zkontrolovat objekty blob v zadaném kontejneru ve vašem účtu úložiště.

  • V současné době nelze uložit objekt blob do zadané tabulky Hive. Pokud potřebujete zapisovat mezilehlé výsledky, nepoužívejte tabulku Hive ve službě HDInsight a místo toho použijte úložiště objektů blob nebo úložiště tabulek.

  • Pokud v současné době jako umístění pro uložení výstupních dat vyberete HDFS, vrátí se tato chybová zpráva: Microsoft.Analytics.Exceptions.ErrorMapping+ModuleException.

Očekávané vstupy

Název Typ Description
Datová sada Tabulka dat Datová sada, která se má zapsat.

Parametry modulu

Tato tabulka uvádí parametry, které platí pro všechny možnosti Export dat. Další parametry jsou dynamické a mění se v závislosti na vybraném cíli dat.

Name Rozsah Typ Výchozí Description
Zadejte cíl dat. Seznam ZdrojZdrojNeboSink Blob service v Azure Storage Určete, jestli je cílem dat soubor v Blob service, soubor ve službě Table Service, SQL databáze v Azure nebo tabulka Hive.
Použití výsledků uložených v mezipaměti TRUE/FALSE Logická hodnota FALSE Tuto možnost vyberte, pokud se chcete vyhnout zbytečnému přepisování výsledků. Pokud se v experimentu něco změní, export dat se vždy provede a zapíše nové výsledky. Pokud se ale nic nezměnilo a vybrali jste tuto možnost, export dat se nebude provádět, aby se zabránilo přepsání stejných výsledků.

Výjimky

Výjimka Description
Chyba 0057 Při pokusu o vytvoření souboru nebo objektu blob, který už existuje, dojde k výjimce.
Chyba 0001 K výjimce dojde, pokud se jeden nebo více zadaných sloupců datové sady nenašel.
Chyba 0027 K výjimce dochází v případě, že dva objekty musí mít stejnou velikost, ale nejsou.
Chyba 0079 K výjimce dojde, pokud je název kontejneru Azure Storage zadaný nesprávně.
Chyba 0052 K výjimce dojde, pokud je přístupový klíč k úložišti pro účet Azure nesprávně zadaný.
Chyba 0064 K výjimce dojde, pokud je nesprávně zadaný název účtu nebo přístupový klíč úložiště pro účet Azure.
Chyba 0071 Pokud jsou zadané přihlašovací údaje nesprávné, dojde k výjimce.
Chyba 0018 Pokud vstupní datová sada není platná, dojde k výjimce.
Chyba 0029 K výjimce dojde, když je předán neplatný identifikátor URI.
Chyba 0003 K výjimce dojde, pokud má jeden nebo více vstupů hodnotu null nebo je prázdný.

Seznam chyb specifických pro moduly sady Studio (classic) najdete v Machine Learning kódy chyb.

Seznam výjimek rozhraní API najdete v tématu Machine Learning REST API kódy chyb.

Viz také

Import dat
Vstup a výstup dat
Transformace dat
Porovnání služeb Azure Table Storage a Azure SQL Database
Seznam modulů A až Z