Sdílet prostřednictvím


Import z Azure SQL Database

Důležité

Podpora studia Machine Learning (Classic) skončí 31. srpna 2024. Doporučujeme do tohoto data přejít na službu Azure Machine Learning.

Od 1. prosince 2021 nebude možné vytvářet nové prostředky studia Machine Learning (Classic). Do 31. srpna 2024 můžete pokračovat v používání stávajících prostředků studia Machine Learning (Classic).

Dokumentace ke studiu ML (Classic) se vyřazuje z provozu a v budoucnu se nemusí aktualizovat.

Tento článek popisuje, jak pomocí modulu Import dat v Machine Learning Studiu (classic) získat data z Azure SQL Database nebo Azure SQL Data Warehouse.

Poznámka

Platí pro: Machine Learning Studio (classic)

Podobné moduly s přetahováním jsou k dispozici v Azure Machine Learning návrháři.

Pokud chcete importovat data z databáze, musíte zadat název serveru i název databáze a příkaz SQL, který definuje tabulku, zobrazení nebo dotaz.

Obecně platí, že ukládání dat v databázích Azure je dražší než používání tabulek nebo objektů blob v Azure. V závislosti na typu předplatného může také dojít k omezení množství dat, která můžete ukládat do databáze. Pro databázi SQL Azure Však neexistují žádné poplatky za transakce, takže tato možnost je ideální pro rychlý přístup k menším objemům často používaných informací, jako jsou vyhledávací tabulky dat nebo slovníky dat.

Ukládání dat do databáze Azure je také upřednostňované, pokud potřebujete mít možnost filtrovat data před jejich načtením nebo pokud chcete uložit předpovědi nebo metriky zpět do databáze pro účely vytváření sestav.

Jak importovat data z Azure SQL Database nebo SQL Data Warehouse

Použití Průvodce importem dat

Modul obsahuje nového průvodce, který vám pomůže vybrat možnost úložiště, vybrat si z existujících předplatných a účtů a rychle nakonfigurovat všechny možnosti.

  1. Přidejte do experimentu modul Import dat. Modul najdete v sadě Studio (classic) v kategorii Vstup a výstup dat.

  2. Klikněte na Spustit Průvodce importem dat a postupujte podle pokynů.

  3. Po dokončení konfigurace zkopírujte data do experimentu tak, že kliknete pravým tlačítkem na modul a vyberete Spustit vybrané.

Pokud potřebujete upravit existující datové připojení, průvodce načte všechny předchozí podrobnosti o konfiguraci, abyste znovu nezačínáme od začátku.

Ruční nastavení vlastností v modulu Import dat

Následující kroky popisují ruční konfiguraci zdroje importu.

  1. Přidejte do experimentu modul Import dat. Tento modul najdete v sadě Studio (classic) v kategorii Vstup a výstup dat.

  2. Jako Zdroj dat vyberte Azure SQL Database.

  3. Nastavte následující možnosti specifické pro Azure SQL Database nebo Azure SQL Data Warehouse.

    Název databázového serveru: Zadejte název serveru vygenerovaný v Azure. Obvykle má tvar <generated_identifier>.database.windows.net.

    Název databáze: Zadejte název existující databáze na serveru, který jste právě zadali.

    Název uživatelského účtu serveru: Zadejte uživatelské jméno účtu, který má přístupová oprávnění k databázi.

    Heslo uživatelského účtu serveru: Zadejte heslo pro zadaný uživatelský účet.

    Databázový dotaz: Zadejte nebo vložte SQL, který popisuje data, která chcete číst. Vždy ověřte příkaz SQL a ověřte výsledky dotazu předem pomocí nástroje, jako je Visual Studio Průzkumník serveru nebo SQL Server Data Tools.

    Poznámka

    Modul Import dat podporuje jako přihlašovací údaje jenom název databáze, název uživatelského účtu a heslo.

  4. Pokud se u datové sady, Machine Learning v mezipaměti neočekává změna mezi spuštěními experimentu, vyberte možnost Použít výsledky uložené v mezipaměti.

    Pokud vyberete tuto možnost a neexistují žádné další změny parametrů modulu, experiment načte data při prvním spuštění modulu a následně použije verzi datové sady uložené v mezipaměti.

    Pokud chcete datovou sadu znovu načíst při každé iteraci experimentu, zrušte výběr této možnosti. Datová sada se znovu načte ze zdroje při každé změně parametrů v importovaných datech.

  5. Spusťte experiment.

    Když importovaná data načítá data do nástroje Studio (classic), může se v závislosti na datových typech použitých ve zdrojové databázi provést také implicitní převod typu.

Výsledky

Po dokončení importu klikněte na výstupní datovou sadu a vyberte Vizualizovat , abyste viděli, jestli se data úspěšně naimportovaná.

Volitelně můžete datovou sadu a její metadata změnit pomocí nástrojů v sadě Studio (classic):

  • Možnost Upravit metadata slouží ke změně názvů sloupců, převodu sloupce na jiný datový typ nebo k označení sloupců, které jsou popisky nebo funkce.

  • Pomocí možnosti Vybrat sloupce v datové sadě vyberte podmnožinu sloupců.

  • Pomocí oddílů a ukázek oddělte datovou sadu podle kritérií nebo získejte n horních řádků.

Příklady

Příklad použití dat z databází Azure ve strojové učení najdete v těchto článcích a experimentech:

  • Retail Forecasting Krok 1 z 6 – Předběžné zpracování dat: Šablona prognózování maloobchodního prodeje ilustruje typický scénář, který k analýze používá data uložená v Azure SQLDB.

    Ukazuje také některé užitečné techniky, jako je použití Azure SQLDB k předávání datových sad mezi experimenty v různých účtech, ukládání a kombinování prognóz a vytvoření Azure SQLDB pro strojové učení.

  • Použití Machine Learning s SQL Data Warehouse: Tento článek ukazuje, jak vytvořit regresní model pro předpověď cen pomocí Azure SQL Data Warehouse.

  • Jak používat Azure ML s Azure SQL Data Warehouse: Tento článek sestaví model clusteringu v AdventureWorks pomocí importu dat a exportu dat pomocí Azure SQL Data Warehouse.

Technické poznámky

Tato část obsahuje podrobnosti o implementaci, tipy a odpovědi na nejčastější dotazy.

Časté dotazy

Můžu filtrovat data tak, jak se čtou ze zdroje?

Modul Import dat nepodporuje filtrování, protože se data čtou. Doporučujeme vytvořit zobrazení nebo definovat dotaz, který vygeneruje pouze řádky, které potřebujete.

Poznámka

Pokud zjistíte, že jste načetl více dat, než potřebujete, můžete datovou sadu v mezipaměti přepsat přečtením nové datové sady a uložením se stejným názvem jako starší větší data.

Proč se mi zobrazí chyba Typu desetinné číslo se nepodporuje?

Při čtení dat z SQL databáze se může zobrazit chybová zpráva oznamující nepodporovaný datový typ.

Pokud data, která získáte z databáze SQL, obsahují datové typy, které nejsou podporované v Machine Learning, měli byste před načtením dat přetypovat nebo převést desetinná čísla na podporovaná data. Import dat nemůže automaticky provést žádné převody, které by vedlo ke ztrátě přesnosti.

Další informace o podporovaných datových typech najdete v tématu Datové typy modulů.

Co se stane, když se databáze nachází v jiné geografické oblasti Má import dat stále přístup k databázi? Kde jsou data uložená?

Pokud je databáze v jiné oblasti než účet strojového učení, může být přístup k datům pomalejší. Dál se vám účtují poplatky za příchozí a příchozí přenos dat v předplatném, pokud se výpočetní uzel nachází v jiné oblasti než účet úložiště.

Data, která jste pro experiment načetli do pracovního prostoru, se uloží do účtu úložiště přidruženého k experimentu.

Proč se některé znaky nezobrazují správně?

Machine Learning podporuje kódování UTF-8. Pokud řetězcové sloupce v databázi používají jiné kódování, nemusí být znaky importovány správně.

Jednou z možností je exportovat data do souboru CSV v úložišti Azure a pomocí možnosti CSV s kódováním zadat parametry pro vlastní oddělovače, znakovou stránku atd.

Parametry modulu

Name Rozsah Typ Výchozí Description
Zdroj dat Seznam Zdroj nebo jímka dat Azure Blob Storage Zdrojem dat může být HTTP, FTP, anonymní HTTPS nebo FTPS, soubor v úložišti objektů blob v Azure, tabulka Azure, Azure SQL Database, místní databáze SQL Server, tabulka Hive nebo koncový bod OData.
Identifikátor URI serveru HDFS Libovolný Řetězec žádné Koncový bod REST HDFS
Název databázového serveru Libovolný Řetězec žádné Azure storage account name
Název databáze Libovolný SecureString žádné Klíč úložiště Azure
Název uživatelského účtu serveru Libovolný Řetězec žádné Název kontejneru Azure
Název uživatelského účtu serveru Seznam (podmnožina) Obsah adresy URL OData Typ formátu dat
Databázový dotaz Libovolný Řetězec žádné Typ formátu dat
Použití výsledků uložených v mezipaměti TRUE NEBO FALSE Logická hodnota FALSE description

Výstupy

Název Typ Description
Datová sada výsledků Tabulka dat Datová sada se staženými daty

Výjimky

Výjimka Description
Chyba 0027 K výjimce dojde, pokud musí být dva objekty stejné velikosti, ale nejsou.
Chyba 0003 K výjimce dojde v případě, že jeden nebo více vstupů má hodnotu null nebo je prázdné.
Chyba 0029 K výjimce dojde, pokud je předán neplatný identifikátor URI.
Chyba 0030 v případě, že není možné stáhnout soubor, dojde k výjimce.
Chyba 0,002 K výjimce dojde v případě, že jeden nebo více parametrů nelze analyzovat nebo převést ze zadaného typu na typ vyžadovaný cílovou metodou.
Chyba 0009 Pokud je název účtu služby Azure Storage nebo název kontejneru nesprávně zadán, dojde k výjimce.
Chyba 0048 Pokud není možné otevřít soubor, dojde k výjimce.
Chyba 0015 Pokud selhalo připojení k databázi, dojde k výjimce.
Chyba 0046 K výjimce dojde, pokud není možné vytvořit adresář v zadané cestě.
Chyba 0049 Pokud není možné analyzovat soubor, dojde k výjimce.

seznam chyb, které jsou specifické pro moduly studia (classic), najdete v článku kódy chyb Machine Learning.

seznam výjimek rozhraní API najdete v tématu Machine Learning REST API chybové kódy.

Viz také

Import dat
Exportovat data
Import z webové adresy URL přes HTTP
Importovat z dotazu na podregistr
Import z tabulky Azure
Importovat z Azure Blob Storage
Import z poskytovatelů datových kanálů
Import z místní databáze SQL Server