Sdílet prostřednictvím


Import z místní SQL Server Database

Důležité

Podpora studia Machine Learning (Classic) skončí 31. srpna 2024. Doporučujeme do tohoto data přejít na službu Azure Machine Learning.

Od 1. prosince 2021 nebude možné vytvářet nové prostředky studia Machine Learning (Classic). Do 31. srpna 2024 můžete pokračovat v používání stávajících prostředků studia Machine Learning (Classic).

Dokumentace ke studiu ML (Classic) se vyřazuje z provozu a v budoucnu se nemusí aktualizovat.

Tento článek popisuje, jak pomocí modulu Import dat v Machine Learning Studiu (klasickém) importovat data z místní SQL Server databáze do experimentu strojového učení.

Poznámka

Platí pro: Machine Learning Studio (classic)

Podobné moduly s přetahováním jsou k dispozici v Azure Machine Learning návrháři.

Machine Learning přístup k místní databázi SQL Server, pokud se data poskytují pomocí služby Microsoft Správa dat Gateway. Proto před použitím importu dat musíte splňovat tyto požadavky:

Po připojení brány můžete zadat další vlastnosti, jako jsou názvy serveru a databáze, metoda ověřování a databázový dotaz.

Postup instalace služby Microsoft Správa dat Gateway

Pokud chcete získat přístup k místní databázi SQL Server v Machine Learning, musíte si stáhnout a nainstalovat Microsoft Správa dat Gateway a pak bránu zaregistrovat v Machine Learning Studiu (klasickém).

Podrobnosti o instalaci a registraci brány najdete v těchto článcích:

Postup importu dat z místní SQL Server databáze

Po instalaci Správa dat Gateway na počítači, kde má přístup k vaší databázi SQL Server, SQL Server jste bránu zaregistrovali v nástroji Machine Learning Studio (Classic), musíte nakonfigurovat modul Import dat.

Než začnete, zakažte blokování automaticky otevíraných oken v prohlížeči pro web . studio.azureml.net

Pokud používáte prohlížeč Google Chrome, musíte si stáhnout a nainstalovat jeden z modulů plug-in, které jsou k dispozici ve webovém obchodě Google Chrome: Klikněte na Jednou rozšíření aplikace.

Použití Průvodce importem dat

Modul obsahuje nového průvodce, který vám pomůže vybrat možnost úložiště, vybrat si z existujících předplatných a účtů a rychle nakonfigurovat všechny možnosti.

  1. Přidejte do experimentu modul Import dat. Modul najdete v sadě Studio (classic) v kategorii Vstup a výstup dat.

  2. Klikněte na Spustit Průvodce importem dat a postupujte podle pokynů.

  3. Po dokončení konfigurace zkopírujte data do experimentu tak, že kliknete pravým tlačítkem na modul a vyberete Spustit vybrané.

Pokud potřebujete upravit existující datové připojení, průvodce načte všechny předchozí podrobnosti o konfiguraci, abyste znovu začali od začátku.

Ruční nastavení vlastností v modulu Import dat

  1. Přidejte do experimentu modul Import dat. Modul najdete v sadě Studio (classic) v kategorii Vstup a výstup dat.

  2. Jako Zdroj datvyberte Místní SQL Database.

  3. Nastavte následující možnosti specifické pro SQL Server databáze.

    • Brána dat: Vyberte bránu, kterou jste vytvořili. Brána musí být zaregistrovaná nebo se v seznamu nez zobrazení.

    • Název databázového serveru: Zadejte název SQL Server instance.

    • Název databáze: Zadejte název databáze.

    • Klikněte na Zadat hodnotyv části Uživatelské jméno a heslo a zadejte přihlašovací údaje k databázi. Můžete použít integrované Windows ověřování nebo SQL Server ověřování v závislosti na tom, jak je vaše místní SQL Server nakonfigurovaná.

      Důležité

      Správce přihlašovacích údajů musí být spuštěn ze stejné sítě jako SQL Server instance a klienta brány. Přihlašovací údaje nelze předat mezi doménami.

    • Do databázového dotazu zadejte nebo vložte SQL, který popisuje data, která chcete číst. Vždy ověřte příkaz SQL a ověřte výsledky dotazu předem pomocí nástroje, jako je Visual Studio Průzkumník serveru nebo SQL Server Data Tools.

    • Pokud se u datové sady neočekává, že se mezi spuštěními experimentu změní, vyberte možnost Použít výsledky uložené v mezipaměti . Pokud vyberete tuto možnost a neexistují žádné další změny parametrů modulu, experiment načte data při prvním spuštění modulu a následně použije verzi datové sady uložené v mezipaměti.

  4. Spusťte experiment.

Výsledky

Když importovaná data načítá do studia (classic), může se v závislosti na datových typech použitých ve zdrojové databázi provést implicitní převod typu. Další informace o datových typech najdete v tématu Datové typy modulů.

Po dokončení klikněte na výstupní datovou sadu a vyberte Vizualizovat , abyste viděli, jestli se data úspěšně naimportovaná.

Volitelně můžete datovou sadu a její metadata změnit pomocí nástrojů v sadě Studio (classic):

  • Možnost Upravit metadata slouží ke změně názvů sloupců, převodu sloupce na jiný datový typ nebo k označení sloupců, které jsou popisky nebo funkce.

  • Pomocí možnosti Vybrat sloupce v datové sadě vyberte podmnožinu sloupců.

  • Pomocí oddílů a ukázek oddělte datovou sadu podle kritérií nebo získejte n horních řádků.

Technické poznámky

Tato část obsahuje podrobnosti o implementaci, tipy a odpovědi na nejčastější dotazy.

Časté dotazy

Můžu filtrovat data tak, jak se čtou ze zdroje?

Samotný modul Import dat nepodporuje filtrování, protože se data čtou. Doporučujeme vytvořit zobrazení nebo definovat dotaz, který vygeneruje pouze řádky, které potřebujete.

Poznámka

Pokud zjistíte, že jste načetl více dat, než potřebujete, můžete datovou sadu v mezipaměti přepsat přečtením nové datové sady a uložením se stejným názvem jako starší větší data.

Proč se mi zobrazí chyba Typu desetinné číslo se nepodporuje

Při čtení dat z SQL databáze se může zobrazit chybová zpráva oznamující nepodporovaný datový typ.

Pokud data, která získáte z databáze SQL, obsahují datové typy, které nejsou podporované v Machine Learning, měli byste před načtením dat přetypovat nebo převést desetinná čísla na podporovaný datový typ. Důvodem je to, že import dat nemůže automaticky provést žádné převody, které by vedlo ke ztrátě přesnosti.

Proč se některé znaky nezobrazují správně

Machine Learning podporuje kódování UTF-8. Pokud řetězcové sloupce v databázi používají jiné kódování, nemusí být znaky importovány správně.

Jednou z možností pro zachování těchto znaků je export dat do souboru CSV v úložišti Azure a použití možnosti CSV s kódováním k určení parametrů pro vlastní oddělovače, znakovou stránku atd.

Na místním serveru Správa dat místní bránu. Můžu sdílet stejnou bránu mezi pracovními prostory?

No. Pro každý pracovní prostor musíte vytvořit samostatnou bránu.

Přestože můžete v jednom pracovním prostoru nastavit několik bran Správa dat (například jednu pro vývoj, testování, produkci atd.), bránu nelze sdílet mezi pracovními prostory.

Mám na místním serveru nastavenou bránu Správa dat Gateway, kterou používám pro Power BI nebo Azure Data Factory a chci stejnou bránu používat pro Machine Learning

Každá služba vyžaduje samostatnou Správa dat Gateway. Pokud už máte bránu, která se používá pro Power BI nebo Azure Data Factory, musíte nastavit samostatný server a nainstalovat bránu pro strojové učení.

Na jeden server nemůžete nainstalovat více bran.

Chci mít možnost exportovat data na místní server SQL serveru. Můžu použít bránu s modulem Export dat k zápisu dat na místní SQL serveru?

V současné Machine Learning podporuje pouze import dat. Vyhodnocujeme, jestli budete v budoucnu schopni zapisovat do místní databáze. Mezitím můžete pomocí nástroje Azure Data Factory kopírovat data z cloudu do místní databáze.

Mám zdroj dat, který není Microsoft SQL Server (Oracle, Teradata atd.). Můžu číst data v Machine Learning pomocí místní možnosti v modulu Import dat?

Modul importu Machine Learning v současné době podporuje pouze Microsoft SQL Server.

Jako alternativní řešení můžete pomocí služby Azure Data Factory zkopírovat místní data do cloudového úložiště, jako je Azure Blob Storage nebo Azure Database, a pak použít cloudový zdroj dat v modulu Import dat.

Parametry modulu

Name Rozsah Typ Výchozí Description
Zdroj dat Seznam Zdroj dat nebo jímka Azure Blob Storage zdroj dat může být HTTP, FTP, anonymní HTTPS nebo FTPS, soubor ve službě azure BLOB storage, tabulka azure, Azure SQL Database, místní databáze SQL Server, tabulka podregistru nebo koncový bod OData.
Brána dat Libovolný Datagateway žádné Název brány dat
Název databázového serveru Libovolný Řetězec žádné Místní SQL Server
Název databáze Libovolný Řetězec žádné místní instance databáze SQL Server
Uživatelské jméno a heslo Libovolný SecureString žádné Uživatelské jméno a heslo
Databázový dotaz Libovolný StreamReader žádné dotaz na místní SQL

Výstupy

Název Typ Description
Datová sada výsledků Tabulka dat Datová sada se staženými daty

Výjimky

Výjimka Description
Chyba 0027 K výjimce dojde, pokud musí být dva objekty stejné velikosti, ale nejsou.
Chyba 0003 K výjimce dojde v případě, že jeden nebo více vstupů má hodnotu null nebo je prázdné.
Chyba 0029 K výjimce dojde, pokud je předán neplatný identifikátor URI.
Chyba 0030 v případě, že není možné stáhnout soubor, dojde k výjimce.
Chyba 0,002 K výjimce dojde v případě, že jeden nebo více parametrů nelze analyzovat nebo převést ze zadaného typu na typ vyžadovaný cílovou metodou.
Chyba 0048 Pokud není možné otevřít soubor, dojde k výjimce.
Chyba 0015 Pokud selhalo připojení k databázi, dojde k výjimce.
Chyba 0046 K výjimce dojde, pokud není možné vytvořit adresář v zadané cestě.
Chyba 0049 Pokud není možné analyzovat soubor, dojde k výjimce.

seznam chyb, které jsou specifické pro moduly studia (classic), najdete v článku kódy chyb Machine Learning.

seznam výjimek rozhraní API najdete v tématu Machine Learning REST API chybové kódy.

Viz také

Import dat
Exportovat data
Import z webové adresy URL přes HTTP
Importovat z dotazu na podregistr
Import z Azure SQL Database
Import z tabulky Azure
Importovat z Azure Blob Storage
Import z poskytovatelů datových kanálů