Importálás helyszíni adatbázisból SQL Server adatbázisból
Fontos
A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.
2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.
- További információ a gépi tanulási projektek a ML Studióból a klasszikusból a Azure Machine Learning.
- További információ a Azure Machine Learning.
A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.
Ez a cikk azt ismerteti, hogyan importálhat adatokat egy helyszíni SQL Server-adatbázisból egy gépi tanulási kísérletbe a Machine Learning Studio Adatok importálása modulja segítségével.
Megjegyzés
A következőkre vonatkozik: Machine Learning Studio (klasszikus)
Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.
Machine Learning egy helyszíni adatbázishoz SQL Server, ha az adatokat Egy Microsoft adatkezelés átjáróval biztosítanak. Ezért az Adatok importálása használata előtt meg kell felelnie az alábbi követelményeknek:
- Az adatforráshoz hozzáférő Microsoft adatkezelés-átjáró telepítése
- Az átjáró regisztrálása a Machine Learning munkaterületen
- Az Adatok importálása beállítás konfigurálása az átjáró azonosításához
Az átjárókapcsolat létrejötte után további tulajdonságokat is megadhat, például a kiszolgáló és az adatbázis nevét, a hitelesítési módszert és egy adatbázis-lekérdezést.
Microsoft adatkezelés telepítése
Egy helyszíni SQL Server-adatbázis eléréséhez a Machine Learning-ban le kell töltenie és telepítenie kell a Microsoft adatkezelés Gatewayt, majd regisztrálnia kell az átjárót a Machine Learning Studióban (klasszikus).
Az átjáró telepítésével és regisztrációval kapcsolatos részletekért tekintse meg az alábbi cikkeket:
Adatok importálása helyszíni adatbázisból SQL Server adatbázisból
Miután telepített egy adatkezelés Gatewayt egy olyan számítógépre, amely hozzáfér az SQL Server-adatbázishoz, és regisztrálta az átjárót a Machine Learning Studióban (klasszikus), konfigurálnia kell az Adatok importálása modult.
Mielőtt elkezdené, tiltsa le a böngésző előugróablak-blokkolóját a webhelyen. studio.azureml.net
Ha a Google Chrome böngészőt használja, le kell töltenie és telepítenie kell a Google Chrome webáruházában elérhető beépülő modulok valamelyikét: Kattintson az Egyszer alkalmazásbővítmény lehetőségre.
Az Adatimport varázsló használata
A modul egy új varázslóval segít kiválasztani a tárolási lehetőséget, választani a meglévő előfizetések és fiókok közül, és gyorsan konfigurálni az összes beállítást.
Adja hozzá az Adatok importálása modult a kísérlethez. A modult a (klasszikus) Studióban, az Adatbemenet és -kimenet kategóriában találja .
Kattintson az Adatok importálása varázsló indítása elemre , és kövesse az utasításokat.
Ha a konfigurálás befejeződött, az adatok a kísérletbe való másoláshoz kattintson a jobb gombbal a modulra, és válassza a Kijelölt futtatása lehetőséget.
Ha egy meglévő adatkapcsolatot kell szerkesztenie, a varázsló betölti az összes korábbi konfigurációs adatot, így nem kell elölről kezdenie.
Tulajdonságok manuális beállítása az Adatok importálása modulban
Adja hozzá az Adatok importálása modult a kísérlethez. A modult a (klasszikus) Studióban, az Adatbemenet és -kimenet kategóriában találja .
Az Adatforrás mezőben válassza a Helyszíni SQL Database.
Adja meg a következő beállításokat a SQL Server adatbázishoz.
Adatátjáró: Válassza ki a létrehozott átjárót. Az átjárónak regisztrálva kell lennie, vagy nem szerepel a listában.
Adatbázis-kiszolgáló neve: Írja be a SQL Server nevét.
Adatbázis neve: Írja be az adatbázis nevét.
Kattintson az Enter values (Értékek megadása ) gombra a User name and password (Felhasználónév és jelszó) alatt , és adja meg az adatbázis hitelesítő adatait. Az integrált Windows hitelesítést vagy SQL Server hitelesítést attól függően használhatja, hogy a helyszíni SQL Server konfigurálva van.
Fontos
A hitelesítőadat-kezelőt ugyanabban a hálózatban kell el indítani, mint a SQL Server-példányt és az átjáró ügyfelét. A hitelesítő adatok nem adhatóak át tartományok között.
Írjon vagy illesszen be a Database lekérdezésbe egy SQL utasítással, amely leírja az olvasni kívánt adatokat. Mindig ellenőrizze a SQL utasítást, és ellenőrizze előre a lekérdezés eredményeit egy olyan eszközzel, mint Visual Studio Server Explorer vagy SQL Server Data Tools.
Ha az adatkészlet várhatóan nem változik a kísérlet futtatásai között, válassza a Gyorsítótárazott eredmények használata lehetőséget. Ha ez a beállítás be van jelölve, és nincsenek más módosítások a modul paramétereiben, a kísérlet betölti az adatokat a modul első futtatásakor, majd ezt követően az adatkészlet gyorsítótárazott verzióját használja.
Futtassa a kísérletet.
Results (Eredmények)
Ahogy az Adatok importálása betölti az adatokat a Studióba (klasszikus), némi implicit típuskonverzió is elvégezhető a forrásadatbázisban használt adattípustól függően. További információ az adattípusokkal kapcsolatban: Modul adattípusok.
Ha elkészült, kattintson a kimeneti adatkészletre, és válassza a Képi megjelenítés lehetőséget, hogy lássa, sikeresen importálta-e az adatokat.
Igény szerint módosíthatja az adatkészletet és annak metaadatait a Studio (klasszikus) eszközeivel:
A Metaadatok szerkesztése funkcióval módosíthatja az oszlopneveket, más adattípusra konvertálhat egy oszlopot, vagy jelezheti, hogy mely oszlopok címkék vagy funkciók.
Használja az Adatkészlet oszlopainak kijelölése lehetőséget az oszlopok egy részkészletének kiválasztásához.
A Partition (Partíció) és a Sample (Minta) használatával feltételek alapján válassza el az adatkészletet, vagy szerezze be az első n sort .
Technikai megjegyzések
Ez a szakasz az implementáció részleteit, a tippeket és a gyakori kérdésekre adott válaszokat tartalmazza.
Gyakori kérdések
Szűrhetők az adatok a forrásból való beolvasott adatokra?
Maga az Adatok importálása modul nem támogatja a szűrést az adatok olvasása során. Javasoljuk, hogy hozzon létre egy nézetet, vagy határozzon meg egy lekérdezést, amely csak a szükséges sorokat hozza létre.
Megjegyzés
Ha azt találják, hogy a szükségesnél több adatot töltöttek be, felülírhatja a gyorsítótárazott adatkészletet egy új adatkészlet beolvasásával, és a régebbi, nagyobb adatokkal azonos néven mentheti őket.
Miért jelenik meg a "Type Decimal is not supported" (A decimális típus nem támogatott) hibaüzenet
Ha egy adatbázisból SQL adatokat, előfordulhat, hogy egy nem támogatott adattípusról szóló hibaüzenet jelenik meg.
Ha a SQL-adatbázisból lekért adatok olyan adattípusokat tartalmaznak, amelyek az Machine Learning-ban nem támogatottak, az adatok beolvasása előtt konvertálja vagy konvertálja a tizedes törteket támogatott adattípusra. Ennek az az oka, hogy az Adatok importálása nem képes automatikusan végrehajtani a pontosság elvesztését eredményező átalakításokat.
Miért nem jelennek meg helyesen bizonyos karakterek?
Machine Learning UTF-8 kódolást támogatja. Ha az adatbázis sztringoszlopai más kódolást használnak, előfordulhat, hogy a karakterek importálása helytelen.
A karakterek megőrzésének egyik lehetősége, hogy az adatokat egy CSV-fájlba exportálja az Azure Storage-ban, és a CSV lehetőséget kódolással használja az egyéni elválasztó karakterek, a kódlap és így tovább paraméterek megadásához.
Beállítottam egy adatkezelés átjárót a helyszíni kiszolgálón. Megoszthatom ugyanazt az átjárót a munkaterületek között?
Nem. Minden munkaterülethez külön átjárót kell létrehoznia.
Bár több átjárót adatkezelés egy munkaterületen (például fejlesztési, tesztelési, éles stb.), az átjárók nem megoszthatóak a munkaterületek között.
Beállítottam egy adatkezelés-átjárót a helyszíni kiszolgálón, amit Power BI vagy Azure Data Factory használok, és ugyanazt az átjárót szeretném használni a Machine Learning
Minden szolgáltatáshoz külön átjáróra adatkezelés szükség. Ha már rendelkezik egy átjáróval, amely a Power BI vagy Azure Data Factory használatos, be kell állítania egy külön kiszolgálót, és telepítenie kell egy átjárót a gépi tanuláshoz.
Nem telepíthet több átjárót egyetlen kiszolgálóra.
Adatokat szeretnék exportálni a helyszíni SQL kiszolgálóra. Használhatom az átjárót az Adatok exportálása modullal, hogy adatokat írjak a helyszíni SQL kiszolgálóra?
Jelenleg a Machine Learning csak az adatok importálását támogatja. Kiértékeljük, hogy tud-e írni a helyszíni adatbázisba a jövőben. Addig is használhatja a Azure Data Factory, hogy adatokat másol a felhőből a helyszíni adatbázisba.
Olyan adatforrásom van, amely nem Microsoft SQL Server (Oracle, Teradata stb.). Beolvashatóak a Machine Learning az Adatok importálása modul helyszíni beállításával?
Jelenleg a Machine Learning Adatok importálása modul csak a Microsoft SQL Server.
Áthidaló megoldásként az Azure Data Factory használatával átmásolhatja a helyszíni adatokat a felhőtárhelybe, például az Azure Blob Storage-ba vagy az Azure Database-be, majd használhatja a felhőbeli adatforrást az Adatok importálása modulban.
Modulparaméterek
Name | Tartomány | Típus | Alapértelmezett | Description |
---|---|---|---|---|
Adatforrás | Lista | Adatforrás vagy fogadó | Azure Blob Storage | Az adatforrás lehet HTTP, FTP, névtelen HTTPS vagy FTPS, azure blobtárolóban lévő fájl, Azure-tábla, Azure SQL Database, helyszíni SQL Server-adatbázis, Hive-tábla vagy OData-végpont. |
Adatátjáró | bármelyik | DataGatewayName (Átjárónév) | Nincs | Adatátjáró neve |
Adatbázis-kiszolgáló neve | bármelyik | Sztring | Nincs | Helyszíni SQL Server |
Adatbázis neve | bármelyik | Sztring | Nincs | Helyszíni adatbázis SQL Server példány |
Felhasználónév és jelszó | bármelyik | SecureString (Biztonságos karakterlánc) | Nincs | Felhasználónév és jelszó |
Adatbázis-lekérdezés | bármelyik | StreamReader | Nincs | Helyszíni lekérdezés SQL lekérdezés |
Kimenetek
Név | Típus | Description |
---|---|---|
Eredményadatkészlet | Adattábla | Adatkészlet letöltött adatokkal |
Kivételek
Kivétel | Description |
---|---|
0027-es hiba | Kivétel akkor fordul elő, ha két objektumnak azonos méretűnek kell lennie, de nem azok. |
0003-as hiba | Kivétel történik, ha egy vagy több bemenet null vagy üres. |
0029-es hiba | Kivétel történik, ha érvénytelen URI-t ad át. |
0030-as hiba | kivétel akkor fordul elő, ha nem lehet letölteni egy fájlt. |
0002-es hiba | Kivétel történik, ha egy vagy több paramétert nem lehetett a megadott típusból a cél metódus által megkövetelt típusra átalakítani. |
0048-as hiba | Kivétel akkor fordul elő, ha nem lehet megnyitni egy fájlt. |
0015-ös hiba | Kivétel történik, ha az adatbázis-kapcsolat meghiúsult. |
0046-os hiba | Kivétel akkor fordul elő, ha nem lehet könyvtárat létrehozni a megadott elérési úton. |
0049-es hiba | Kivétel akkor fordul elő, ha nem lehet egy fájlt elemezni. |
A Studio (klasszikus) moduljaival kapcsolatos hibák listájáért tekintse meg a Machine Learning hibakódokat.
Az API-kivételek listáját a hibakódok Machine Learning REST API.
Lásd még
Adatok importálása
Adatok exportálása
Importálás webes URL-ről HTTP-kapcsolaton keresztül
Importálás Hive-lekérdezésből
Importálás Azure SQL Database-ből
Importálás azure-táblából
Importálás Azure Blob Storage
Importálás adatcsatorna-szolgáltatóktól