Adatok exportálása
Fontos
A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.
2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.
- További információ a gépi tanulási projektek a ML Studióból a klasszikusból a Azure Machine Learning.
- További információ a Azure Machine Learning.
A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.
Adatkészletet ír az Azure-beli felhőalapú tárolók különböző formáiba, például táblákba, blobokba és Azure SQL adatbázisokba
Kategória: Adatbemenet és -kimenet
Megjegyzés
A következőkre vonatkozik: Machine Learning Studio (klasszikus)
Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.
A modul áttekintése
Ez a cikk azt ismerteti, hogyan használhatja az Adatok exportálása modult a Machine Learning Studio (klasszikus) alkalmazásában az eredmények, a köztes adatok és a munkaadatok a kísérletekből a Machine Learning Studióban (klasszikus) kívüli felhőbeli tárolóhelyre való mentéséhez.
Ez a modul támogatja az adatok exportálását vagy mentését a következő felhőalapú adatszolgáltatásokba:
Exportálás Hive-lekérdezésbe: Adatokat írhat egy HDInsight Hadoop-fürtben található Hive-táblába.
Exportálás Azure SQL Database: Adatokat menthet a Azure SQL Database vagy a Azure SQL Data Warehouse.
Exportálás Azure Table-be: Adatokat menthet a Table Storage szolgáltatásba az Azure-ban. A Table Storage nagy mennyiségű adat tárolására jó. Táblázatos formátumot biztosít, amely skálázható, olcsó és magas rendelkezésre áll.
Exportálás Azure Blob Storage: Adatokat ment a Blob service Azure-ban. Ez a lehetőség képekhez, strukturálatlan szöveghez vagy bináris adatokhoz hasznos. A biztonsági Blob service megoszthatóak nyilvánosan, vagy biztonságos alkalmazásadattárakban menthetők.
Megjegyzés
Az Adatexportolás modul nem támogatja az Azure Blob Storage-fiókhoz való csatlakozást, ha a "Biztonságos átvitelre van szükség" beállítás engedélyezve van.
Kapcsolódó feladatok
Adatok letöltése: Ahhoz, hogy az adatokat az Excel-ban vagy más alkalmazásban is meg tudja nyitni, töltse le az adatokat egy olyan modullal, mint a Convert to CSV (Konvertálás CSV-fájlká) vagy a Convert to TSV (Konvertálás TSV-ké) az adatok egy adott formátumban való előkészítéséhez, majd az adatok letöltéséhez.
Az adatkészletet kiküldő modulok eredményeit letöltheti, ha a jobb gombbal a kimenetre kattint, majd az Adatkészlet letöltése gombra kattint. Alapértelmezés szerint a rendszer CSV formátumban exportálja az adatokat.
Moduldefiníció vagy kísérletgrafikon letöltése: Egy új PowerShell-kódtár lehetővé teszi a kísérlet teljes metaadatainak vagy egy adott modul részleteinek letöltését. A PowerShell Machine Learning kódtár egy kísérleti kiadás, de számos hasznos parancsmagja van:
Get-AmlExperiment
A a munkaterületen található összes kísérletet listázza.Export-AmlExperimentGraph
exportálja a teljes kísérlet definícióját egy JSON-fájlba.Download-AmlExperimentNodeOutput
A lehetővé teszi bármely modul kimeneti portjainak információinak kinyerését.
Adatok exportálásának konfigurálása
Adja hozzá az Adatok exportálása modult a kísérlethez a Studióban (klasszikus). Ezt a modult az Input (Bemenet) és a Output (Kimenet) kategóriában találja .
Csatlakozás Exportálja az adatokat az exportálni kívánt adatokat tartalmazó modulba.
Kattintson duplán az Adatok exportálása elemre a Tulajdonságok panel megnyitásához .
Az Adatcél mezőben válassza ki azt a felhőalapú tárolótípust, ahová az adatokat menteni fogja. Ha módosítja ezt a beállítást, az összes többi tulajdonság alaphelyzetbe áll. Ezért először ezt a lehetőséget válassza!
Adja meg a megadott tárfiók eléréséhez szükséges fióknevet és hitelesítési módszert.
A tárterület típusától és attól függően, hogy a fiók védett-e, előfordulhat, hogy meg kell adnia a fiók nevét, fájltípusát, hozzáférési kulcsát vagy tárolónevét. A hitelesítést nem igénylő források esetén általában elegendő tudni az URL-címet.
Az egyes típusokkal kapcsolatos példákért tekintse meg a következő témaköröket:
A Gyorsítótárazott eredmények használata beállítás lehetővé teszi a kísérlet megismétlését anélkül, hogy minden alkalommal újraírni ugyanezeket az eredményeket.
Ha nem választja ki ezt a beállítást, a rendszer a kísérlet minden futtatásakor eredményeket ír a tárolóba, függetlenül attól, hogy a kimeneti adatok módosultak-e.
Ha ezt a lehetőséget választja, az Adatok exportálása gyorsítótárazott adatokat használ, ha elérhető. Az új eredmények csak akkor jönnek létre, ha olyan upstream változás történik, amely hatással lenne az eredményekre.
Futtassa a kísérletet.
Példák
Példák az Adatok exportálása modul használatára: Azure AI Gallery:
Szövegbesorolás: Ez a minta az Adatok exportálása funkcióval menti a köztes eredményeket, majd az Adatok importálása funkcióval lekérte őket a tárolóból a kísérlet későbbi lépéseihez.
Kiskereskedelmi előrejelzés – 1/6. lépés – adat-előfeldolgozás: A kiskereskedelmi előrejelzési sablon egy gépi tanulási feladatot szemléltet a Azure SQL Database. Számos hasznos technikát mutat be, például egy Azure SQL-adatbázist hozhat létre a gépi tanuláshoz, a Azure SQL-adatbázis használatával, amely adat adatkészleteket ad át különböző fiókokban található kísérletek között, és menti és kombinálja az előrejelzéseket.
Gépi tanulási modell létrehozása és üzembe helyezése az SQL Server használatával egy Azure-beli virtuális gépen: Ez a cikk bemutatja, hogyan használhat egy Azure-beli virtuális gépen üzemeltetett SQL Server-adatbázist a betanítás adatainak és a kísérlet által létrehozott előrejelzéseknek a tárolására. Azt is bemutatja, hogyan használhatók a relációs adatbázisok a jellemzőtervezéshez és a funkciók kiválasztásához.
Az Azure ML használata Azure SQL Data Warehouse: Ez a cikk bemutatja, hogyan hozhat létre gépi tanulási modellt a Azure SQL Data Warehouse.
Technikai megjegyzések
Ez a szakasz az implementáció részleteit, tippeket és válaszokat tartalmazza a gyakori kérdésekre.
Megvalósítás részletei
Ezt a modult korábban Írónak nevezni. Ha van olyan meglévő kísérlete, amely a Writer (Író) modult használja, a rendszer a kísérlet frissítésekekor az Adatok exportálása névre nevezi át a modult.
Nem minden modul eredményez olyan kimenetet, amely kompatibilis az Adatexportálok exportálása célhelyekkel. Az Adatok exportálása például nem menthet SVMLight formátumra konvertált adatkészletet. Az Adatok exportálása a következő formátumokat támogatja:
- Adatkészlet (Azure ML formátum)
- .NET DataTable
- CSV fejlécekkel vagy anélkül
- TSV fejlécekkel vagy anélkül
Ismert problémák
Ha az Adatok kiíratása helyként az Azure Table lehetőséget választja, előfordulhat, hogy hiba történik a megadott táblába való íráskor. Ilyen esetben előfordulhat, hogy az adatok egy blobba lesznek írva.
Ha ez a hiba akkor fordul elő, és később nem tud olvasni a várt táblából, próbáljon meg egy Azure Storage segédprogrammal ellenőrizni a tárfiókban megadott tárolóban lévő blobokat.
A blobok jelenleg nem menthetőek egy adott Hive-táblába. Ha köztes eredményeket kell írnia, kerülje a Hive-tábla használatát a HDInsightban, és használjon inkább blobtárolót vagy Table Storage-et.
Ha jelenleg a HDFS-t választja a kimeneti adatok mentésének helyeként, a következő hibaüzenet jelenik meg: "Microsoft.Analytics.Exceptions.ErrorMapping+ModuleException".
Várt bemenetek
Név | Típus | Description |
---|---|---|
Adathalmaz | Adattábla | A megírni szükséges adatkészlet. |
Modulparaméterek
Ez a táblázat felsorolja azokat a paramétereket, amelyek az Összes adat exportálása beállításra vonatkoznak . Más paraméterek a kiválasztott adatcéltól függően dinamikusak és változnak.
Name | Tartomány | Típus | Alapértelmezett | Description |
---|---|---|---|---|
Adja meg az adatcélt | Lista | DataSourceOrSink (Adatforrás vagyszink) | Blob service Azure Storage | Jelezze, hogy az adatcél egy fájl a Blob service, egy table service-fájl, egy azure SQL adatbázis vagy egy Hive-tábla. |
Gyorsítótárazott eredmények használata | IGAZ/HAMIS | Logikai | HAMIS | Ezzel a beállítással elkerülheti, hogy feleslegesen kelljen újraírni az eredményeket. Ha a kísérlet során bármi megváltozik, az Adatok exportálása mindig végre lesz hajtva, és új eredményeket ír. Ha azonban semmi sem változott, és ezt a beállítást választotta, az Adatok exportálása nem lesz végrehajtva, hogy elkerülje az ugyanazon eredmények újraírását. |
Kivételek
Kivétel | Description |
---|---|
0057-es hiba | Kivétel történik, ha már létező fájlt vagy blobot próbál létrehozni. |
0001-es hiba | Kivétel történik, ha az adatkészlet egy vagy több megadott oszlopa nem található. |
0027-es hiba | Kivétel történik, ha két objektumnak azonos méretűnek kell lennie, de nem azok. |
0079-es hiba | Kivétel történik, ha a tároló neve helytelen Storage van megadva az Azure-ban. |
0052-es hiba | Kivétel történik, ha az Azure-fiók tárelérési kulcsa helytelenül van megadva. |
0064-es hiba | Kivétel történik, ha az Azure-fiók fiókneve vagy tárelérési kulcsa helytelenül van megadva. |
0071-es hiba | Kivétel történik, ha a megadott hitelesítő adatok helytelenek. |
0018-as hiba | Kivétel történik, ha a bemeneti adatkészlet érvénytelen. |
0029-es hiba | Kivétel történik, ha érvénytelen URI-t ad át. |
0003-as hiba | Kivétel történik, ha egy vagy több bemenet null vagy üres. |
A Studio (klasszikus) moduljaival kapcsolatos hibák listájáért tekintse meg a Machine Learning hibakódokat.
Az API-kivételek listájáért tekintse meg a Machine Learning REST API hibakódokat.
Lásd még
Adatok importálása
Adatbemenet és -kimenet
Adatátalakítás
Az Azure Table Storage és Azure SQL Database
A–Z modullista