Megosztás a következőn keresztül:


Adatok exportálása

Fontos

A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.

2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.

A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.

Adatkészletet ír az Azure-beli felhőalapú tárolók különböző formáiba, például táblákba, blobokba és Azure SQL adatbázisokba

Kategória: Adatbemenet és -kimenet

Megjegyzés

A következőkre vonatkozik: Machine Learning Studio (klasszikus)

Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.

A modul áttekintése

Ez a cikk azt ismerteti, hogyan használhatja az Adatok exportálása modult a Machine Learning Studio (klasszikus) alkalmazásában az eredmények, a köztes adatok és a munkaadatok a kísérletekből a Machine Learning Studióban (klasszikus) kívüli felhőbeli tárolóhelyre való mentéséhez.

Ez a modul támogatja az adatok exportálását vagy mentését a következő felhőalapú adatszolgáltatásokba:

  • Exportálás Hive-lekérdezésbe: Adatokat írhat egy HDInsight Hadoop-fürtben található Hive-táblába.

  • Exportálás Azure SQL Database: Adatokat menthet a Azure SQL Database vagy a Azure SQL Data Warehouse.

  • Exportálás Azure Table-be: Adatokat menthet a Table Storage szolgáltatásba az Azure-ban. A Table Storage nagy mennyiségű adat tárolására jó. Táblázatos formátumot biztosít, amely skálázható, olcsó és magas rendelkezésre áll.

  • Exportálás Azure Blob Storage: Adatokat ment a Blob service Azure-ban. Ez a lehetőség képekhez, strukturálatlan szöveghez vagy bináris adatokhoz hasznos. A biztonsági Blob service megoszthatóak nyilvánosan, vagy biztonságos alkalmazásadattárakban menthetők.

Megjegyzés

Az Adatexportolás modul nem támogatja az Azure Blob Storage-fiókhoz való csatlakozást, ha a "Biztonságos átvitelre van szükség" beállítás engedélyezve van.

  • Adatok letöltése: Ahhoz, hogy az adatokat az Excel-ban vagy más alkalmazásban is meg tudja nyitni, töltse le az adatokat egy olyan modullal, mint a Convert to CSV (Konvertálás CSV-fájlká) vagy a Convert to TSV (Konvertálás TSV-ké) az adatok egy adott formátumban való előkészítéséhez, majd az adatok letöltéséhez.

  • Az adatkészletet kiküldő modulok eredményeit letöltheti, ha a jobb gombbal a kimenetre kattint, majd az Adatkészlet letöltése gombra kattint. Alapértelmezés szerint a rendszer CSV formátumban exportálja az adatokat.

  • Moduldefiníció vagy kísérletgrafikon letöltése: Egy új PowerShell-kódtár lehetővé teszi a kísérlet teljes metaadatainak vagy egy adott modul részleteinek letöltését. A PowerShell Machine Learning kódtár egy kísérleti kiadás, de számos hasznos parancsmagja van:

    • Get-AmlExperiment A a munkaterületen található összes kísérletet listázza.
    • Export-AmlExperimentGraph exportálja a teljes kísérlet definícióját egy JSON-fájlba.
    • Download-AmlExperimentNodeOutput A lehetővé teszi bármely modul kimeneti portjainak információinak kinyerését.

Adatok exportálásának konfigurálása

  1. Adja hozzá az Adatok exportálása modult a kísérlethez a Studióban (klasszikus). Ezt a modult az Input (Bemenet) és a Output (Kimenet) kategóriában találja .

  2. Csatlakozás Exportálja az adatokat az exportálni kívánt adatokat tartalmazó modulba.

  3. Kattintson duplán az Adatok exportálása elemre a Tulajdonságok panel megnyitásához .

  4. Az Adatcél mezőben válassza ki azt a felhőalapú tárolótípust, ahová az adatokat menteni fogja. Ha módosítja ezt a beállítást, az összes többi tulajdonság alaphelyzetbe áll. Ezért először ezt a lehetőséget válassza!

  5. Adja meg a megadott tárfiók eléréséhez szükséges fióknevet és hitelesítési módszert.

    A tárterület típusától és attól függően, hogy a fiók védett-e, előfordulhat, hogy meg kell adnia a fiók nevét, fájltípusát, hozzáférési kulcsát vagy tárolónevét. A hitelesítést nem igénylő források esetén általában elegendő tudni az URL-címet.

    Az egyes típusokkal kapcsolatos példákért tekintse meg a következő témaköröket:

  6. A Gyorsítótárazott eredmények használata beállítás lehetővé teszi a kísérlet megismétlését anélkül, hogy minden alkalommal újraírni ugyanezeket az eredményeket.

    Ha nem választja ki ezt a beállítást, a rendszer a kísérlet minden futtatásakor eredményeket ír a tárolóba, függetlenül attól, hogy a kimeneti adatok módosultak-e.

    Ha ezt a lehetőséget választja, az Adatok exportálása gyorsítótárazott adatokat használ, ha elérhető. Az új eredmények csak akkor jönnek létre, ha olyan upstream változás történik, amely hatással lenne az eredményekre.

  7. Futtassa a kísérletet.

Példák

Példák az Adatok exportálása modul használatára: Azure AI Gallery:

  • Szövegbesorolás: Ez a minta az Adatok exportálása funkcióval menti a köztes eredményeket, majd az Adatok importálása funkcióval lekérte őket a tárolóból a kísérlet későbbi lépéseihez.

  • Kiskereskedelmi előrejelzés – 1/6. lépés – adat-előfeldolgozás: A kiskereskedelmi előrejelzési sablon egy gépi tanulási feladatot szemléltet a Azure SQL Database. Számos hasznos technikát mutat be, például egy Azure SQL-adatbázist hozhat létre a gépi tanuláshoz, a Azure SQL-adatbázis használatával, amely adat adatkészleteket ad át különböző fiókokban található kísérletek között, és menti és kombinálja az előrejelzéseket.

  • Gépi tanulási modell létrehozása és üzembe helyezése az SQL Server használatával egy Azure-beli virtuális gépen: Ez a cikk bemutatja, hogyan használhat egy Azure-beli virtuális gépen üzemeltetett SQL Server-adatbázist a betanítás adatainak és a kísérlet által létrehozott előrejelzéseknek a tárolására. Azt is bemutatja, hogyan használhatók a relációs adatbázisok a jellemzőtervezéshez és a funkciók kiválasztásához.

  • Az Azure ML használata Azure SQL Data Warehouse: Ez a cikk bemutatja, hogyan hozhat létre gépi tanulási modellt a Azure SQL Data Warehouse.

Technikai megjegyzések

Ez a szakasz az implementáció részleteit, tippeket és válaszokat tartalmazza a gyakori kérdésekre.

Megvalósítás részletei

  • Ezt a modult korábban Írónak nevezni. Ha van olyan meglévő kísérlete, amely a Writer (Író) modult használja, a rendszer a kísérlet frissítésekekor az Adatok exportálása névre nevezi át a modult.

  • Nem minden modul eredményez olyan kimenetet, amely kompatibilis az Adatexportálok exportálása célhelyekkel. Az Adatok exportálása például nem menthet SVMLight formátumra konvertált adatkészletet. Az Adatok exportálása a következő formátumokat támogatja:

    • Adatkészlet (Azure ML formátum)
    • .NET DataTable
    • CSV fejlécekkel vagy anélkül
    • TSV fejlécekkel vagy anélkül

Ismert problémák

  • Ha az Adatok kiíratása helyként az Azure Table lehetőséget választja, előfordulhat, hogy hiba történik a megadott táblába való íráskor. Ilyen esetben előfordulhat, hogy az adatok egy blobba lesznek írva.

    Ha ez a hiba akkor fordul elő, és később nem tud olvasni a várt táblából, próbáljon meg egy Azure Storage segédprogrammal ellenőrizni a tárfiókban megadott tárolóban lévő blobokat.

  • A blobok jelenleg nem menthetőek egy adott Hive-táblába. Ha köztes eredményeket kell írnia, kerülje a Hive-tábla használatát a HDInsightban, és használjon inkább blobtárolót vagy Table Storage-et.

  • Ha jelenleg a HDFS-t választja a kimeneti adatok mentésének helyeként, a következő hibaüzenet jelenik meg: "Microsoft.Analytics.Exceptions.ErrorMapping+ModuleException".

Várt bemenetek

Név Típus Description
Adathalmaz Adattábla A megírni szükséges adatkészlet.

Modulparaméterek

Ez a táblázat felsorolja azokat a paramétereket, amelyek az Összes adat exportálása beállításra vonatkoznak . Más paraméterek a kiválasztott adatcéltól függően dinamikusak és változnak.

Name Tartomány Típus Alapértelmezett Description
Adja meg az adatcélt Lista DataSourceOrSink (Adatforrás vagyszink) Blob service Azure Storage Jelezze, hogy az adatcél egy fájl a Blob service, egy table service-fájl, egy azure SQL adatbázis vagy egy Hive-tábla.
Gyorsítótárazott eredmények használata IGAZ/HAMIS Logikai HAMIS Ezzel a beállítással elkerülheti, hogy feleslegesen kelljen újraírni az eredményeket. Ha a kísérlet során bármi megváltozik, az Adatok exportálása mindig végre lesz hajtva, és új eredményeket ír. Ha azonban semmi sem változott, és ezt a beállítást választotta, az Adatok exportálása nem lesz végrehajtva, hogy elkerülje az ugyanazon eredmények újraírását.

Kivételek

Kivétel Description
0057-es hiba Kivétel történik, ha már létező fájlt vagy blobot próbál létrehozni.
0001-es hiba Kivétel történik, ha az adatkészlet egy vagy több megadott oszlopa nem található.
0027-es hiba Kivétel történik, ha két objektumnak azonos méretűnek kell lennie, de nem azok.
0079-es hiba Kivétel történik, ha a tároló neve helytelen Storage van megadva az Azure-ban.
0052-es hiba Kivétel történik, ha az Azure-fiók tárelérési kulcsa helytelenül van megadva.
0064-es hiba Kivétel történik, ha az Azure-fiók fiókneve vagy tárelérési kulcsa helytelenül van megadva.
0071-es hiba Kivétel történik, ha a megadott hitelesítő adatok helytelenek.
0018-as hiba Kivétel történik, ha a bemeneti adatkészlet érvénytelen.
0029-es hiba Kivétel történik, ha érvénytelen URI-t ad át.
0003-as hiba Kivétel történik, ha egy vagy több bemenet null vagy üres.

A Studio (klasszikus) moduljaival kapcsolatos hibák listájáért tekintse meg a Machine Learning hibakódokat.

Az API-kivételek listájáért tekintse meg a Machine Learning REST API hibakódokat.

Lásd még

Adatok importálása
Adatbemenet és -kimenet
Adatátalakítás
Az Azure Table Storage és Azure SQL Database
A–Z modullista