Importálás adatcsatorna-szolgáltatókból

Cikk
05/06/2019

Fontos

A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.

2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.

További információ a gépi tanulási projektek a ML Studióból a klasszikusból a Azure Machine Learning.
További információ a Azure Machine Learning.

A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.

Ez a cikk azt ismerteti, hogyan használható az Adatok importálása modul a Machine Learning Studióban az OData formátumban megadott adatok gépi tanulási kísérletbe való importálásához.

Megjegyzés

A következőkre vonatkozik: Machine Learning Studio (klasszikus)

Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.

Egy adatkészlet OData-végpontjának létrehozásával elérhetővé tehetővé teszi az adatmodellt URL-címen keresztüli használatra. Azt is megadhatja, hogy a végpont mely OData-műveleteket fogja támogatni. További információ a végpontok létrehozásárólOdata: OData v4 (ASP.NET).

Adatok importálása hírcsatornából

Határozottan javasoljuk, hogy az importálás előtt készítse el az adatok profilját, hogy a séma biztosan a várt módon legyen. Az importálási folyamat átvizsgál néhány fő sort a séma meghatározásához, de a későbbi sorok további oszlopokat vagy hibákat okozhatnak.

Az Adatimport varázsló használata

A modul tartalmaz egy új varázslót, amely segít kiválasztani a tárolási lehetőséget. A varázslóval választhat a meglévő előfizetések és fiókok közül, és gyorsan konfigurálhatja az összes lehetőséget.

Adja hozzá az Adatok importálása modult a kísérlethez. A modult a (klasszikus) Studióban, az Adatbemenet és -kimenet kategóriában találja.
Kattintson az Adatok importálása varázsló indítása elemre , és kövesse az utasításokat.
Ha a konfigurálás befejeződött, az adatok a kísérletbe való másoláshoz kattintson a jobb gombbal a modulra, és válassza a Kijelölt futtatása lehetőséget.

Ha egy meglévő adatkapcsolatot kell szerkesztenie, a varázsló betölti az összes korábbi konfigurációs adatot, így nem kell elölről kezdenie.

Tulajdonságok manuális beállítása az Adatok importálása modulban

Az importálási forrás manuálisan is konfigurálható.

Adja hozzá az Adatok importálása modult a kísérlethez. Ezt a modult a (klasszikus) Studióban, az Adatbemenet és -kimenet kategóriában találja.
Az Adatforrás mezőben válassza az Adatcsatorna-szolgáltató lehetőséget.
Az Adattartalom típusa beállításban válassza ki a hírcsatorna típusát. Jelenleg csak az OData-végpontok támogatottak.
A Forrás URL-címe mezőben illessze be egy olyan webhely URL-címét, amely a szükséges formátumban biztosít adatokat.

A következő utasítás például a Northwind mintaadatbázisból lekért termékek listáját tartalmazza:

https://services.odata.org/northwind/northwind.svc/Products

További információ: OData-szintaxis.
Válassza a Gyorsítótárazott eredmények használata lehetőséget, ha az első alkalommal nem kell újra betöltenie az adatokat. Ez akkor jó választás, ha az adatok várhatóan nem változnak a kísérlet futtatásai között.

Ha a modul paramétereiben nincs más módosítás, a kísérlet a modul első futtatásakor betölti az adatokat, majd ezt követően az adatkészlet gyorsítótárazott verzióját használja.

Ha rendszeresen frissítenie kell az adatokat, törölje ennek a beállításnak a kijelölését.
Futtassa a kísérletet.

Results (Eredmények)

Ha elkészült, kattintson a kimeneti adatkészletre, és válassza a Vizualizáció lehetőséget, hogy lássa, sikeresen importálta-e az adatokat.

Amikor az Adatok importálása betölti a betáplálható adatokat a Studióba (klasszikus), az egyes oszlopok adattípusát a benne lévő értékek alapján, numerikus vagy kategorikus értékek alapján kiveszi.

Ha van fejléc, a fejléc a kimeneti adatkészlet oszlopainak elnevezésére használható.
Ha az adatok nem tartalmaznak oszlopfejléceket, az új oszlopnevek a következő formátumban jönnek létre: col1, col2,… ,coln.

Technikai megjegyzések

Ez a szakasz az implementáció részleteit, tippeket és válaszokat tartalmazza a gyakori kérdésekre.

OData-szintaxis

A lekérdezésnek egy lapos táblát kell visszaadni. A beágyazott OData-rekordok simítása nem támogatott.

Az OData-adatcsatornákban található egyes oszlopok olyan adattípusokkal is lehetnek, amelyek nem támogatottak a (klasszikus) Studióban, például tizedes törtekkel. Az R-szkript végrehajtása vagy a Metaadat-szerkesztő modulokkal az adatokat sztringekként is át lehet alakítani.

Az OData-szintaxissal és URL-címekkel kapcsolatos további információkért lásd: Odata.org – URI konvenciók

Gyakori kérdések

Szűrhetők az adatok a forrásból való beolvasott adatokra?

Az Adatok importálása modul általában nem támogatja a szűrést az adatok olvasása során. A szűrési feltételt azonban megadhatja a hírcsatorna-erőforrás URL-címének részeként.

A hírcsatornából származó adatok szűréséhez használjon az OData protokoll által támogatott utasításokat. Ez az URL-cím például a $filter kifejezés használatával csak az 1-es azonosítójú alkalmazotthoz kapcsolódó rendeléseket lekérte.

https://services.odata.org/Northwind/Northwind.svc/Orders?$filter=Employee/EmployeeID eq 1

További példák a szűrőszintaxisra: Using Filter Expressions in OData URIs (Szűrőkifejezések használata OData URI-kban).

Másik lehetőségként le is kaphatja az összes adatot, és szűrheti őket, miután betölti őket a Machine Learning Studióba::

Egyéni R-szkript használatával csak a kívánt adatokat használhatja.
Az Adatok felosztása modult relatív kifejezéssel vagy reguláris kifejezéssel használva elkülönítheti a kívánt adatokat, majd adatkészletként mentheti őket.

Megjegyzés

Ha azt találják, hogy a szükségesnél több adatot töltöttek be, felülírhatja a gyorsítótárazott adatkészletet egy új adatkészlet beolvasásával, majd a régebbi, nagyobb adatokkal azonos néven mentheti őket.

A következő hibaüzenetet kapom: Az OData-forráshoz való csatlakozáshoz hitelesítő adatokra van szükség. Frissítse és adja meg a hitelesítő adatokat a folytatáshoz. Hogyan lehet megadni a hitelesítő adatokat?**

Az Adatok importálása modul csak a névtelen hozzáférésű OData-végpontokat támogatja. Ha az OData szolgáltatás hitelesítő adatokat igényel, nem használhatja az OData lehetőséget az adatok lekértéhez.

Ha azonban a szolgáltatás ugyanabban a tartományban van, a hitelesítés néha automatikusan, felhasználói beavatkozás nélkül is történhet.

Áthidaló megoldásként a PowerQuery vagy a PowerPivot beolvashatja a hírcsatorna adatait, majd lekérdezheti az Excel.

Hogyan kerülendő el, hogy feleslegesen újra betöltsem ugyanezeket az adatokat?

Ha a forrásadatok megváltoznak, frissítheti az adatkészletet, és új adatokat adhat hozzá az Adatok importálása újrafuttatható futtatásával. Ha azonban nem szeretné újra beolvasni a forrásból a kísérlet minden egyes futtatásakor, válassza a Gyorsítótárazott eredmények használata lehetőséget TRUE (IGAZ) értékre. Ha ez a beállítás TRUE (igaz) értékre van állítva, a modul ellenőrzi, hogy a kísérlet korábban ugyanazokkal a forrással és bemeneti beállításokkal futott-e, és ha egy korábbi futtatás található, a rendszer a gyorsítótárban lévő adatokat használja az adatok forrásból való újratöltése helyett.

Miért jelenik meg a következő hibaüzenet: "A decimális típus nem támogatott"?

Az decimal adattípus nem támogatott a Machine Learning. Ennek az az oka, hogy az Adatok importálása nem képes automatikusan végrehajtani a pontosság elvesztését eredményező átalakításokat.

További információ a támogatott adattípusokkal kapcsolatban: Modul adattípusok.

Áthidaló megoldásként beolvashatja az adatokat sztring adattípusként, majd a Metaadatok szerkesztése segítségével konvertálhatja a tizedes törteket támogatott adatokká az adatok beolvasása előtt.

Miért nem jelennek meg helyesen a hírcsatorna egyes karakterei?

Machine Learning UTF-8 kódolást támogatja. Ha a forrás más típusú kódolást használ, előfordulhat, hogy a karakterek importálása helytelen.

Áthidaló megoldásként mentheti az adatokat egy CSV-fájlba az Azure Table Storage-ban vagy az Azure Blob Storage-ban. Ezután használja a CSV lehetőséget kódolással az egyéni elválasztó karakter, a kódlap és így tovább paraméterek megadásához.

Modulparaméterek

Name	Tartomány	Típus	Alapértelmezett	Description
Adatforrás	Lista	Adatforrás vagy fogadó	Azure Blob Storage	Az adatforrás lehet HTTP, FTP, névtelen HTTPS vagy FTPS, azure blobtárolóban lévő fájl, Azure-tábla, Azure SQL Database, helyszíni SQL Server-adatbázis, Hive-tábla vagy OData-végpont.
Adattartalom típusa	Lista (részkészlet)	URL-cím tartalma	OData	Adattípus
Forrás URL-címe	bármelyik	Sztring		Az adatforrás Power Query URL-címe
Gyorsítótárazott eredmények használata	IGAZ/HAMIS	Logikai	HAMIS	leírás

Kimenetek

Név	Típus	Description
Eredményadatkészlet	Adattábla	Adatkészlet letöltött adatokkal

Kivételek

Kivétel	Description
0003-as hiba	Kivétel történik, ha egy vagy több bemenet null vagy üres.
0029-es hiba	Kivétel történik, ha érvénytelen URI-t ad át.
0030-as hiba	a kivétel akkor jelentkezik, ha nem lehet letölteni egy fájlt.
0002-es hiba	Kivétel történik, ha egy vagy több paramétert nem lehetett a megadott típusról a cél metódus által megkövetelt típusra átalakítani.

A Studio (klasszikus) moduljaival kapcsolatos hibák listájáért tekintse meg a Machine Learning hibakódokat.

Az API-kivételek listájáért tekintse meg a Machine Learning REST API hibakódokat.

Lásd még

Adatok importálása
Adatok exportálása
Importálás webes URL-ről HTTP-kapcsolaton keresztül
Importálás Hive-lekérdezésből
Importálás Azure SQL Database-ből
Importálás Azure-táblából
Importálás Azure Blob Storage
Importálás helyszíni adatbázisból SQL Server adatbázisból

Megosztás a következőn keresztül: