Konvertálás TSV-ként
Fontos
A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.
2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.
- További információ a gépi tanulási projektek a ML Studióból a klasszikusból a Azure Machine Learning.
- További információ a Azure Machine Learning.
A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.
Az adatbevitelt tabulátorral tagolt formátumra konvertálja
Kategória: Adatformátum-átalakítások
Megjegyzés
A következőkre vonatkozik: Machine Learning Studio (klasszikus)
Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.
A modul áttekintése
Ez a cikk azt ismerteti, hogyan használható a Convert to TSV (TSV-átalakítás) modul a Machine Learning Studio (klasszikus) modulban az összes Machine Learning Studio(klasszikus) modul által használt belső formátumból bármely adatkészlet tabulátott formátumú fájlká konvertálására.
A tabulátott értékekkel (TSV) elválasztott fájlok számos külső eszközzel kompatibilisek, beleértve a következőket:
R és Python
Excel és PowerPivot
Minden relációs adatbázis
Ha például a kísérlet egy köztes adatkészletet tartalmaz, amely egy másik eszközben való újrahasználatra mentve, vagy kódból szeretne hívást hívni, konvertálja TSV formátumra, majd a jobb gombbal a konvertált adatkészletre kattintva lekérte az adatkészlet eléréséhez szükséges Python-kódot.
A Convert to TSV használata
Ha tabulátorral tagolt formátumú adatkészletet kell letöltenie, használja a Konvertálás TSV-ré modult.
Adja hozzá a Convert to TSV (Konvertálás TSV-ként ) gombra a kísérlethez. Ezt a modult a (klasszikus) Machine Learning Data Format Conversions (Adatformátum-konverziók) kategóriában találja.
Csatlakozás modult egy másik adatkészlethez, vagy egy táblázatos adatkészletet kiküldő modulhoz.
Futtassa a kísérletet, vagy kattintson a jobb gombbal a Convert to TSV (Konvertálás TSV-modulra ) modulra, és válassza a Run selected (Futtatás kiválasztva) lehetőséget.
Results (Eredmények)
Az átalakítás befejezése után megnyithatja az adatkészletet, meghívhatja R- vagy Python-kódból, használhatja egy Jupyter notebookban, vagy mentheti egy helyi fájlba.
Ha le szeretné tölteni az adatkészletet, kattintson duplán a modul kimenetére, és jelezze, hogy szeretné-e megnyitni vagy menteni a datsetet.
Ha a Megnyitás lehetőséget választja, az adatkészlet a számítógép által alapértelmezés szerint a megnyitásához használt eszközzel töltődik be. TSV-fájlok. Ez általában nem Microsoft Excel.
Ha az Adatkészlet letöltése lehetőséget választja, a rendszer alapértelmezés szerint menti a fájlt a modul nevével és a munkaterület azonosítóját küldő GUID azonosítóval. A Letöltés közben azonban kiválaszthatja a Mentés másként lehetőséget, és módosíthatja a fájl nevét vagy helyét.
Példák
Bár nincsenek erre a formátumra jellemző példák, a következő mintakísérletek vizsgálatával láthat példákat a formátumkonverzió Azure AI Gallery:
Bináris besorolási minta keresztellenőrzése: Exportálja a keresztellenőrzés eredményeit vesszővel elválasztott értékformátumba (CSV), hogy több modell eredményeit össze tudja hasonlítani egy olyan eszközzel, mint a Excel.
Színalapú képtömörítés kvantálás: Exportálja az elemzés egyes részeihez használt adatkészleteket CSV-fájlokba, így könnyen futtathat hasonló modelleket bármely, a CSV formátumot támogató eszközben.
Technikai megjegyzések
Ez a szakasz az implementáció részleteit, a tippeket és a gyakori kérdésekre adott válaszokat tartalmazza.
TSV formátumkövetelmények
A tabulátumokkal elválasztott értékek (TSV) szöveges formátumok, amelyek táblázatos struktúrában tárolják az adatokat. Nagyon hasonlít a CSV formátumhoz, de az elválasztó nem vessző, hanem tabulátor.
A TSV formátum hasznos alternatíva a CSV formátumnak, ha az adatok vesszőket tartalmaznak. A vesszők nagyon gyakoriak a szöveges adatokban, és európai számformátumokban használatosak.
A tabulátorral tagolt formátum egyik problémája, hogy a tabulátorokat gyakran üres területnek tekintik a strukturálatlan szövegekben. A TSV-hez szükséges IANA-szabvány azonban támogatja a TSV-fájlok tiszta és pontos elemzési eljárását azáltal, hogy nem támogatja a mezőkben található lapfüleket.
Vegye figyelembe a TSV-fájlokra vonatkozó alábbi követelményeket a Machine Learning Studióban (klasszikus):
A Convert to TSV (Konvertálás TSV-ké ) modul egyetlen fejlécsor kimenetét támogatja, ha az adatkészlet oszlopneveket tartalmaz.
A TSV-szolgáltató csak az UTF-8 karakterkódolást támogatja.
A TSV-fájlok olvasásakor vagy a TSV-fájlokba való íráskor a teljesítmény lassabb lehet, mint más formátumokkal (például CSV-vel).
Várt bemenetek
Név | Típus | Description |
---|---|---|
Adathalmaz | Adattábla | Bemeneti adatkészlet |
Kimenet
Név | Típus | Description |
---|---|---|
Eredményadatkészlet | GenericTsv | Kimeneti adatkészlet |