Sdílet prostřednictvím


Převod na TSV

Důležité

Podpora studia Machine Learning (Classic) skončí 31. srpna 2024. Doporučujeme do tohoto data přejít na službu Azure Machine Learning.

Od 1. prosince 2021 nebude možné vytvářet nové prostředky studia Machine Learning (Classic). Do 31. srpna 2024 můžete pokračovat v používání stávajících prostředků studia Machine Learning (Classic).

Dokumentace ke studiu ML (Classic) se vyřazuje z provozu a v budoucnu se nemusí aktualizovat.

Převede datový vstup do formátu odděleného tabulátorem.

Kategorie: Převody formátu dat

Poznámka

Platí pro: Machine Learning Studio (classic)

Podobné moduly s přetahováním jsou k dispozici v Azure Machine Learning návrháři.

Přehled modulu

Tento článek popisuje, jak pomocí modulu Převést na TSV v nástroji Machine Learning Studio (classic) převést libovolnou datovou sadu z interního formátu, který používají všechny moduly nástroje Machine Learning Studio (klasické), na plochý soubor ve formátu odděleném tabulátorem.

Soubory hodnot oddělených tabulátorem (TSV) jsou kompatibilní s mnoha externími nástroji, mezi které patří:

  • R a Python

  • Excel a PowerPivot

  • Všechny relační databáze

Pokud má například experiment zprostředkující datovou sadu, kterou chcete uložit pro opětovné použití v jiném nástroji nebo chcete volat z kódu, převeďte ji do formátu TSV a potom klikněte pravým tlačítkem na převedenou datovou sadu, abyste získali kód Pythonu potřebný pro přístup k datové sadě.

Použití funkce Převést na TSV

Modul Převést na TSV použijte vždy, když potřebujete stáhnout datovou sadu ve formátu odděleném tabulátory.

  1. Přidejte do experimentu průvodce převodem na TSV . Tento modul najdete v kategorii Převody formátu dat v Machine Learning Studiu (classic).

  2. Připojení modul do jiné sady dat nebo do modulu, který vy výstupní tabulkovou datovou sadu.

  3. Spusťte experiment nebo klikněte pravým tlačítkem myši jenom na modul Převést na TSV a vyberte Spustit vybrané.

Výsledky

Po dokončení převodu můžete datovou sadu otevřít, zavolat ji z kódu R nebo Pythonu, použít ji v poznámkovém bloku Jupyter nebo ji uložit do místního souboru.

Pokud chcete datovou sadu stáhnout, dvakrát klikněte na výstup modulu a určete, jestli chcete datovou sadu otevřít nebo uložit.

  • Pokud vyberete Otevřít, datová sada se načte pomocí jakéhokoli nástroje, který váš počítač ve výchozím nastavení používá k otevření . Soubory TSV. Obvykle je to Microsoft Excel.

  • Pokud vyberete Stáhnout datovou sadu, ve výchozím nastavení se soubor uloží s názvem modulu a identifikátorem GUID představujícím ID pracovního prostoru. Během stahování ale můžete vybrat možnost Uložit jako a změnit název nebo umístění souboru.

Příklady

I když neexistují žádné příklady, které jsou specifické pro tento formát, můžete si zobrazit příklady použití převodu formátu prozkoumáváním těchto ukázkových experimentů v Azure AI Gallery:

  • Křížové ověření ukázky binární klasifikace: Exportuje výsledky křížového ověření do formátu hodnot oddělených čárkami (CSV), aby bylo možné porovnat výsledky pro více modelů pomocí nástroje, jako je Excel.

  • Kvantování komprese obrázků založené na barvě: Exportuje datové sady, které se používají pro jednotlivé části analýzy, do souborů CSV, abyste mohli podobný model snadno spustit v libovolném nástroji, který podporuje formát CSV.

Technické poznámky

Tato část obsahuje podrobnosti o implementaci, tipy a odpovědi na nejčastější dotazy.

Požadavky na formát TSV

Hodnoty oddělené tabulátorem (TSV) jsou textový formát, který slouží k ukládání dat v tabulkové struktuře. Je velmi podobný formátu CSV, ale oddělovač je tabulátor, nikoli čárka.

Formát TSV je užitečnou alternativou k formátu CSV, pokud vaše data obsahují čárky. Čárky jsou v textových datech velmi běžné a používají se v evropských formátech čísel.

Jedním z problémů ve formátu odděleném tabulátory je, že zarážky tabulátoru se často považují za prázdné znaky v nestrukturovaných textech. Standard IANA pro TSV však podporuje čistou a přesnou analýzu souborů TSV tím, že v polích neumožňuje karty.

Všimněte si následujících požadavků na soubory TSV v Machine Learning Studiu (Classic):

  • Modul Convert to TSV (Převést na TSV) podporuje výstup jednoho řádku záhlaví, pokud datová sada obsahuje názvy sloupců.

  • Poskytovatel TSV podporuje pouze kódování znaků UTF-8.

  • Při čtení ze souborů TSV nebo zápisu do souborů TSV může být výkon pomalejší než u jiných formátů (například CSV).

Očekávané vstupy

Název Typ Description
Datová sada Tabulka dat Vstupní datová sada

Výstup

Název Typ Description
Datová sada výsledků GenericTsv Výstupní datová sada

Viz také

Převody formátu dat
Seznam modulů A až Z