Sdílet prostřednictvím


Převést na ARFF

Důležité

Podpora studia Machine Learning (Classic) skončí 31. srpna 2024. Doporučujeme do tohoto data přejít na službu Azure Machine Learning.

Od 1. prosince 2021 nebude možné vytvářet nové prostředky studia Machine Learning (Classic). Do 31. srpna 2024 můžete pokračovat v používání stávajících prostředků studia Machine Learning (Classic).

Dokumentace ke studiu ML (Classic) se vyřazuje z provozu a v budoucnu se nemusí aktualizovat.

Převede vstup dat do formátu souboru relace atributu používaného sadou nástrojů weka.

Kategorie: převody formátu dat

Poznámka

platí pro: jenom Machine Learning Studio (classic)

podobné moduly přetažení jsou k dispozici v návrháři Azure Machine Learning.

Přehled modulu

tento článek popisuje, jak použít modul převést na ARFF v Machine Learning studiu (classic) k převodu datových sad a výsledků formátu souboru vztahu atributů používaného sadou nástrojů Weka. Tento formát se označuje jako ARFF.

Specifikace ARFF data pro weka podporuje více úloh strojového učení, včetně předběžného zpracování dat, klasifikace a výběru funkcí. V tomto formátu jsou data uspořádána podle entity a jejich atributů a jsou obsažena v jednom textovém souboru. Podrobnosti o formátu souboru weka najdete v části technické poznámky .

obecně platí, že převod na formát souboru Weka je vyžadován pouze v případě, že chcete použít jak Machine Learning, tak Weka a máte v úmyslu přesunout data o školení mezi nimi.

Další informace o sadě nástrojů weka najdete v tomto článku o Wikipedii: weka (Machine Learning) .

Upozornění

Existující soubor ARFF nelze přepsat v Azure Storage.

Jak použít převod na ARFF

  1. Přidejte do experimentu modul převést do arff . tento modul můžete najít v kategorii převody formátů dat v Machine Learning studiu (classic).

  2. Připojení ho do libovolného modulu, který výstupuje datovou sadu.

  3. Spusťte experiment nebo klikněte na modul převést na arff a klikněte na Spustit vybrané.

Výsledky

  • Pokud chcete vytvořit kopii dat v místní složce, poklikejte na výstup převést na arffa vyberte možnost stažení .

    Pokud složku nezadáte, použije se výchozí název souboru a soubor se uloží do místní knihovny pro stahování .

Poznámka

Tento modul nepodporuje export do kódu Python nebo R.

Příklady

V Azure AI Gallerynejsou k dispozici žádné příklady specifické pro tento formát. Tyto experimenty však ukazují jiné typy převodu formátu:

Technické poznámky

Tato část obsahuje podrobné informace o implementaci, tipy a odpovědi na nejčastější dotazy.

Příklad formátu ARFF

Tato část poskytuje příklad, jak by typickou datovou sadou vypadala při převodu na ARFF.

Datový soubor ARFF se typicky skládá ze dvou částí: záhlaví , které definuje zdroj dat a schéma, a část data , která obsahuje aktuální entity a jejich atributy.

ARFF hlavičku

Záhlaví souboru ARFF definuje seznam atributů (ve sloupcích) a jejich datových typů. Záhlaví může obsahovat také více řádků komentářů popisujících zdroj dat nebo jakékoli jiné poznámky.

% Source: Iris dataset, UCI % 0 = Iris-setosa, 1= Iris-virginica @RELATION iris @ATTRIBUTE sepal_length NUMERIC @ATTRIBUTE sepal_width NUMERIC @ATTRIBUTE petal_length NUMERIC @ATTRIBUTE petal_width NUMERIC @ATTRIBUTE class {0, 1}

Tip

Pokud datová sada, kterou převádíte, neobsahuje názvy sloupců, před použitím převodu na ARFF přidejte pomocí modulu Upravit metadata modul.

ARFF data

Datová část se skládá z hodnot oddělených čárkou a vypadá velmi podobně jako soubor CSV bez záhlaví sloupců.

@DATA 5.1,3.5,1.4,0.2,0

Další informace o tomto formátu souboru najdete na stránce wiki na webu weka: arff (vývojářská verze).

Aktuální verze ARFF

Machine Learning Studio (classic) ukládá soubory ARFF pomocí formátu ARFF 3,0.

Očekávané vstupy

Název Typ Description
Datová sada Tabulka dat Vstupní datová sada

Výstupy

Název Typ Description
Datová sada výsledků Arff Výstupní datová sada

Viz také

Převody formátu dat
Seznam modulů a-Z