transformace dat
Důležité
Podpora studia Machine Learning (Classic) skončí 31. srpna 2024. Doporučujeme do tohoto data přejít na službu Azure Machine Learning.
Od 1. prosince 2021 nebude možné vytvářet nové prostředky studia Machine Learning (Classic). Do 31. srpna 2024 můžete pokračovat v používání stávajících prostředků studia Machine Learning (Classic).
- přečtěte si informace o přesunu projektů strojového učení z ML Studio (classic) do Azure Machine Learning.
- přečtěte si další informace o Azure Machine Learning.
Dokumentace ke studiu ML (Classic) se vyřazuje z provozu a v budoucnu se nemusí aktualizovat.
tento článek obsahuje seznam modulů, které jsou k dispozici v Machine Learning studiu (classic) pro transformaci dat. V případě strojového učení data transformace zahrnuje některé velmi obecné úkoly, jako je například spojování datových sad nebo změna názvů sloupců. Ale obsahuje taky mnoho úloh, které jsou specifické pro strojové učení, jako je normalizace, binningu a seskupování a odvození chybějících hodnot.
Poznámka
platí pro: jenom Machine Learning Studio (classic)
podobné moduly přetažení jsou k dispozici v návrháři Azure Machine Learning.
Důležité
Data, která používáte v Machine Learning studiu (classic), se obvykle očekávají jako "uklizený", než je naimportujete do Machine Learning studia (classic). Příprava dat může například zajistit, aby data používala správné kódování a kontrolovala, že data mají konzistentní schéma.
Moduly pro transformaci dat jsou seskupené do následujících kategorií založených na úlohách:
- Vytváření filtrů pro zpracování digitálního signálu: digitální filtry signálu se dají použít pro číselná data pro podporu úloh strojového učení, jako je rozpoznávání obrázků, rozpoznávání hlasu a analýza dat typu Wave.
- Generování a používání funkcí založených na počtu: featurization moduly založené na počítání vám pomůžou s vývojem kompaktních funkcí pro použití ve strojovém učení.
- Obecná manipulace s daty a jejich příprava: sloučení datových sad, mazání chybějících hodnot, seskupování a sumarizace dat, změna názvů sloupců a datových typů nebo označení, který sloupec je popisek nebo funkce.
- Vzorkování a rozdělování datových sad: rozdělte data do školicích a testovacích sad, rozdělte datové sady podle procenta nebo pomocí podmínky filtru nebo proveďte vzorkování.
- Škálování a zmenšení dat: Příprava číselných dat pro analýzu pomocí normalizace nebo škálování. Data z přihrádky do skupin, odeberte nebo nahraďte odlehlé nebo proveďte analýzu základní součásti (DPS).
Seznam modulů
Kategorie transformace dat obsahuje následující kategorie modulů:
- Transformace dat – filtr
- Učení s počty
- Transformace dat – manipulace
- Transformace dat – ukázka a rozdělení
- Transformace dat – škálování a zmenšení