Dela via


Använd filter

Viktigt

Stödet för Machine Learning Studio (klassisk) upphör den 31 augusti 2024. Vi rekommenderar att du byter till Azure Machine Learning innan dess.

Från och med den 1 december 2021 kan du inte längre skapa nya Machine Learning Studio-resurser (klassisk). Du kan fortsätta att använda befintliga Machine Learning Studio-resurser (klassisk) till och med den 31 augusti 2024.

Dokumentationen om ML Studio (klassisk) håller på att dras tillbaka och kanske inte uppdateras i framtiden.

Tillämpar ett filter på angivna kolumner i en datauppsättning

Kategori: Datatransformering/filter

Anteckning

Gäller endast för: Machine Learning Studio (klassisk)

Liknande dra och släpp-moduler är tillgängliga i Azure Machine Learning designer.

Modulöversikt

Den här artikeln beskriver hur du använder modulen Tillämpa filter i Machine Learning Studio (klassisk) för att transformera en kolumn med värden genom att använda ett tidigare definierat filter. Filter används vid digital signalbearbetning för att minska bruset eller markera ett mönster. Därför är de värden som du transformerar alltid numeriska och representerar vanligtvis någon typ av ljud- eller visuell signal.

Tips

Letar du efter en annan typ av filter? Studio (klassisk) tillhandahåller dessa moduler för samplingsdata, hämtar en delmängd data, tar bort dåliga värden eller skapar test- och träningsuppsättningar: Dela upp data, Rensa data som saknas, Partition och Exempel, Tillämpa SQL-transformering, Clip Values. Om du behöver filtrera data när du läser dem från en källa kan du läsa Importera data. Alternativen beror på källtypen.

När du har avgöra vilken typ av filter som passar bäst för din datakälla anger du parametrarna och använder Tillämpa filter för att transformera datauppsättningen. Eftersom filterdesignen är separat från processen för att tillämpa ett filter kan filter återanvändas. Om du till exempel ofta arbetar med data som används för prognostiserade data kan du utforma flera typer av glidande genomsnittsfilter för att träna och jämföra flera modeller. Du kan också spara filtret för att tillämpa på andra experiment eller på olika datauppsättningar.

Så här konfigurerar du Tillämpa filter

  1. Lägg till modulen Tillämpa filter i experimentet. Du hittar IIR-filtermodulen under Datatransformering i kategorin Filter.

  2. Till höger indata ansluter du en datauppsättning som innehåller numeriska värden till en indata.

  3. Anslut ett befintligt filter till vänster indata. Du kan använda ett sparat filter igen eller konfigurera ett filter med någon av följande filtermoduler: Tröskelvärdesfilter, Glidande medelvärdesfilter, Medianfilter, IIR-filter, FIR-filter, Användardefinierat filter.

  4. I fönstret Egenskaper i Tillämpa filter klickar du på Starta kolumnväljaren och väljer de kolumner som filtret ska tillämpas på.

  5. Kör experimentet eller högerklicka på Använd filter och klickaKör valt.

Resultat

Utdata innehåller endast data i de valda kolumnerna, transformerade genom att tillämpa den angivna fördefinierade matematiska transformeringen.

Om du vill se andra kolumner i datauppsättningen kan du använda modulen Lägg till kolumner för att sammanfoga de ursprungliga och filtrerade datauppsättningarna.

Anteckning

Värdena i den ursprungliga kolumnen har inte tagits bort eller skrivits över och är fortfarande tillgängliga i experimentet som referens. Utdata från filtret är dock vanligtvis mer användbara för modellering.

Exempel

Exempel på hur filter används i maskininlärning finns i Azure AI Gallery:

  • Filter: Visar alla filtertyper med hjälp av en utformad vågformsdatamängd.

Teknisk information

Det här avsnittet innehåller implementeringsinformation, tips och svar på vanliga frågor.

  • Modulen Tillämpa filter binder den angivna typen av filter till de valda kolumnerna. Om du behöver använda olika typer av filter för olika kolumner bör du använda Välj kolumner i datauppsättning för att isolera kolumnerna och tillämpa olika filtertyper i separata arbetsflöden. Mer information finns i Välj kolumner i datauppsättning.

  • Filtren passerar inte genom datakolumner som inte påverkas av filtret. Det innebär att utdata från Tillämpa filter endast innehåller de transformerade numeriska värdena. Du kan dock använda modulen Lägg till kolumner för att koppla transformerade värden till källdatauppsättningen.

Filtrera perioder

Filterperioden bestäms delvis av filtertypen enligt följande:

  • Filterperioden är begränsad för FIR (finite styrd respons), enkelt glidande medelvärde och triangular glidande medelvärdesfilter.

  • För IIR (Infinite Infinite Response), exponentiellt glidande medelvärde och kumulativt glidande medelvärdesfilter är filterperioden oändlig.

  • För tröskelvärdesfilter är filterperioden alltid 1.

  • För medianfilter skapar inte NaN-värden och saknade värden i indatasignalen nya NaN i utdata, oavsett filterperiod.

Saknade värden

I det här avsnittet beskrivs beteendet när saknade värden påträffas, efter filtertyp. När ett filter i allmänhet stöter på ett NaN eller ett värde som saknas i indatauppsättningen blir utdatauppsättningen försedd med NaN för några nästa antal exempel, beroende på filterperioden. Detta får följande konsekvenser:

  • FILTER för FIR, enkelt glidande medelvärde eller triangular glidande medelvärde har en begränsad period. Därför följs alla saknade värden av ett antal NaN som är lika med filterordningen minus ett.

  • Filtren IIR, exponentiellt glidande medelvärde eller kumulativt glidande medelvärde har en oändlig period. När det första saknade värdet har påträffats fortsätter därför NaN att spridas på obestämd tid.

  • I ett tröskelvärdesfilter är perioden för ett tröskelvärdesfilter 1. Det innebär att saknade värden och NaN inte sprids.

  • För medianfilter NaN och saknade värden som påträffas i indatauppsättningen producerar inte nya NaN i utdata, oavsett filterperiod.

Förväntade indata

Namn Typ Description
Filtrera IFilter-gränssnitt Filterimplementering
Datamängd Datatabell Indatauppsättning

En lista över fel som är specifika för Studio-moduler (klassisk) finns i Machine Learning felkoder.

En lista över API-undantag finns i Machine Learning REST API felkoder.

Modulparametrar

Name Intervall Typ Standardvärde Description
Kolumnuppsättning Valfri ColumnSelection NumericAll Välj de kolumner som ska filtreras

Utdata

Namn Typ Description
Resultatdatauppsättning Datatabell Utdatauppsättning

Se även

Filter
A-Z-modullista