臨界值篩選器
重要
Machine Learning 工作室 (傳統) 的支援將於 2024 年 8 月 31 日結束。 建議您在該日期之前轉換成 Azure Machine Learning。
自 2021 年 12 月 1 日起,您將無法建立新的 Machine Learning 工作室 (傳統) 資源。 在 2024 年 8 月 31 日之前,您可以繼續使用現有的 Machine Learning 工作室 (傳統) 資源。
ML 工作室 (傳統) 文件即將淘汰,未來將不再更新。
建立會限制值的臨界值篩選器
類別: 資料轉換/篩選
模組概觀
本文說明如何使用 機器學習 Studio 中的閾值篩選模組 (傳統) ,定義將數值限制為指定範圍的篩選。
閾值篩選通常用於數位訊號處理。 臨界值篩選會檢查輸入資料集的每個值,並變更不符合界限條件的所有值。 您通常會針對下列應用程式使用這種類型的篩選:
- 以零值取代所有負數度量值。
- 藉由定義所有像素的數值界限值,將灰階映像轉換為黑白區域。
定義符合您需求的篩選準則之後,您可以將資料集和篩選準則連線至套 用篩選 模組,以將篩選套用至資料。
[ 套用篩選] 模組的輸出是包含所選資料行的資料集,由 [臨界值篩選] 設定所指定來轉換。
或者,如果您選取 [指標] 選項,而不是傳回篩選值,則傳回的資料行包含布林值,指出每個資料列中的值是否符合指定的篩選條件。 當您測試新的篩選時,這非常有用。
提示
需要從資料集篩選資料,或移除遺漏的值? 請改用這些模組:
如何設定臨界值篩選
將 閾值篩選 模組新增至您的實驗。 您可以在 [ 資料轉換] 下的 [篩選] 類別中找到此課程模組。
針對 [類型],指定要套用的篩選類型:
LessThan:將小於指定層級的值變更為界限層級,並傳遞所有其他值。
GreaterThan:將大於指定層級的值變更為界限層級,並傳遞所有其他值。
MagnitudeLessThan:將小於指定層級的值變更為界限層級,但會保留原始值的符號。
MagnitudeGreaterThan:將大於指定層級的值變更為界限層級,但會保留原始值的符號。
InRange:通過落在指定範圍內的所有值,並將範圍以外的值變更為最接近的界限值。
OutOfRange:通過超出指定範圍的所有值,並將範圍內的值變更為最接近的界限值。
InRangeWithStd:通過落在指定標準差範圍內的所有值,並將範圍以外的值變更為最接近的界限值。
OutOfRangeWithStd:通過超出指定標準差範圍的所有值,並將範圍內的值變更為最接近的界限值。
針對 [層級],輸入要套用在每個臨界數值型別的界限值。
如果您選取 LessThan 篩選準則,您指定的數位會定義可在不取代的情況下通過的最低值。
如果您選取 GreaterThan 篩選準則,您指定的數位會定義可以傳遞且不需要取代的最大值。
如果您選取 [MagnitudeLessThan ] 篩選準則,請輸入 Level的單一正數或負數。 小於該值的任何值會取代為層級值。
如果您選取 MagnitudeGreaterThan 篩選準則,請輸入 [層級] 的單一正數或負數。 大於該值的任何值會取代為層級值。
如果您選取篩選準則 InRange 或OutOfRange,請指定上限或下限。 針對 [下限],輸入要包含在範圍中的最低數位。 針對 [上限],輸入要包含在範圍中的最高數位。
如果您選擇其中一個使用標準差的篩選類型, (InRangeWithStd、 OutOfRangeWithStd) ,您必須指定 Alpha 常數。 偏差用來計算篩選結果的 Alpha 時間值。
您可以選擇性地選取 [指標 ] 選項,以產生只指出值是否受篩選影響的資料行。 如果您將 [指標 ] 保留為未選取狀態,篩選就會產生取代值。
連線套用篩選的篩選準則,然後串連資料組。
使用資料行選取器來指定要套用篩選的資料行。 根據預設, 套用篩選 模組會將篩選轉換套用至所有選取的數值資料行。
執行實驗。
在您將資料集連接到套 用篩選 模組並執行實驗之前,不會執行任何計算。 此時,指定的轉換會套用至選取的數值資料行。
範例
如需如何在機器學習中使用篩選的範例,請參閱 Azure AI 資源庫中的此實驗:
- 篩選:此實驗會使用工程的電壓資料集來示範所有篩選類型。
指標值的範例
下列範例假設您套用臨界值篩選,以指定範圍,其下限為 2 且上限為 4:
值 | 指標 | 更換為 |
---|---|---|
1 | FALSE | 2 |
2 | TRUE | 2 |
3 | true | 3 |
4 | true | 4 |
5 | FALSE | 4 |
篩選準則中的大小範例
篩選類型 MagnitudeLessThan 和 MagnitudeGreaterthan 會先根據指定的層級評估值,然後提供根據原始值的符號而有所不同的取代值。
大小篩選的範例
篩選類型 MagnitudeLessThan 和 MagnitudeGreaterthan 會先根據指定的層級評估值,然後提供根據原始值的符號而有所不同的取代值。
例如,下表顯示使用 MagnitudeLessThan 篩選值為 5 和 -5 時的結果。
來源值 | 層級 | 新值 |
---|---|---|
3.07 | 5 | 5 值小於 5;因此,值會取代為 Level |
3.07 | -5 | 3.07 值不小於 -5;因此不會取代值 |
-3.93 | 5 | -5 值小於 5;因此,值會取代為 Level ,但會保留原始值的正負號 |
-3.93 | -5 | -3.93 值不小於 -5;因此不會取代值 |
5.75 | 5 | 5.75 值不小於 -5;因此不會取代值 |
-5.75 | -5 | -5.75 值不小於 -5;因此不會取代值 |
技術說明
本節包含實作詳細資料、提示和常見問題集的解答。
實作詳細資料
臨界值篩選器模組會使用下列方法來定義臨界值,根據篩選器類型而定:
LessThan:小於模式的定義如下:
MagnitudeLessThan:小於大小模式的定義如下:
在複雜的輸入中,每個元素的量級由公式所限制,如下所示:
MagnitudeGreaterThan:大於大小模式的定義如下:
在複雜的輸入中,每個元素的量級由公式所限制,如下所示:
模組參數
名稱 | 範圍 | 類型 | 預設 | 描述 |
---|---|---|---|---|
類型 | 任意 | ThresholdType | LessThan | 選取要使用的臨界值方法 |
指標 | 任意 | 布林值 | false | 選取這個選項來傳回一個包含 True/False 的資料行,以指出值是否符合篩選條件,而不是傳回篩選的值。 |
層級 | 任意 | Float | 0.0 | 設定取代值 |
下限 | 任意 | Float | -1.0 | 指定範圍的下限 |
上限 | 任意 | Float | 1.0 | 指定範圍的上限 |
Alpha | 任意 | Float | 3.0 | 使用此值乘以計算的標準差,做為臨界值 |
輸出
名稱 | 類型 | 描述 |
---|---|---|
Filter | IFilter 介面 | 濾波器實作 |