臨界值篩選器

發行項
05/06/2019

重要

Machine Learning 工作室 (傳統) 的支援將於 2024 年 8 月 31 日結束。建議您在該日期之前轉換成 Azure Machine Learning。

自 2021 年 12 月 1 日起，您將無法建立新的 Machine Learning 工作室 (傳統) 資源。在 2024 年 8 月 31 日之前，您可以繼續使用現有的 Machine Learning 工作室 (傳統) 資源。

請參閱將機器學習專案從 ML 工作室 (傳統) 移至 Azure Machine Learning 的相關資訊。
深入瞭解Azure Machine Learning。

ML 工作室 (傳統) 文件即將淘汰，未來將不再更新。

建立會限制值的臨界值篩選器

類別：資料轉換/篩選

注意

適用于：僅限機器學習 Studio (傳統)

Azure Machine Learning設計工具中提供類似的拖放模組。

模組概觀

本文說明如何使用機器學習 Studio 中的閾值篩選模組 (傳統) ，定義將數值限制為指定範圍的篩選。

閾值篩選通常用於數位訊號處理。臨界值篩選會檢查輸入資料集的每個值，並變更不符合界限條件的所有值。您通常會針對下列應用程式使用這種類型的篩選：

以零值取代所有負數度量值。
藉由定義所有像素的數值界限值，將灰階映像轉換為黑白區域。

定義符合您需求的篩選準則之後，您可以將資料集和篩選準則連線至套用篩選模組，以將篩選套用至資料。

[ 套用篩選] 模組的輸出是包含所選資料行的資料集，由 [臨界值篩選] 設定所指定來轉換。

或者，如果您選取 [指標] 選項，而不是傳回篩選值，則傳回的資料行包含布林值，指出每個資料列中的值是否符合指定的篩選條件。當您測試新的篩選時，這非常有用。

提示

需要從資料集篩選資料，或移除遺漏的值？請改用這些模組：

清除遺漏的資料：使用此模組來移除遺漏的值，或以預留位置取代遺漏的值。
資料分割和範例：使用此模組，依日期範圍、特定值或正則運算式等準則來分割或篩選資料集。
裁剪值：使用此模組來設定範圍，並只保留該範圍內的值。

如何設定臨界值篩選

將 閾值篩選 模組新增至您的實驗。您可以在 [ 資料轉換] 下的 [篩選] 類別中找到此課程模組。
針對 [類型]，指定要套用的篩選類型：
- LessThan：將小於指定層級的值變更為界限層級，並傳遞所有其他值。
- GreaterThan：將大於指定層級的值變更為界限層級，並傳遞所有其他值。
- MagnitudeLessThan：將小於指定層級的值變更為界限層級，但會保留原始值的符號。
- MagnitudeGreaterThan：將大於指定層級的值變更為界限層級，但會保留原始值的符號。
- InRange：通過落在指定範圍內的所有值，並將範圍以外的值變更為最接近的界限值。
- OutOfRange：通過超出指定範圍的所有值，並將範圍內的值變更為最接近的界限值。
- InRangeWithStd：通過落在指定標準差範圍內的所有值，並將範圍以外的值變更為最接近的界限值。
- OutOfRangeWithStd：通過超出指定標準差範圍的所有值，並將範圍內的值變更為最接近的界限值。
針對 [層級]，輸入要套用在每個臨界數值型別的界限值。
- 如果您選取 LessThan 篩選準則，您指定的數位會定義可在不取代的情況下通過的最低值。
- 如果您選取 GreaterThan 篩選準則，您指定的數位會定義可以傳遞且不需要取代的最大值。
- 如果您選取 [MagnitudeLessThan ] 篩選準則，請輸入 Level的單一正數或負數。小於該值的任何值會取代為層級值。
- 如果您選取 MagnitudeGreaterThan 篩選準則，請輸入 [層級] 的單一正數或負數。大於該值的任何值會取代為層級值。
- 如果您選取篩選準則 InRange 或OutOfRange，請指定上限或下限。針對 [下限]，輸入要包含在範圍中的最低數位。針對 [上限]，輸入要包含在範圍中的最高數位。
- 如果您選擇其中一個使用標準差的篩選類型， (InRangeWithStd、 OutOfRangeWithStd) ，您必須指定 Alpha 常數。偏差用來計算篩選結果的 Alpha 時間值。
您可以選擇性地選取 [指標 ] 選項，以產生只指出值是否受篩選影響的資料行。如果您將 [指標 ] 保留為未選取狀態，篩選就會產生取代值。
連線套用篩選的篩選準則，然後串連資料組。

使用資料行選取器來指定要套用篩選的資料行。根據預設，套用篩選模組會將篩選轉換套用至所有選取的數值資料行。
執行實驗。

在您將資料集連接到套用篩選模組並執行實驗之前，不會執行任何計算。此時，指定的轉換會套用至選取的數值資料行。

範例

如需如何在機器學習中使用篩選的範例，請參閱 Azure AI 資源庫中的此實驗：

篩選：此實驗會使用工程的電壓資料集來示範所有篩選類型。

指標值的範例

下列範例假設您套用臨界值篩選，以指定範圍，其下限為 2 且上限為 4：

值	指標	更換為
1	FALSE	2
2	TRUE	2
3	true	3
4	true	4
5	FALSE	4

篩選準則中的大小範例

篩選類型 MagnitudeLessThan 和 MagnitudeGreaterthan 會先根據指定的層級評估值，然後提供根據原始值的符號而有所不同的取代值。

大小篩選的範例

篩選類型 MagnitudeLessThan 和 MagnitudeGreaterthan 會先根據指定的層級評估值，然後提供根據原始值的符號而有所不同的取代值。

例如，下表顯示使用 MagnitudeLessThan 篩選值為 5 和 -5 時的結果。

來源值	層級	新值
3.07	5	5 值小於 5;因此，值會取代為 Level
3.07	-5	3.07 值不小於 -5;因此不會取代值
-3.93	5	-5 值小於 5;因此，值會取代為 Level ，但會保留原始值的正負號
-3.93	-5	-3.93 值不小於 -5;因此不會取代值
5.75	5	5.75 值不小於 -5;因此不會取代值
-5.75	-5	-5.75 值不小於 -5;因此不會取代值

技術說明

本節包含實作詳細資料、提示和常見問題集的解答。

實作詳細資料

臨界值篩選器模組會使用下列方法來定義臨界值，根據篩選器類型而定：

LessThan：小於模式的定義如下：

MagnitudeLessThan：小於大小模式的定義如下：

在複雜的輸入中，每個元素的量級由公式所限制，如下所示：
MagnitudeGreaterThan：大於大小模式的定義如下：

在複雜的輸入中，每個元素的量級由公式所限制，如下所示：

模組參數

名稱	範圍	類型	預設	描述
類型	任意	ThresholdType	LessThan	選取要使用的臨界值方法
指標	任意	布林值	false	選取這個選項來傳回一個包含 True/False 的資料行，以指出值是否符合篩選條件，而不是傳回篩選的值。
層級	任意	Float	0.0	設定取代值
下限	任意	Float	-1.0	指定範圍的下限
上限	任意	Float	1.0	指定範圍的上限
Alpha	任意	Float	3.0	使用此值乘以計算的標準差，做為臨界值

輸出

名稱	類型	描述
Filter	IFilter 介面	濾波器實作

另請參閱

Filter
套用篩選
 A-Z 模組清單

共用方式為