共用方式為


臨界值篩選器

重要

Machine Learning 工作室 (傳統) 的支援將於 2024 年 8 月 31 日結束。 建議您在該日期之前轉換成 Azure Machine Learning

自 2021 年 12 月 1 日起,您將無法建立新的 Machine Learning 工作室 (傳統) 資源。 在 2024 年 8 月 31 日之前,您可以繼續使用現有的 Machine Learning 工作室 (傳統) 資源。

ML 工作室 (傳統) 文件即將淘汰,未來將不再更新。

建立會限制值的臨界值篩選器

類別: 資料轉換/篩選

注意

適用于僅限機器學習 Studio (傳統)

Azure Machine Learning設計工具中提供類似的拖放模組。

模組概觀

本文說明如何使用 機器學習 Studio 中的閾值篩選模組 (傳統) ,定義將數值限制為指定範圍的篩選。

閾值篩選通常用於數位訊號處理。 臨界值篩選會檢查輸入資料集的每個值,並變更不符合界限條件的所有值。 您通常會針對下列應用程式使用這種類型的篩選:

  • 以零值取代所有負數度量值。
  • 藉由定義所有像素的數值界限值,將灰階映像轉換為黑白區域。

定義符合您需求的篩選準則之後,您可以將資料集和篩選準則連線至套 用篩選 模組,以將篩選套用至資料。

[ 套用篩選] 模組的輸出是包含所選資料行的資料集,由 [臨界值篩選] 設定所指定來轉換。

或者,如果您選取 [指標] 選項,而不是傳回篩選值,則傳回的資料行包含布林值,指出每個資料列中的值是否符合指定的篩選條件。 當您測試新的篩選時,這非常有用。

提示

需要從資料集篩選資料,或移除遺漏的值? 請改用這些模組:

  • 清除遺漏的資料:使用此模組來移除遺漏的值,或以預留位置取代遺漏的值。
  • 資料分割和範例:使用此模組,依日期範圍、特定值或正則運算式等準則來分割或篩選資料集。
  • 裁剪值:使用此模組來設定範圍,並只保留該範圍內的值。

如何設定臨界值篩選

  1. 閾值篩選 模組新增至您的實驗。 您可以在 [ 資料轉換] 下的 [篩選] 類別中找到此課程模組。

  2. 針對 [類型],指定要套用的篩選類型:

    • LessThan:將小於指定層級的值變更為界限層級,並傳遞所有其他值。

    • GreaterThan:將大於指定層級的值變更為界限層級,並傳遞所有其他值。

    • MagnitudeLessThan:將小於指定層級的值變更為界限層級,但會保留原始值的符號。

    • MagnitudeGreaterThan:將大於指定層級的值變更為界限層級,但會保留原始值的符號。

    • InRange:通過落在指定範圍內的所有值,並將範圍以外的值變更為最接近的界限值。

    • OutOfRange:通過超出指定範圍的所有值,並將範圍內的值變更為最接近的界限值。

    • InRangeWithStd:通過落在指定標準差範圍內的所有值,並將範圍以外的值變更為最接近的界限值。

    • OutOfRangeWithStd:通過超出指定標準差範圍的所有值,並將範圍內的值變更為最接近的界限值。

  3. 針對 [層級],輸入要套用在每個臨界數值型別的界限值。

    • 如果您選取 LessThan 篩選準則,您指定的數位會定義可在不取代的情況下通過的最低值。

    • 如果您選取 GreaterThan 篩選準則,您指定的數位會定義可以傳遞且不需要取代的最大值。

    • 如果您選取 [MagnitudeLessThan ] 篩選準則,請輸入 Level的單一正數或負數。 小於該值的任何值會取代為層級值。

    • 如果您選取 MagnitudeGreaterThan 篩選準則,請輸入 [層級] 的單一正數或負數。 大於該值的任何值會取代為層級值。

    • 如果您選取篩選準則 InRangeOutOfRange,請指定上限或下限。 針對 [下限],輸入要包含在範圍中的最低數位。 針對 [上限],輸入要包含在範圍中的最高數位。

    • 如果您選擇其中一個使用標準差的篩選類型, (InRangeWithStdOutOfRangeWithStd) ,您必須指定 Alpha 常數。 偏差用來計算篩選結果的 Alpha 時間值。

  4. 您可以選擇性地選取 [指標 ] 選項,以產生只指出值是否受篩選影響的資料行。 如果您將 [指標 ] 保留為未選取狀態,篩選就會產生取代值。

  5. 連線套用篩選的篩選準則,然後串連資料組。

    使用資料行選取器來指定要套用篩選的資料行。 根據預設, 套用篩選 模組會將篩選轉換套用至所有選取的數值資料行。

  6. 執行實驗。

    在您將資料集連接到套 用篩選 模組並執行實驗之前,不會執行任何計算。 此時,指定的轉換會套用至選取的數值資料行。

範例

如需如何在機器學習中使用篩選的範例,請參閱 Azure AI 資源庫中的此實驗:

  • 篩選:此實驗會使用工程的電壓資料集來示範所有篩選類型。

指標值的範例

下列範例假設您套用臨界值篩選,以指定範圍,其下限為 2 且上限為 4:

指標 更換為
1 FALSE 2
2 TRUE 2
3 true 3
4 true 4
5 FALSE 4

篩選準則中的大小範例

篩選類型 MagnitudeLessThanMagnitudeGreaterthan 會先根據指定的層級評估值,然後提供根據原始值的符號而有所不同的取代值。

大小篩選的範例

篩選類型 MagnitudeLessThanMagnitudeGreaterthan 會先根據指定的層級評估值,然後提供根據原始值的符號而有所不同的取代值。

例如,下表顯示使用 MagnitudeLessThan 篩選值為 5 和 -5 時的結果。

來源值 層級 新值
3.07 5 5

值小於 5;因此,值會取代為 Level
3.07 -5 3.07

值不小於 -5;因此不會取代值
-3.93 5 -5

值小於 5;因此,值會取代為 Level ,但會保留原始值的正負號
-3.93 -5 -3.93

值不小於 -5;因此不會取代值
5.75 5 5.75

值不小於 -5;因此不會取代值
-5.75 -5 -5.75

值不小於 -5;因此不會取代值

技術說明

本節包含實作詳細資料、提示和常見問題集的解答。

實作詳細資料

臨界值篩選器模組會使用下列方法來定義臨界值,根據篩選器類型而定:

  • LessThan:小於模式的定義如下:

    calculating threshold for less than filter

    MagnitudeLessThan:小於大小模式的定義如下:

    threshold for magnitude less than filter

    在複雜的輸入中,每個元素的量級由公式所限制,如下所示:

    calculating threshold for less than filter complex

  • MagnitudeGreaterThan:大於大小模式的定義如下:

    calculating threshold for greater than filter

    在複雜的輸入中,每個元素的量級由公式所限制,如下所示:

    calculating threshold for less than filter complex

模組參數

名稱 範圍 類型 預設 描述
類型 任意 ThresholdType LessThan 選取要使用的臨界值方法
指標 任意 布林值 false 選取這個選項來傳回一個包含 True/False 的資料行,以指出值是否符合篩選條件,而不是傳回篩選的值。
層級 任意 Float 0.0 設定取代值
下限 任意 Float -1.0 指定範圍的下限
上限 任意 Float 1.0 指定範圍的上限
Alpha 任意 Float 3.0 使用此值乘以計算的標準差,做為臨界值

輸出

名稱 類型 描述
Filter IFilter 介面 濾波器實作

另請參閱

Filter
套用篩選
A-Z 模組清單