Bucketizer 類別
定義
重要
部分資訊涉及發行前產品,在發行之前可能會有大幅修改。 Microsoft 對此處提供的資訊,不做任何明確或隱含的瑕疵擔保。
Bucketizer 會將連續特徵的資料行對應至功能貯體的資料行。
Bucketizer 可以設定 inputCols 參數,一次對應多個資料行。 請注意,當設定 inputCol 和 inputCols 參數時,將會擲回例外狀況。 splits 參數僅用於單一資料行使用,而 splitsArray 則用於多個資料行。
public class Bucketizer : Microsoft.Spark.ML.Feature.FeatureBase<Microsoft.Spark.ML.Feature.Bucketizer>
type Bucketizer = class
inherit FeatureBase<Bucketizer>
Public Class Bucketizer
Inherits FeatureBase(Of Bucketizer)
- 繼承
建構函式
Bucketizer() |
Bucketizer建立不含任何參數的 |
Bucketizer(String) |
Bucketizer使用用來提供 Bucketizer 唯一識別碼的 UID 建立 |
方法
Clear(Param) |
清除先前為此 Microsoft.Spark.ML.Feature.Param 設定的任何值。 此值會重設為預設值。 (繼承來源 FeatureBase<T>) |
ExplainParam(Param) |
傳回特定 Microsoft.Spark.ML.Feature.Param 運作方式和目前設定方式的描述。 (繼承來源 FeatureBase<T>) |
ExplainParams() |
傳回套用至這個物件之 的所有 Microsoft.Spark.ML.Feature.Param 工作,以及其目前設定方式的描述。 (繼承來源 FeatureBase<T>) |
GetHandleInvalid() |
Bucketizer如何處理不正確資料,選擇為 「skip」、「error」 或 「keep」 |
GetInputCol() |
取得 應該從 讀取並轉換成貯體的資料行 Bucketizer 。 這已由 SetInputCol 設定 |
GetInputCols() |
Bucketizer取得應該從 中讀取並轉換成貯體的資料行。 這是由 SetInputCol 設定 |
GetOutputCol() |
取得將寫入輸出資料的資料行名稱。 這是由 SetInputCol 設定 |
GetOutputCols() |
將在 DataFrame 中建立的資料 Bucketizer 行清單。 這是由 SetOutputCols 設定 |
GetParam(String) |
擷 Microsoft.Spark.ML.Feature.Param 取 ,以便用來設定 物件上的 值 Microsoft.Spark.ML.Feature.Param 。 (繼承來源 FeatureBase<T>) |
GetSplits() |
取得使用 SetSplits 設定的分割 |
GetSplitsArray() |
取得 SetSplitsArray 所設定的分割 |
Load(String) |
Bucketizer載入先前使用 Save 儲存的 |
Save(String) |
儲存 物件,以便稍後使用 Load 載入它。 請注意,這些物件可以透過在 Scala 中載入或儲存來與 Scala 共用。 (繼承來源 FeatureBase<T>) |
Set(Param, Object) |
設定特定 Microsoft.Spark.ML.Feature.Param 的值。 (繼承來源 FeatureBase<T>) |
SetHandleInvalid(String) |
Bucketizer告知如何使用不正確資料來執行哪些動作。 選擇為 「skip」、「error」 或 「keep」。 預設值為 「error」 |
SetInputCol(String) |
設定 應該從 讀取並轉換成貯體的資料行 Bucketizer |
SetInputCols(IEnumerable<String>) |
Bucketizer設定應該從 中讀取並轉換成貯體的資料行。 每個資料行都是一組貯體,因此如果您有兩個輸入資料行,則可以有兩組貯體和兩個輸出資料行。 |
SetOutputCol(String) |
Bucketizer將會在 DataFrame 中建立新的資料行,這是新資料行的名稱。 |
SetOutputCols(List<String>) |
將在 DataFrame 中建立的資料 Bucketizer 行清單。 |
SetSplits(Double[]) |
分割點,將單一資料行分割成貯體。 若要分割多個資料行,請使用 SetSplitsArray。 您無法同時使用 SetSplits 和 SetSplitsArray |
SetSplitsArray(Double[][]) |
分割點會將多個資料行分割成貯體。 若要分割單一資料行,請使用 SetSplits。 您無法同時使用 SetSplits 和 SetSplitsArray。 |
ToString() |
傳回 JVM toString 值,而不是 .NET ToString 預設值 (繼承來源 FeatureBase<T>) |
Transform(DataFrame) |
Bucketizer執行 並轉換 DataFrame,以包含具有貯體資料的新資料行或資料行。 |
Uid() |
用來建立物件的 UID。 如果建立物件時不會傳入任何 UID,則會在建立物件時建立隨機 UID。 (繼承來源 FeatureBase<T>) |
適用於
意見反應
https://aka.ms/ContentUserFeedback。
即將登場:在 2024 年,我們將逐步淘汰 GitHub 問題作為內容的意見反應機制,並將它取代為新的意見反應系統。 如需詳細資訊,請參閱:提交並檢視相關的意見反應