OneHotHashEncodingEstimator 類別
定義
重要
部分資訊涉及發行前產品,在發行之前可能會有大幅修改。 Microsoft 對此處提供的資訊,不做任何明確或隱含的瑕疵擔保。
將一或多個類別值的輸入資料行轉換成雜湊型單熱編碼向量的輸出資料行。
public sealed class OneHotHashEncodingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.Transforms.OneHotHashEncodingTransformer>
type OneHotHashEncodingEstimator = class
interface IEstimator<OneHotHashEncodingTransformer>
Public NotInheritable Class OneHotHashEncodingEstimator
Implements IEstimator(Of OneHotHashEncodingTransformer)
- 繼承
-
OneHotHashEncodingEstimator
- 實作
備註
估算器特性
此估算器是否需要查看資料來定型其參數? | 是 |
輸入資料行資料類型 | 數值、布林值、 文字或 索引鍵 類型的純量或向量。 |
輸出資料行資料類型 | 索引 鍵的純量或向量,或類型的 Single 向量。 |
可匯出至 ONNX | 否 |
產生的 OneHotEncodingTransformer 會將一或多個輸入資料行轉換成一個熱編碼向量的輸出資料行,其中索引處理是藉由雜湊值並使用雜湊做為索引來完成。
OneHotEncodingEstimator通常用來將類別資料轉換成可提供給機器學習演算法的表單。
此轉換的輸出是由 指定 OneHotEncodingEstimator.OutputKind :
Indicator 會產生 指標向量。 這個向量中的每個位置都會對應至字典中的類別,因此其長度是所建置字典的大小。 如果在字典中找不到值,則輸出會是零向量。
Bag 會產生一個向量,讓每個位置儲存輸入向量中對應值的出現次數。 這個向量中的每個位置都會對應至字典中的值,因此其長度是所建置字典的大小。 Indicator 和 Bag 只會在匯總輸入資料行中從個別位置產生的位向量的方式不同:針對 [指標],它們會串連,並針對 [包] 進行新增。 當來源資料行是純量時,[指標] 和 [包] 選項完全相同。
Key 會在資料 KeyDataViewType 行中產生索引鍵。 如果輸入資料行是向量,輸出會包含向量 索引鍵 類型,其中向量的每個位置對應至輸入向量的個別位置。 如果在建置字典中找不到類別,則會將值指派為零。
Binary 會產生二進位編碼向量,代表輸入資料行中存在於字典中的值。 如果在字典中找不到輸入資料行中的值,則輸出會是零向量。
OneHotEncodingTransformer 可以套用至一或多個資料行,在此情況下,它會針對套用的每個資料行建置並使用個別的字典。
如需使用範例的連結,請參閱另請參閱一節。
方法
Fit(IDataView) |
定型並傳 OneHotHashEncodingTransformer 回 。 |
GetOutputSchema(SchemaShape) |
傳 SchemaShape 回架構的 ,該架構將由轉換器產生。 用於管線中的架構傳播和驗證。 |
擴充方法
AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment) |
將「快取檢查點」附加至估算器鏈結。 這可確保下游估算器會針對快取的資料定型。 在接受多個資料通過的定型器之前,先有快取檢查點會很有説明。 |
WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>) |
指定估算器時,傳回包裝物件,一旦 Fit(IDataView) 呼叫委派即可。 估算器通常務必傳回符合專案的相關資訊,這就是 Fit(IDataView) 方法傳回特定型別物件的原因,而不是只傳回一般 ITransformer 。 不過,同時, IEstimator<TTransformer> 通常會形成具有許多物件的管線,因此我們可能需要透過建置估算器的鏈結,而我們想要取得轉換器的估算器 EstimatorChain<TLastTransformer> 會在此鏈結的某處放置。 在該案例中,我們可以透過這個方法附加呼叫一次會呼叫的委派。 |