次の方法で共有


TokenizingByCharactersEstimator クラス

定義

public sealed class TokenizingByCharactersEstimator : Microsoft.ML.Data.TrivialEstimator<Microsoft.ML.Transforms.Text.TokenizingByCharactersTransformer>
type TokenizingByCharactersEstimator = class
    inherit TrivialEstimator<TokenizingByCharactersTransformer>
Public NotInheritable Class TokenizingByCharactersEstimator
Inherits TrivialEstimator(Of TokenizingByCharactersTransformer)
継承
TokenizingByCharactersEstimator

注釈

推定特性

このエスティメーターは、パラメーターをトレーニングするためにデータを確認する必要がありますか? はい
入力列のデータ型 テキストのスカラーまたはベクター
出力列のデータ型 キー型の可変サイズのベクター。
ONNX にエクスポート可能 はい

エスティメーターは、スライディング ウィンドウを使用してテキストを一連の文字に分割することで、文字をトークン化します。 トレーニング中、エスティメーターは、発生した一連の文字を含むキーと値のペアディクショナリを構築します。

TokenizingByCharactersTransformerエスティメーターを適合させた結果、出力列名パラメーターで指定された名前の新しい列が作成されます。この列には、入力で検出された一連の文字のキーが含まれます。

使用例へのリンクについては、「参照」セクションを参照してください。

メソッド

Fit(IDataView)

IEstimator<TTransformer> for the TokenizingByCharactersTransformer.

(継承元 TrivialEstimator<TTransformer>)
GetOutputSchema(SchemaShape)

SchemaShapeトランスフォーマーによって生成されるスキーマの値を返します。 パイプラインでのスキーマの伝達と検証に使用されます。

拡張メソッド

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

エスティメーター チェーンに 'キャッシュ チェックポイント' を追加します。 これにより、ダウンストリームエスティメーターがキャッシュされたデータに対してトレーニングされます。 複数のデータを受け取るトレーナーが渡す前にキャッシュ チェックポイントを設定すると便利です。

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

エスティメーターを指定すると、デリゲートを 1 回 Fit(IDataView) 呼び出すラップ オブジェクトが呼び出されます。 多くの場合、エスティメーターが適合した内容に関する情報を返すことが重要です。そのため Fit(IDataView) 、メソッドは一般的 ITransformerなオブジェクトではなく、具体的に型指定されたオブジェクトを返します。 ただし、同時に、 IEstimator<TTransformer> 多くのオブジェクトを含むパイプラインに形成されることが多いため、トランスフォーマーを取得するエスティメーターがこのチェーンのどこかに埋もれる場所を介して EstimatorChain<TLastTransformer> 、推定器のチェーンを構築する必要がある場合があります。 このシナリオでは、このメソッドを使用して、fit が呼び出されると呼び出されるデリゲートをアタッチできます。

適用対象

こちらもご覧ください