TokenizingByCharactersEstimator クラス
定義
重要
一部の情報は、リリース前に大きく変更される可能性があるプレリリースされた製品に関するものです。 Microsoft は、ここに記載されている情報について、明示または黙示を問わず、一切保証しません。
public sealed class TokenizingByCharactersEstimator : Microsoft.ML.Data.TrivialEstimator<Microsoft.ML.Transforms.Text.TokenizingByCharactersTransformer>
type TokenizingByCharactersEstimator = class
inherit TrivialEstimator<TokenizingByCharactersTransformer>
Public NotInheritable Class TokenizingByCharactersEstimator
Inherits TrivialEstimator(Of TokenizingByCharactersTransformer)
- 継承
注釈
推定特性
このエスティメーターは、パラメーターをトレーニングするためにデータを確認する必要がありますか? | はい |
入力列のデータ型 | テキストのスカラーまたはベクター |
出力列のデータ型 | キー型の可変サイズのベクター。 |
ONNX にエクスポート可能 | はい |
エスティメーターは、スライディング ウィンドウを使用してテキストを一連の文字に分割することで、文字をトークン化します。 トレーニング中、エスティメーターは、発生した一連の文字を含むキーと値のペアディクショナリを構築します。
TokenizingByCharactersTransformerエスティメーターを適合させた結果、出力列名パラメーターで指定された名前の新しい列が作成されます。この列には、入力で検出された一連の文字のキーが含まれます。
使用例へのリンクについては、「参照」セクションを参照してください。
メソッド
Fit(IDataView) |
IEstimator<TTransformer> for the TokenizingByCharactersTransformer. (継承元 TrivialEstimator<TTransformer>) |
GetOutputSchema(SchemaShape) |
SchemaShapeトランスフォーマーによって生成されるスキーマの値を返します。 パイプラインでのスキーマの伝達と検証に使用されます。 |
拡張メソッド
AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment) |
エスティメーター チェーンに 'キャッシュ チェックポイント' を追加します。 これにより、ダウンストリームエスティメーターがキャッシュされたデータに対してトレーニングされます。 複数のデータを受け取るトレーナーが渡す前にキャッシュ チェックポイントを設定すると便利です。 |
WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>) |
エスティメーターを指定すると、デリゲートを 1 回 Fit(IDataView) 呼び出すラップ オブジェクトが呼び出されます。 多くの場合、エスティメーターが適合した内容に関する情報を返すことが重要です。そのため Fit(IDataView) 、メソッドは一般的 ITransformerなオブジェクトではなく、具体的に型指定されたオブジェクトを返します。 ただし、同時に、 IEstimator<TTransformer> 多くのオブジェクトを含むパイプラインに形成されることが多いため、トランスフォーマーを取得するエスティメーターがこのチェーンのどこかに埋もれる場所を介して EstimatorChain<TLastTransformer> 、推定器のチェーンを構築する必要がある場合があります。 このシナリオでは、このメソッドを使用して、fit が呼び出されると呼び出されるデリゲートをアタッチできます。 |