次の方法で共有


WordEmbeddingEstimator クラス

定義

事前トレーニング済みの埋め込みモデルを使用して、テキスト トークンのベクターを数値ベクターに変換するテキスト 特徴付け器。

public sealed class WordEmbeddingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.Transforms.Text.WordEmbeddingTransformer>
type WordEmbeddingEstimator = class
    interface IEstimator<WordEmbeddingTransformer>
Public NotInheritable Class WordEmbeddingEstimator
Implements IEstimator(Of WordEmbeddingTransformer)
継承
WordEmbeddingEstimator
実装

注釈

推定特性

このエスティメーターは、パラメーターをトレーニングするためにデータを確認する必要がありますか? いいえ
入力列のデータ型 テキストのベクター
出力列のデータ型 既知のサイズのベクター Single
ONNX にエクスポート可能 いいえ

出力 WordEmbeddingTransformer 列名パラメーターで指定された名前の新しい列が生成されます。各入力ベクトルは、使用される埋め込みモデルのサイズが 3 * 次元の数値ベクトルにマップされます。 これは入力ベクトルのサイズに依存しない点に注意してください。

たとえば、それ自体が 50 次元である GloVe50D を使用する場合、出力列はサイズ 150 のベクトルです。 スロットの最初の 3 分の 1 には、入力ベクター内の各文字列に対応する埋め込み全体の最小値が含まれています。 2 番目の 3 つ目には、埋め込みの平均が含まれています。 スロットの最後の 3 分の 1 には、検出された埋め込みの最大値が含まれています。 min/max は、スペースを埋め込む単語の境界ハイパー四角形を提供します。 これは、多くの単語の平均が有用なシグナルをかき消す長いフレーズに役立ちます。

ユーザーは、カスタムの事前トレーニング済み埋め込みモデルまたは使用可能な事前トレーニング済みモデルの 1 つを指定できます。 使用可能なオプションは、さまざまなバージョンの GloVe モデルFastTextおよび SSWE です

使用例へのリンクについては、「参照」セクションを参照してください。

メソッド

Fit(IDataView)

をトレーニングして返します WordEmbeddingTransformer

GetOutputSchema(SchemaShape)

SchemaShapeトランスフォーマーによって生成されるスキーマの値を返します。 パイプラインでのスキーマの伝達と検証に使用されます。

拡張メソッド

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

エスティメーター チェーンに 'キャッシュ チェックポイント' を追加します。 これにより、ダウンストリームエスティメーターがキャッシュされたデータに対してトレーニングされます。 複数のデータを受け取るトレーナーが渡す前にキャッシュ チェックポイントを設定すると便利です。

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

エスティメーターを指定すると、デリゲートを 1 回 Fit(IDataView) 呼び出すラップ オブジェクトが呼び出されます。 多くの場合、エスティメーターが適合した内容に関する情報を返すことが重要です。そのため Fit(IDataView) 、メソッドは一般的 ITransformerなオブジェクトではなく、具体的に型指定されたオブジェクトを返します。 ただし、同時に、 IEstimator<TTransformer> 多くのオブジェクトを含むパイプラインに形成されることが多いため、トランスフォーマーを取得するエスティメーターがこのチェーンのどこかに埋もれる場所を介して EstimatorChain<TLastTransformer> 、推定器のチェーンを構築する必要がある場合があります。 このシナリオでは、このメソッドを使用して、fit が呼び出されると呼び出されるデリゲートをアタッチできます。

適用対象

こちらもご覧ください