WordEmbeddingEstimator クラス

リファレンス

定義

名前空間:: Microsoft.ML.Transforms.Text

アセンブリ:: Microsoft.ML.Transforms.dll

パッケージ:: Microsoft.ML v4.0.1

パッケージ:: Microsoft.ML v1.0.0

パッケージ:: Microsoft.ML v1.1.0

パッケージ:: Microsoft.ML v1.2.0

パッケージ:: Microsoft.ML v1.3.1

パッケージ:: Microsoft.ML v1.4.0

パッケージ:: Microsoft.ML v1.5.5

パッケージ:: Microsoft.ML v1.6.0

パッケージ:: Microsoft.ML v1.7.0

パッケージ:: Microsoft.ML v2.0.1

パッケージ:: Microsoft.ML v3.0.1

パッケージ:: Microsoft.ML v5.0.0-preview.1.25125.4

ソース:: WordEmbeddingsExtractor.cs

ソース:: WordEmbeddingsExtractor.cs

ソース:: WordEmbeddingsExtractor.cs

重要

一部の情報は、リリース前に大きく変更される可能性があるプレリリースされた製品に関するものです。 Microsoft は、ここに記載されている情報について、明示または黙示を問わず、一切保証しません。

事前トレーニング済みの埋め込みモデルを使用して、テキストトークンのベクターを数値ベクターに変換するテキスト特徴付け器。

public sealed class WordEmbeddingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.Transforms.Text.WordEmbeddingTransformer>

type WordEmbeddingEstimator = class
    interface IEstimator<WordEmbeddingTransformer>

Public NotInheritable Class WordEmbeddingEstimator
Implements IEstimator(Of WordEmbeddingTransformer)

継承: Object
WordEmbeddingEstimator

実装: IEstimator<WordEmbeddingTransformer>

注釈

推定特性


このエスティメーターは、パラメーターをトレーニングするためにデータを確認する必要がありますか?	いいえ
入力列のデータ型	テキストのベクター
出力列のデータ型	既知のサイズのベクター Single
ONNX にエクスポート可能	いいえ

出力 WordEmbeddingTransformer 列名パラメーターで指定された名前の新しい列が生成されます。各入力ベクトルは、使用される埋め込みモデルのサイズが 3 * 次元の数値ベクトルにマップされます。これは入力ベクトルのサイズに依存しない点に注意してください。

たとえば、それ自体が 50 次元である GloVe50D を使用する場合、出力列はサイズ 150 のベクトルです。スロットの最初の 3 分の 1 には、入力ベクター内の各文字列に対応する埋め込み全体の最小値が含まれています。 2 番目の 3 つ目には、埋め込みの平均が含まれています。スロットの最後の 3 分の 1 には、検出された埋め込みの最大値が含まれています。 min/max は、スペースを埋め込む単語の境界ハイパー四角形を提供します。これは、多くの単語の平均が有用なシグナルをかき消す長いフレーズに役立ちます。

ユーザーは、カスタムの事前トレーニング済み埋め込みモデルまたは使用可能な事前トレーニング済みモデルの 1 つを指定できます。使用可能なオプションは、さまざまなバージョンの GloVe モデル、 FastText、および SSWE です。

使用例へのリンクについては、「参照」セクションを参照してください。

メソッド

Fit(IDataView)	をトレーニングして返します WordEmbeddingTransformer。
GetOutputSchema(SchemaShape)	SchemaShapeトランスフォーマーによって生成されるスキーマの値を返します。パイプラインでのスキーマの伝達と検証に使用されます。

拡張メソッド

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

エスティメーターチェーンに 'キャッシュチェックポイント' を追加します。これにより、ダウンストリームエスティメーターがキャッシュされたデータに対してトレーニングされます。複数のデータを受け取るトレーナーが渡す前にキャッシュチェックポイントを設定すると便利です。

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

エスティメーターを指定すると、デリゲートを 1 回 Fit(IDataView) 呼び出すラップオブジェクトが呼び出されます。多くの場合、エスティメーターが適合した内容に関する情報を返すことが重要です。そのため Fit(IDataView) 、メソッドは一般的 ITransformerなオブジェクトではなく、具体的に型指定されたオブジェクトを返します。ただし、同時に、 IEstimator<TTransformer> 多くのオブジェクトを含むパイプラインに形成されることが多いため、トランスフォーマーを取得するエスティメーターがこのチェーンのどこかに埋もれる場所を介して EstimatorChain<TLastTransformer> 、推定器のチェーンを構築する必要がある場合があります。このシナリオでは、このメソッドを使用して、fit が呼び出されると呼び出されるデリゲートをアタッチできます。

適用対象

次の方法で共有