다음을 통해 공유


Microsoft.ML.Transforms.Text 네임스페이스

텍스트 데이터 변환 구성 요소가 포함된 네임스페이스입니다.

클래스

CustomStopWordsRemovingEstimator

IEstimator<TTransformer> 을 선택합니다 CustomStopWordsRemovingTransformer.

CustomStopWordsRemovingEstimator.Options

시스템에 이미 정의된 중지 단어(가장 일반적인 단어)의 언어별 목록을 제거할 수 있는 중지 단어 제거기를 사용합니다.

CustomStopWordsRemovingTransformer

ITransformer 을(를) 맞추기 때문에 발생합니다 CustomStopWordsRemovingEstimator.

LatentDirichletAllocationEstimator

LDA 변환은 Latent Dirichlet 할당의 최신 구현인 LightLDA를 구현합니다.

LatentDirichletAllocationTransformer

ITransformer 을(를) 맞추기 때문에 발생합니다 LatentDirichletAllocationEstimator.

LatentDirichletAllocationTransformer.ModelParameters

LightLDA에서 검색한 항목에 대한 세부 정보를 제공합니다.

NgramExtractingEstimator

입력 텍스트에서 발생한 n-gram(연속 단어 시퀀스)의 벡터를 생성합니다.

NgramExtractingTransformer

ITransformer 을(를) 맞추기 때문에 발생합니다 NgramExtractingEstimator.

NgramHashingEstimator

IEstimator<TTransformer> 을 선택합니다 NgramHashingTransformer.

NgramHashingTransformer

텍스트 데이터 변환 구성 요소가 포함된 네임스페이스입니다.

StopWordsRemovingEstimator

IEstimator<TTransformer> 을 선택합니다 CustomStopWordsRemovingTransformer.

StopWordsRemovingEstimator.Options

시스템에 이미 정의된 중지 단어(가장 일반적인 단어)의 언어별 목록을 제거할 수 있는 중지 단어 제거기를 사용합니다.

StopWordsRemovingTransformer

ITransformer 을(를) 맞추기 때문에 발생합니다 StopWordsRemovingEstimator.

TextFeaturizingEstimator

텍스트 문서 컬렉션을 숫자 기능 벡터로 변환하는 추정기입니다. 기능 벡터는 제공된 옵션에 따라 단어 및/또는 문자 n-gram의 정규화된 개수입니다.

TextFeaturizingEstimator.Options

에 대한 고급 옵션입니다 TextFeaturizingEstimator.

TextNormalizingEstimator

IEstimator<TTransformer> 을 선택합니다 TextNormalizingTransformer.

TextNormalizingTransformer

ITransformer 을(를) 맞추기 때문에 발생합니다 TextNormalizingEstimator.

TokenizingByCharactersEstimator

IEstimator<TTransformer> 을 선택합니다 TokenizingByCharactersTransformer.

TokenizingByCharactersTransformer

ITransformer 을(를) 맞추기 때문에 발생합니다 TokenizingByCharactersEstimator.

WordBagEstimator

IEstimator<TTransformer> 을 선택합니다 ITransformer.

WordBagEstimator.Options

n-그램을 추출하는 방법에 대한 옵션입니다.

WordEmbeddingEstimator

미리 학습된 embeddings 모델을 사용하여 텍스트 토큰의 벡터를 숫자 벡터로 변환하는 텍스트 기능 변환기입니다.

WordEmbeddingTransformer

ITransformer 을(를) 맞추기 때문에 발생합니다 WordEmbeddingEstimator.

WordHashBagEstimator

IEstimator<TTransformer> 을 선택합니다 ITransformer.

WordTokenizingEstimator

지정된 구분 기호를 사용하여 입력 텍스트를 토큰화합니다.

WordTokenizingTransformer

ITransformer 을(를) 맞추기 때문에 발생합니다 WordTokenizingEstimator.

구조체

LatentDirichletAllocationTransformer.ModelParameters.ItemScore

텍스트 데이터 변환 구성 요소가 포함된 네임스페이스입니다.

LatentDirichletAllocationTransformer.ModelParameters.WordItemScore

텍스트 데이터 변환 구성 요소가 포함된 네임스페이스입니다.

인터페이스

IStopWordsRemoverOptions

지원되는 다양한 유형의 중지 단어 제거기를 정의합니다.

열거형

NgramExtractingEstimator.WeightingCriteria

모음의 문서에 단어가 얼마나 중요한지 평가하는 데 사용되는 통계 측정값입니다. 이 열거형은 serialize됩니다.

StopWordsRemovingEstimator.Language

중지 단어 언어입니다. 이 열거형은 serialize됩니다.

TextFeaturizingEstimator.Language

텍스트 언어입니다. 이 열거형은 serialize됩니다.

TextFeaturizingEstimator.NormFunction

텍스트 벡터 normalizer 종류입니다.

TextNormalizingEstimator.CaseMode

텍스트의 대/소문자 정규화 모드입니다. 이 열거형은 serialize됩니다.

WordEmbeddingEstimator.PretrainedModelKind

사용할 단어 포함을 지정합니다.