TextCatalog 클래스

참조

정의

네임스페이스:: Microsoft.ML

어셈블리:: Microsoft.ML.Transforms.dll

패키지:: Microsoft.ML v3.0.1

패키지:: Microsoft.ML v1.0.0

패키지:: Microsoft.ML v1.1.0

패키지:: Microsoft.ML v1.2.0

패키지:: Microsoft.ML v1.3.1

패키지:: Microsoft.ML v1.4.0

패키지:: Microsoft.ML v1.5.5

패키지:: Microsoft.ML v1.6.0

패키지:: Microsoft.ML v1.7.0

패키지:: Microsoft.ML v2.0.0

중요

일부 정보는 릴리스되기 전에 상당 부분 수정될 수 있는 시험판 제품과 관련이 있습니다. Microsoft는 여기에 제공된 정보에 대해 어떠한 명시적이거나 묵시적인 보증도 하지 않습니다.

의 확장 메서드 컬렉션입니다 TransformsCatalog.

public static class TextCatalog

type TextCatalog = class

Public Module TextCatalog

상속: Object
TextCatalog

메서드

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, String)	WordEmbeddingEstimator미리 학습된 포함 모델을 사용하여 텍스트 벡터를 숫자 벡터로 변환하는 텍스트 기능화기인 을 만듭니다.
ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, WordEmbeddingEstimator+PretrainedModelKind)	WordEmbeddingEstimator미리 학습된 embeddings 모델을 사용하여 텍스트 벡터를 숫자 벡터로 변환하는 텍스트 기능화기인 를 만듭니다.
FeaturizeText(TransformsCatalog+TextTransforms, String, String)	TextFeaturizingEstimatorn-gram 및 char-gram의 정규화된 개수를 나타내는 의 주요 벡터 Single 로 텍스트 열을 변환하는 를 만듭니다.
FeaturizeText(TransformsCatalog+TextTransforms, String, TextFeaturizingEstimator+Options, String[])	TextFeaturizingEstimator텍스트 열을 n그램 및 char-gram의 정규화된 개수를 나타내는 의 Single 주요 벡터로 변환하는 를 만듭니다.
LatentDirichletAllocation(TransformsCatalog+TextTransforms, String, String, Int32, Single, Single, Int32, Int32, Int32, Int32, Int32, Int32, Int32, Boolean)	LightLDA를 LatentDirichletAllocationEstimator사용하여 텍스트(floats의 벡터로 표시됨)를 식별된 각 항목과 텍스트의 유사성을 나타내는 벡터 Single 로 변환하는 을 만듭니다.
NormalizeText(TransformsCatalog+TextTransforms, String, String, TextNormalizingEstimator+CaseMode, Boolean, Boolean, Boolean)	TextNormalizingEstimator필요에 따라 대/소문자를 변경하여 에서 들어오는 텍스트를 `inputColumnName` 정규화하는 를 만들고, 문자 표시, 문장 부호, 숫자 및 새 텍스트를 로 `outputColumnName`출력합니다.
ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)	NgramHashingEstimator에 지정된 열의 데이터를 새 열 `outputColumnName` 로 복사하고 해시된 `inputColumnName` n그램 수의 벡터를 생성하는 를 만듭니다.
ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)	NgramHashingEstimator에 지정된 여러 열의 데이터를 새 열 `outputColumnName` 로 가져와 해시된 `inputColumnNames` n-gram 개수의 벡터를 생성하는 를 만듭니다.
ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)	WordHashBagEstimator에 지정된 `inputColumnName` 열을 라는 `outputColumnName`새 열의 해시된 n그램 수 벡터에 매핑하는 를 만듭니다.
ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)	WordHashBagEstimator에 지정된 `inputColumnNames` 여러 열을 라는 `outputColumnName`새 열의 해시된 n-gram 수 벡터에 매핑하는 를 만듭니다.
ProduceNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)	NgramExtractingEstimator 입력 텍스트에서 발생하는 n그램(연속 단어 시퀀스)의 수 벡터를 생성하는 을 만듭니다.
ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)	WordBagEstimator에 지정된 `inputColumnName` 열을 라는 `outputColumnName`새 열의 n-gram 개수 벡터에 매핑하는 를 만듭니다.
ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)	WordBagEstimator에 지정된 `inputColumnName` 열을 라는 `outputColumnName`새 열의 n-gram 개수 벡터에 매핑하는 를 만듭니다.
ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)	WordBagEstimator에 지정된 `inputColumnNames` 여러 열을 라는 `outputColumnName`새 열의 n-gram 개수 벡터에 매핑하는 를 만듭니다.
RemoveDefaultStopWords(TransformsCatalog+TextTransforms, String, String, StopWordsRemovingEstimator+Language)	CustomStopWordsRemovingEstimator에 지정된 `inputColumnName` 열의 데이터를 새 열 `outputColumnName` 로 복사하고 에 해당하는 미리 정의된 텍스트 집합을 `language` 제거하는 를 만듭니다.
RemoveStopWords(TransformsCatalog+TextTransforms, String, String, String[])	CustomStopWordsRemovingEstimator에 지정된 `inputColumnName` 열의 데이터를 새 열 `outputColumnName` 로 복사하고 에 지정된 `stopwords` 텍스트를 제거하는 를 만듭니다.
TokenizeIntoCharactersAsKeys(TransformsCatalog+TextTransforms, String, String, Boolean)	슬라이딩 윈도우를 TokenizingByCharactersEstimator사용하여 텍스트를 문자 시퀀스로 분할하여 토큰화하는 를 만듭니다.
TokenizeIntoWords(TransformsCatalog+TextTransforms, String, String, Char[])	WordTokenizingEstimator를 만들어 입력 텍스트를 구분 기호로 사용하여 `separators` 토큰화합니다.

적용 대상

TextCatalog 클래스

정의

메서드

적용 대상

피드백

추가 리소스