다음을 통해 공유


TextCatalog 클래스

정의

의 확장 메서드 컬렉션입니다 TransformsCatalog.

public static class TextCatalog
type TextCatalog = class
Public Module TextCatalog
상속
TextCatalog

메서드

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, String)

WordEmbeddingEstimator미리 학습된 포함 모델을 사용하여 텍스트 벡터를 숫자 벡터로 변환하는 텍스트 기능화기인 을 만듭니다.

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, WordEmbeddingEstimator+PretrainedModelKind)

WordEmbeddingEstimator미리 학습된 embeddings 모델을 사용하여 텍스트 벡터를 숫자 벡터로 변환하는 텍스트 기능화기인 를 만듭니다.

FeaturizeText(TransformsCatalog+TextTransforms, String, String)

TextFeaturizingEstimatorn-gram 및 char-gram의 정규화된 개수를 나타내는 의 주요 벡터 Single 로 텍스트 열을 변환하는 를 만듭니다.

FeaturizeText(TransformsCatalog+TextTransforms, String, TextFeaturizingEstimator+Options, String[])

TextFeaturizingEstimator텍스트 열을 n그램 및 char-gram의 정규화된 개수를 나타내는 의 Single 주요 벡터로 변환하는 를 만듭니다.

LatentDirichletAllocation(TransformsCatalog+TextTransforms, String, String, Int32, Single, Single, Int32, Int32, Int32, Int32, Int32, Int32, Int32, Boolean)

LightLDALatentDirichletAllocationEstimator사용하여 텍스트(floats의 벡터로 표시됨)를 식별된 각 항목과 텍스트의 유사성을 나타내는 벡터 Single 로 변환하는 을 만듭니다.

NormalizeText(TransformsCatalog+TextTransforms, String, String, TextNormalizingEstimator+CaseMode, Boolean, Boolean, Boolean)

TextNormalizingEstimator필요에 따라 대/소문자를 변경하여 에서 들어오는 텍스트를 inputColumnName 정규화하는 를 만들고, 문자 표시, 문장 부호, 숫자 및 새 텍스트를 로 outputColumnName출력합니다.

ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)

NgramHashingEstimator에 지정된 열의 데이터를 새 열 outputColumnName 로 복사하고 해시된 inputColumnName n그램 수의 벡터를 생성하는 를 만듭니다.

ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)

NgramHashingEstimator에 지정된 여러 열의 데이터를 새 열 outputColumnName 로 가져와 해시된 inputColumnNames n-gram 개수의 벡터를 생성하는 를 만듭니다.

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

WordHashBagEstimator에 지정된 inputColumnName 열을 라는 outputColumnName새 열의 해시된 n그램 수 벡터에 매핑하는 를 만듭니다.

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

WordHashBagEstimator에 지정된 inputColumnNames 여러 열을 라는 outputColumnName새 열의 해시된 n-gram 수 벡터에 매핑하는 를 만듭니다.

ProduceNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

NgramExtractingEstimator 입력 텍스트에서 발생하는 n그램(연속 단어 시퀀스)의 수 벡터를 생성하는 을 만듭니다.

ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)

WordBagEstimator에 지정된 inputColumnName 열을 라는 outputColumnName새 열의 n-gram 개수 벡터에 매핑하는 를 만듭니다.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

WordBagEstimator에 지정된 inputColumnName 열을 라는 outputColumnName새 열의 n-gram 개수 벡터에 매핑하는 를 만듭니다.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

WordBagEstimator에 지정된 inputColumnNames 여러 열을 라는 outputColumnName새 열의 n-gram 개수 벡터에 매핑하는 를 만듭니다.

RemoveDefaultStopWords(TransformsCatalog+TextTransforms, String, String, StopWordsRemovingEstimator+Language)

CustomStopWordsRemovingEstimator에 지정된 inputColumnName 열의 데이터를 새 열 outputColumnName 로 복사하고 에 해당하는 미리 정의된 텍스트 집합을 language 제거하는 를 만듭니다.

RemoveStopWords(TransformsCatalog+TextTransforms, String, String, String[])

CustomStopWordsRemovingEstimator에 지정된 inputColumnName 열의 데이터를 새 열 outputColumnName 로 복사하고 에 지정된 stopwords 텍스트를 제거하는 를 만듭니다.

TokenizeIntoCharactersAsKeys(TransformsCatalog+TextTransforms, String, String, Boolean)

슬라이딩 윈도우를 TokenizingByCharactersEstimator사용하여 텍스트를 문자 시퀀스로 분할하여 토큰화하는 를 만듭니다.

TokenizeIntoWords(TransformsCatalog+TextTransforms, String, String, Char[])

WordTokenizingEstimator를 만들어 입력 텍스트를 구분 기호로 사용하여 separators 토큰화합니다.

적용 대상