CountVectorizerModel.SetMinTF(Double) Metoda

Definice

Nastaví filtr tak, aby ignoroval vzácná slova v dokumentu. U každého dokumentu se ignorují termíny s četností nebo počtem nižším, než je daná prahová hodnota. Pokud se jedná o celé číslo větší než nebo rovno 1, určuje počet (kolikrát se termín musí v dokumentu objevit); Pokud se jedná o dvojnásobek v hodnotě [0,1), určuje se zlomek (mimo počet tokenů dokumentu).

Všimněte si, že parametr se používá pouze v transformaci CountVectorizerModel a nemá vliv na přizpůsobení.

public Microsoft.Spark.ML.Feature.CountVectorizerModel SetMinTF(double value);
member this.SetMinTF : double -> Microsoft.Spark.ML.Feature.CountVectorizerModel
Public Function SetMinTF (value As Double) As CountVectorizerModel

Parametry

value
Double

Minimální doba trvání typu double.

Návraty

Novinka CountVectorizerModel s nastavenou minimální frekvencí termínu

Platí pro