CountVectorizerModel.SetMinTF(Double) Metoda
Definice
Důležité
Některé informace platí pro předběžně vydaný produkt, který se může zásadně změnit, než ho výrobce nebo autor vydá. Microsoft neposkytuje žádné záruky, výslovné ani předpokládané, týkající se zde uváděných informací.
Nastaví filtr tak, aby ignoroval vzácná slova v dokumentu. U každého dokumentu se ignorují termíny s četností nebo počtem nižším, než je daná prahová hodnota. Pokud se jedná o celé číslo větší než nebo rovno 1, určuje počet (kolikrát se termín musí v dokumentu objevit); Pokud se jedná o dvojnásobek v hodnotě [0,1), určuje se zlomek (mimo počet tokenů dokumentu).
Všimněte si, že parametr se používá pouze v transformaci CountVectorizerModel a nemá vliv na přizpůsobení.
public Microsoft.Spark.ML.Feature.CountVectorizerModel SetMinTF(double value);
member this.SetMinTF : double -> Microsoft.Spark.ML.Feature.CountVectorizerModel
Public Function SetMinTF (value As Double) As CountVectorizerModel
Parametry
- value
- Double
Minimální doba trvání typu double.
Návraty
Novinka CountVectorizerModel s nastavenou minimální frekvencí termínu