Поделиться через


TreeOptions Класс

Определение

Параметры для древовидного обучения.

public abstract class TreeOptions : Microsoft.ML.Trainers.TrainerInputBaseWithGroupId
type TreeOptions = class
    inherit TrainerInputBaseWithGroupId
Public MustInherit Class TreeOptions
Inherits TrainerInputBaseWithGroupId
Наследование
Производный

Конструкторы

TreeOptions()

Параметры для древовидного обучения.

Поля

AllowEmptyTrees

Если корневое разделение невозможно, разрешите продолжить обучение.

BaggingExampleFraction

Процент примеров обучения, используемых в каждой сумке. Значение по умолчанию — 0,7 (70 %).

BaggingSize

Количество деревьев в каждой сумке (0 для отключения мешка).

Bias

Смещение для вычисления градиента для каждой ячейки признаков для категориального признака.

Bundling

Объединять ячейки с низкой численностью населения. Bundle.None(0): без объединения, Bundle.AggregateLowPopulation(1): низкая заполненность пакета, Bundle.Adjacent(2): набор с низким заполнением соседей.

CategoricalSplit

Следует ли выполнять разделение на основе нескольких категориальных значений признаков.

CompressEnsemble

Сожмите дерево Ensemble.

DiskTranspose

Следует ли использовать диск или собственные средства транспозиции данных (если это применимо) при выполнении транспонирования.

EntropyCoefficient

Коэффициент энтропии (регуляризации) от 0 до 1.

ExampleWeightColumnName

Столбец, используемый для примера веса.

(Унаследовано от TrainerInputBaseWithWeight)
ExecutionTime

Разбивка времени выполнения на печать в канале ML.NET.

FeatureColumnName

Столбец, используемый для функций.

(Унаследовано от TrainerInputBase)
FeatureFirstUsePenalty

Признак, который первым использует штрафной коэффициент.

FeatureFlocks

Следует ли выполнять коллективизацию признаков во время подготовки набора данных для ускорения обучения.

FeatureFraction

Доля признаков (выбранных случайным образом) для использования в каждой итерации. Используйте 0,9, если требуется только 90 % функций. Более низкие числа помогают уменьшить чрезмерное количество привязок.

FeatureFractionPerSplit

Доля признаков (выбранных случайным образом) для каждого разбиения. Если значение равно 0,9, 90 % всех функций будет отброшено бы в ожидании.

FeatureReusePenalty

Коэффициент повторного использования штрафа (регуляризации).

FeatureSelectionSeed

Начальное значение выбора активного компонента.

GainConfidenceLevel

Требование к достоверности при установке деревьев. Учитывайте увеличение только в том случае, если его вероятность и случайный выигрыш при выборе выше этого значения.

HistogramPoolSize

Количество гистограмм в пуле (от 2 до numLeaves).

LabelColumnName

Столбец, используемый для меток.

(Унаследовано от TrainerInputBaseWithLabel)
MaximumBinCountPerFeature

Максимальное число уникальных значений (интервалов) на признак.

MaximumCategoricalGroupCountPerNode

Максимальное количество категориальных групп разбиения, которые следует учитывать при разделении по категориальным признакам. Разделенные группы — это коллекция точек разбиения. Это используется для уменьшения переобучений при наличии большого количества категориальных признаков.

MaximumCategoricalSplitPointCount

Максимальное количество точек разделения категорий, которые следует учитывать при разделении по категориальным признакам.

MemoryStatistics

Вывод статистики памяти в канал ML.NET.

MinimumExampleCountPerLeaf

Минимальное количество точек данных, необходимых для формирования нового листа дерева.

MinimumExampleFractionForCategoricalSplit

Минимальный процент категориального примера в ячейке, который следует учитывать для разделения. Значение по умолчанию — 0,1 % от всех примеров обучения.

MinimumExamplesForCategoricalSplit

Минимальное категориальное число примеров в ячейке, учитываемой для разделения.

NumberOfLeaves

Максимальное количество листьев в каждом дереве регрессии.

NumberOfThreads

Количество потоков для использования.

NumberOfTrees

Общее количество деревьев принятия решений, создаваемых в ансамбле.

RowGroupColumnName

Столбец для использования, например groupId.

(Унаследовано от TrainerInputBaseWithGroupId)
Seed

Начальное значение генератора случайных чисел.

Smoothing

Параметр Smoothing для регуляризации дерева.

SoftmaxTemperature

Температура случайного распределения softmax для выбора признака.

SparsifyThreshold

Уровень разреженности, необходимый для использования разреженного представления признаков.

TestFrequency

Вычислите значения метрик для обучения, допустимости и проверки каждого k раундов.

Применяется к