Обнаружение новых моделей регрессии

Завершено

На уроке 2 мы рассматривали прямую линию до точек данных. Однако регрессия может соответствовать многим видам отношений, в том числе с несколькими факторами и теми, где важность одного фактора зависит от другого.

Эксперименты с моделями

Модели регрессии часто выбираются потому, что они подходят для небольших выборок, являются надежными, легко интерпретируются и имеют разновидности.

Линейная регрессия — это простейшая разновидность регрессии без ограничения на количество используемых функций. Линейная регрессия возникает во многих формах, часто именуемой количеством используемых признаков и формой кривой, которая соответствует.

Деревья принятия решений используют пошаговый подход к прогнозированию переменной. Если мы думаем о нашем примере велосипеда, дерево принятия решений может быть первым разбиение примеров между теми, которые находятся во время весны, лета и осени, сделать прогноз на основе дня недели. Spring/Summer-Понедельник может иметь ставку аренды велосипедов 100 в день, в то время как осень/зима-понедельник может иметь арендную ставку 20 в день.

Алгоритмы ансамбля создают не только одно дерево принятия решений, но и большое количество деревьев, что позволяет лучше прогнозировать более сложные данные. Алгоритмы ансамбля, такие как случайный лес, широко используются в машинном обучении и обработке и анализе данных из-за их сильных возможностей прогнозирования.

Специалисты по обработке и анализу данных часто экспериментируют с разными моделями. В следующем упражнении мы будем экспериментировать с различными типами моделей, чтобы сравнить их эффективность с одними и теми же данными.