探索新的迴歸模型

已完成

在單元 2 中,我們探討了如何將直線調整至資料點。 不過,迴歸可擬合多種關聯性,包括具有多個因素的關聯性,以及一個因素的重要性取決於另一個因素的關聯性。

使用模型進行實驗

通常會選擇迴歸模型是因為它們可使用小型資料範例、系統健全、容易解讀,而且種類繁多。

線性回歸 是最簡單的回歸形式,沒有使用特徵數目的限制。 線性迴歸有許多形式,通常是依所用的特徵數量以及符合大小的曲線形狀來命名。

判定樹 會採取逐步方法來預測變數。 如果我們想一下自行車範例,決策樹可能會先將範例分割為春/夏期間和秋/冬期間兩種情況,並根據星期幾來進行預測。 「春/夏 - 星期一」的自行車出租率可能會是每天 100 輛,「秋/冬 - 星期一」的出租率可能會是每天 20 輛。

合奏演算法 不僅會建構一個決策樹,而且會建構大量的決策樹,以便更準確地預測複雜的數據。 由於其預測能力強大,集成演算法 (例如隨機樹系) 被廣泛用於機器學習和科學中。

資料科學家往往會使用不同的模型進行實驗。 在下列練習中,我們將會試驗不同類型的模型,以比較它們在相同資料上的表現情況。