摘要
我們已經花了一點時間了解如何使用平衡資料和失衡資料來改善複雜的分類模型。 我們已了解,我們透過下列方式找出問題並改善模型:
- 更清楚地評估模型所犯的錯誤種類。
- 重新平衡資料,或改變模型的評估方式。
- 變更模型架構。
- 使用超參數。
使用複雜資料時,機器學習專家往往會將大部分的時間花在改變模型架構和使用超參數來改善其模型。 我們已經了解錯誤的設定會如何傷害或改善模型的效能。 決定這一點的主要因素是有問題的資料集大小。 當我們的資料集較小時,微調架構和超參數往往可以對模型造成相當大的改善。 資料集很大時,往往還是能從模型中擠出一絲效能。