ปรับปรุงแบบจําลองด้วย hyperparameters
แบบจําลองแบบง่ายที่มีชุดข้อมูลขนาดเล็กมักจะพอดีกับขั้นตอนเดียว ในขณะที่ชุดข้อมูลขนาดใหญ่และแบบจําลองที่ซับซ้อนมากขึ้นต้องมีขนาดพอดีโดยใช้แบบจําลองที่มีข้อมูลการฝึกและเปรียบเทียบเอาต์พุตกับป้ายชื่อที่คาดไว้ หากการคาดการณ์มีความแม่นยําเพียงพอ เราพิจารณาแบบจําลองที่ได้รับการฝึกแล้ว ถ้าไม่เป็นเช่นนั้นเราจะปรับแบบจําลองเล็กน้อยและวนรอบอีกครั้ง
Hyperparameters เป็นค่าที่เปลี่ยนวิธีการที่แบบจําลองพอดีในระหว่างการวนรอบเหล่านี้ ตัวอย่างเช่น อัตราการเรียนรู้คือ hyperparameter ที่กําหนดว่ามีการปรับปรุงแบบจําลองเท่าใดในแต่ละรอบการฝึกอบรม อัตราการเรียนรู้สูงหมายความว่าแบบจําลองสามารถได้รับการฝึกได้เร็วขึ้น แต่ถ้าสูงเกินไป การปรับเปลี่ยนอาจมีขนาดใหญ่มากจนแบบจําลองจะไม่ "ปรับแต่งอย่างละเอียด" และไม่เหมาะสม
ข้อมูลการประมวลผลล่วงหน้า
การประมวลผลล่วงหน้าจะอ้างอิงถึงการเปลี่ยนแปลงที่คุณทํากับข้อมูลของคุณก่อนที่จะถูกส่งผ่านไปยังแบบจําลอง ก่อนหน้านี้เราได้อ่านการประมวลผลล่วงหน้าอาจเกี่ยวข้องกับการทําความสะอาดชุดข้อมูลของคุณ แม้ว่านี่เป็นสิ่งสําคัญ การประมวลผลล่วงหน้ายังสามารถรวมถึงการเปลี่ยนแปลงรูปแบบของข้อมูลของคุณเพื่อให้แบบจําลองใช้งานได้ง่ายขึ้น ตัวอย่างเช่น ข้อมูลที่อธิบายว่า "สีแดง" "สีส้ม" "สีเหลือง" "lime" และ "green" อาจทํางานได้ดีกว่าถ้าแปลงเป็นรูปแบบดั้งเดิมมากขึ้นไปยังคอมพิวเตอร์ เช่น ตัวเลขที่ระบุว่าเป็นสีแดงและจํานวนสีเขียว
คุณลักษณะการปรับมาตราส่วน
ขั้นตอนการประมวลผลล่วงหน้าที่พบบ่อยที่สุดคือการปรับขนาดคุณลักษณะเพื่อให้อยู่ระหว่างศูนย์และหนึ่ง ตัวอย่างเช่น น้ําหนักของจักรยานและระยะทางที่บุคคลเดินทางบนจักรยานอาจมีตัวเลขที่แตกต่างกันมากสองตัว แต่ด้วยการปรับมาตราส่วนตัวเลขทั้งสองให้เป็นระหว่างศูนย์และอีกตัวหนึ่งจะช่วยให้แบบจําลองสามารถเรียนรู้ได้อย่างมีประสิทธิภาพมากขึ้นจากข้อมูล
การใช้หมวดหมู่เป็นฟีเจอร์
ในการเรียนรู้ของเครื่อง คุณยังสามารถใช้คุณลักษณะตามประเภทเช่น "จักรยาน" "สเก็ตบอร์ด" หรือ "รถ" คุณสมบัติเหล่านี้จะแสดงด้วยค่า 0 หรือ 1 ใน เวกเตอร์ร้อนแรงหนึ่งเวกเตอร์ที่มี 0 หรือ 1 สําหรับแต่ละค่าที่เป็นไปได้ ตัวอย่างเช่น จักรยาน สเก็ตบอร์ด และรถยนต์อาจเป็น (1,0,0), (0,1,0) และ (0,0,1) ตามลําดับ