แบบจําลองการเรียนรู้ของเครื่อง

เสร็จสมบูรณ์เมื่อ

Note

ดูแท็บ ข้อความและรูปภาพ สําหรับรายละเอียดเพิ่มเติม!

เนื่องจากการเรียนรู้ของเครื่องจะขึ้นอยู่กับคณิตศาสตร์และสถิติ เป็นเรื่องปกติที่จะคิดถึงแบบจําลองการเรียนรู้ของเครื่องในเงื่อนไขทางคณิตศาสตร์ โดยพื้นฐานแล้ว แบบจําลองการเรียนรู้ของเครื่องคือแอปพลิเคชันซอฟต์แวร์ที่ห่อหุ้ม ฟังก์ชัน เพื่อคํานวณค่าเอาต์พุตตามค่าอินพุตอย่างน้อยหนึ่งค่า กระบวนการกําหนดฟังก์ชันดังกล่าวเรียกว่าการฝึกอบรม หลังจากที่มีการกําหนดฟังก์ชัน แล้ว คุณสามารถใช้ฟังก์ชันเพื่อคาดการณ์ค่าใหม่ในกระบวนการที่เรียกว่า อนุมานได้

ลองสํารวจขั้นตอนที่เกี่ยวข้องในการฝึกอบรมและการอนุมาน

แผนภาพที่แสดงระยะการฝึกอบรมและการอนุมานในการเรียนรู้ของเครื่อง

  1. ข้อมูลการฝึกประกอบด้วยการสังเกตการณ์ที่ผ่านมา ในกรณีส่วนใหญ่ข้อสังเกตรวมถึงแอตทริบิวต์หรือ คุณสมบัติของ สิ่งที่สังเกตได้และค่าที่ทราบแล้วของสิ่งที่คุณต้องการฝึกแบบจําลองเพื่อคาดการณ์ (เรียกว่า ป้ายชื่อ)

    ในเงื่อนไขทางคณิตศาสตร์ คุณมักจะเห็นคุณลักษณะที่อ้างถึงโดยใช้ชื่อตัวแปรแบบย่อ x และป้ายชื่อที่เรียกกันว่า y โดยทั่วไปแล้ว การสังเกตการณ์ประกอบด้วยค่าคุณลักษณะหลายค่า ดังนั้น x จึงเป็นเวกเตอร์ (อาร์เรย์ที่มีหลายค่า) ดังนี้: [x1,x2,x3,...]

    เพื่อทําให้ชัดเจนยิ่งขึ้น ลองพิจารณาตัวอย่างที่อธิบายไว้ก่อนหน้านี้:

    • ในสถานการณ์การขายไอศกรีม เป้าหมายของเราคือการฝึกแบบจําลองที่สามารถคาดการณ์จํานวนยอดขายไอศกรีมตามสภาพอากาศได้ การวัดสภาพอากาศสําหรับวัน (อุณหภูมิ ปริมาณฝน ลม และอื่น ๆ) จะเป็น คุณลักษณะ (x) และจํานวนไอศกรีมที่ขายในแต่ละวันจะเป็น ป้ายชื่อ (y)
    • ในสถานการณ์ทางการแพทย์เป้าหมายคือการคาดเดาว่าผู้ป่วยมีความเสี่ยงของโรคเบาหวานตามการวัดทางคลินิกหรือไม่ การวัดของผู้ป่วย (น้ําหนักระดับน้ําตาลในเลือดและอื่น ๆ) เป็น คุณสมบัติ (x) และความเป็นไปได้ของโรคเบาหวาน (ตัวอย่างเช่น 1 สําหรับความเสี่ยง 0 ในกรณีที่ไม่ได้มีความเสี่ยง) คือ ป้ายชื่อ (y)
    • ในสถานการณ์การวิจัยแอนตาร์กติกเราต้องการคาดการณ์สายพันธุ์ของนกเพนกวินตามลักษณะทางกายภาพ การวัดที่สําคัญของนกเพนกวิน (ความยาวของครีบความกว้างของบิลและอื่น ๆ) เป็น คุณสมบัติ (x) และสายพันธุ์ (ตัวอย่างเช่น 0 สําหรับ Adelie, 1 สําหรับ Gentoo หรือ 2 สําหรับ Chinstrap) เป็น ป้ายชื่อ (y)
  2. อัลกอริทึมถูกนําไปใช้กับข้อมูลเพื่อพยายามกําหนดความสัมพันธ์ระหว่างคุณลักษณะและป้ายชื่อและปรับความสัมพันธ์นั้นให้เป็นทั่วไปในการคํานวณที่สามารถทําได้บน x เพื่อคํานวณ y อัลกอริทึมเฉพาะที่ใช้ขึ้นอยู่กับชนิดของปัญหาการคาดการณ์ที่คุณกําลังพยายามแก้ไข (เพิ่มเติมเกี่ยวกับเรื่องนี้ในภายหลัง) แต่หลักการพื้นฐานคือการพยายาม ให้พอดีกับข้อมูลลงใน ฟังก์ชันที่สามารถใช้ค่าของคุณลักษณะในการคํานวณป้ายชื่อ

  3. ผลลัพธ์ของอัลกอริทึมคือแบบจําลองที่ย่อส่วนการคํานวณที่ได้รับจากอัลกอริทึมเป็นฟังก์ชัน เรามาเรียกมันว่า f ในสัญประกาศทางคณิตศาสตร์:

    y = f(x)

  4. ตอนนี้ระยะ การฝึกอบรม เสร็จสมบูรณ์แล้ว แบบจําลองที่ได้รับการฝึกสามารถใช้สําหรับการ อนุมานได้ แบบจําลองเป็นโปรแกรมซอฟต์แวร์เป็นหลักที่ย่อส่วนฟังก์ชันที่ผลิตโดยกระบวนการฝึกอบรม คุณสามารถป้อนชุดของค่าคุณลักษณะและรับเป็นเอาต์พุตการคาดการณ์ของป้ายชื่อที่สอดคล้องกันได้ เนื่องจากผลลัพธ์จากแบบจําลองคือการคาดการณ์ที่คํานวณโดยฟังก์ชัน และไม่ใช่ค่าที่สังเกตได้ คุณจึงมักจะเห็นผลลัพธ์จากฟังก์ชันที่แสดงเป็น ŷ (ซึ่งค่อนข้างแสดงด้วยคําพูดอย่างน่าพอใจเป็น "หมวก y")