ทําความเข้าใจแนวคิดการเรียนรู้เชิงลึก

7 นาที

ในสมองของคุณคุณมีเซลล์ประสาทที่เรียกว่าเซลล์ประสาทซึ่งเชื่อมต่อกันด้วยส่วนขยายเส้นประสาทที่ส่งผ่านสัญญาณไฟฟ้าผ่านเครือข่าย

แผนภาพของสมองมนุษย์ที่มีเครือข่ายเซลล์ประสาท

เมื่อเซลล์ประสาทแรกในเครือข่ายถูกกระตุ้น สัญญาณอินพุตจะถูกประมวลผล และถ้าเกินเกณฑ์เฉพาะ, เซลล์ประสาทถูก เปิดใช้งาน และส่งผ่านสัญญาณบนเซลล์ประสาทที่เชื่อมต่ออยู่. เซลล์ประสาทเหล่านี้ในทางกลับอาจเปิดใช้งาน และส่งสัญญาณผ่านส่วนที่เหลือของเครือข่าย. เมื่อเวลาผ่านไปการเชื่อมต่อระหว่างเซลล์ประสาทแข็งแกร่งขึ้นโดยใช้บ่อยในขณะที่คุณเรียนรู้วิธีการตอบสนองอย่างมีประสิทธิภาพ ตัวอย่างเช่นหากคุณแสดงรูปภาพของนกเพนกวินการเชื่อมต่อเซลล์ประสาทของคุณช่วยให้คุณสามารถประมวลผลข้อมูลในภาพและความรู้เกี่ยวกับลักษณะของนกเพนกวินเพื่อระบุเป็นดังกล่าว เมื่อเวลาผ่านไปหากคุณแสดงรูปภาพสัตว์หลายตัวเครือข่ายเซลล์ประสาทที่เกี่ยวข้องในการระบุสัตว์ตามลักษณะแข็งแรงขึ้น กล่าวอีกนัยหนึ่งคุณจะระบุสัตว์ต่าง ๆ ได้อย่างถูกต้อง

การเรียนรู้เชิงลึกจะเลียนแบบกระบวนการทางชีวภาพนี้โดยใช้เครือข่ายประสาทเทียมที่ประมวลผลอินพุตตัวเลขแทนที่จะเป็นการกระตุ้นทางเคมีไฟฟ้า

แผนภาพของเครือข่ายประสาทเทียม

การเชื่อมต่อเส้นประสาทขาเข้าจะถูกแทนที่ด้วยข้อมูลป้อนเข้าตัวเลขที่โดยทั่วไปแล้วจะระบุเป็น x เมื่อมีค่าอินพุตมากกว่าหนึ่งค่า x ถือว่าเป็นเวกเตอร์ที่มีองค์ประกอบที่ชื่อ ว่า x₁, x₂ และอื่น ๆ

การเชื่อมโยงค่า x แต่ละค่าคือ น้ําหนัก (w) ซึ่งใช้เพื่อเสริมสร้างความเข้มแข็งหรือลดผลกระทบของค่า x เพื่อจําลองการเรียนรู้ นอกจากนี้ ยังมีการเพิ่มอินพุต อคติ (b) เพื่อเปิดใช้งานตัวควบคุมแบบละเอียดบนเครือข่าย ในระหว่างกระบวนการฝึกจะมีการปรับค่า w และ b เพื่อปรับแต่งเครือข่ายเพื่อให้ "เรียนรู้" เพื่อสร้างเอาต์พุตที่ถูกต้อง

เซลล์ประสาทเองห่อหุ้มฟังก์ชันที่คํานวณผลรวมถ่วงน้ําหนักของ x, w และ b ฟังก์ชันนี้จะล้อมรอบด้วยฟังก์ชันการเปิดใช้งาน ที่จํากัดผลลัพธ์ (มักจะเป็นค่าระหว่าง 0 และ 1) เพื่อกําหนดว่าเซลล์ประสาทผ่านเอาต์พุตไปยังชั้นถัดไปของเซลล์ประสาทในเครือข่ายหรือไม่

การฝึกแบบจําลองการเรียนรู้เชิงลึก

แบบจําลองการเรียนรู้เชิงลึกคือเครือข่ายประสาทที่ประกอบด้วยเซลล์ประสาทเทียมหลายชั้น แต่ละเลเยอร์แสดงถึงชุดของฟังก์ชันที่ดําเนินการกับค่า x ด้วยน้ําหนักและอคติ w ที่เกี่ยวข้อง และผลลัพธ์ของเลเยอร์สุดท้ายบนผลลัพธ์ของป้ายชื่อ y ที่แบบจําลองคาดการณ์ ในกรณีของแบบจําลอง การจัดประเภท (ซึ่งคาดการณ์ประเภทหรือ คลาส ที่น่าจะเป็นไปได้มากที่สุดสําหรับข้อมูลอินพุต) ผลลัพธ์คือเวกเตอร์ที่ประกอบด้วยความน่าจะเป็นสําหรับแต่ละคลาสที่เป็นไปได้

ไดอะแกรมต่อไปนี้แสดงถึงแบบจําลองการเรียนรู้เชิงลึกที่คาดการณ์คลาสของเอนทิตีข้อมูลโดยยึดตามคุณลักษณะสี่อย่าง (ค่า x ) ผลลัพธ์ของแบบจําลอง (ค่า y ) คือความน่าจะเป็นสําหรับป้ายชื่อระดับชั้นที่เป็นไปได้สามป้าย

ไดอะแกรมของเครือข่ายประสาท

ในการฝึกแบบจําลอง เฟรมเวิร์กการเรียนรู้เชิงลึกจะฟีดข้อมูลป้อนเข้าหลายชุด (ซึ่งรู้จักค่าป้ายชื่อจริง) จะใช้ฟังก์ชันในเลเยอร์เครือข่ายทั้งหมดและวัดความแตกต่างระหว่างความน่าจะเป็นของเอาต์พุตและป้ายชื่อระดับชั้นที่รู้จักจริงของข้อมูลการทดสอบการใช้งาน ความแตกต่างรวมระหว่างเอาต์พุตการคาดการณ์และป้ายชื่อจริงเรียกว่าการสูญเสีย

หลังจากคํานวณการสูญหายโดยรวมสําหรับชุดข้อมูลทั้งหมดแล้ว เฟรมเวิร์กการเรียนรู้เชิงลึกจะใช้ เครื่องมือเพิ่มประสิทธิภาพ เพื่อกําหนดว่าควรปรับน้ําหนักและความอคติในแบบจําลองอย่างไรเพื่อลดการสูญเสียโดยรวม การปรับแต่งเหล่านี้จะถูก ส่งต่อ ไปยังเลเยอร์ในรูปแบบเครือข่ายประสาทจากนั้นข้อมูลจะถูกส่งผ่านเครือข่ายอีกครั้งและการคํานวณการสูญเสียอีกครั้ง กระบวนการนี้ทําซ้ําหลายครั้ง (การทําซ้ําแต่ละครั้งเรียกว่า ยุค) จนกว่าจะลดการสูญเสียลงและแบบจําลองมี "เรียนรู้" น้ําหนักและอคติที่ถูกต้องเพื่อให้สามารถคาดการณ์ได้อย่างถูกต้อง

ในแต่ละยุคน้ําหนักและอคติจะถูกปรับเพื่อลดการสูญเสีย จํานวนเงินที่ปรับให้เหมาะสมถูกควบคุมโดย อัตราการเรียนรู้ ที่คุณระบุไว้ในตัวปรับให้เหมาะสม หากอัตราการเรียนรู้ต่ําเกินไป กระบวนการฝึกอบรมอาจใช้เวลานานในการกําหนดค่าที่เหมาะสม แต่ถ้าสูงเกินไป ตัวปรับให้เหมาะสมอาจไม่พบค่าที่เหมาะสม

คำติชม

หน้านี้มีประโยชน์หรือไม่