กําหนดปัญหา
เริ่มต้นด้วยขั้นตอนแรกคุณต้องการ กําหนดปัญหาที่ แบบจําลองควรแก้ไขโดยการทําความเข้าใจ:
- ผลลัพธ์ของแบบจําลองควรเป็นอย่างไร
- ชนิดของงานการเรียนรู้ของเครื่องที่คุณใช้
- เกณฑ์อะไรที่ทําให้แบบจําลองสําเร็จ
ขึ้นอยู่กับข้อมูลที่คุณมีและผลลัพธ์ที่คาดหวังของแบบจําลอง คุณสามารถระบุงานการเรียนรู้ของเครื่องได้ งานจะกําหนดชนิดของอัลกอริทึมที่คุณสามารถใช้ในการฝึกแบบจําลอง
งานการเรียนรู้ของเครื่องทั่วไปบางงานคือ:
- การจัดประเภท: คาดการณ์ค่าแบบจัดกลุ่ม
- การถดถอย: คาดการณ์ค่าตัวเลข
- การคาดการณ์แบบอนุกรมเวลา: คาดการณ์ค่าตัวเลขในอนาคตตามข้อมูลอนุกรมเวลา
- วิสัยทัศน์คอมพิวเตอร์: จัดประเภทรูปภาพหรือตรวจหาวัตถุในรูปภาพ
- การประมวลผลภาษาธรรมชาติ (NLP): แยกข้อมูลเชิงลึกจากข้อความ
ในการฝึกแบบจําลอง คุณมีชุดของอัลกอริทึมที่คุณสามารถใช้ได้ โดยขึ้นอยู่กับงานที่คุณต้องการดําเนินการ ในการประเมินแบบจําลอง คุณสามารถคํานวณเมตริกประสิทธิภาพการทํางาน เช่น ความแม่นยําหรือความแม่นยํา เมตริกที่พร้อมใช้งานยังขึ้นอยู่กับงานที่แบบจําลองของคุณต้องดําเนินการและช่วยให้คุณตัดสินใจว่าแบบจําลองจะประสบความสําเร็จในงานหรือไม่
สํารวจตัวอย่าง
พิจารณาสถานการณ์ที่คุณต้องการตรวจสอบว่าผู้ป่วยเป็นโรคเบาหวานหรือไม่ ปัญหาที่คุณกําลังพยายามแก้ไขและชนิดของข้อมูลที่พร้อมใช้งานจะกําหนดงานการเรียนรู้ของเครื่องที่คุณเลือก ในกรณีนี้ ข้อมูลที่มีอยู่คือจุดข้อมูลสุขภาพอื่น ๆ จากผู้ป่วย เราสามารถเป็นตัวแทนของเอาต์พุตที่เราต้องการเป็นข้อมูล ตามประเภท ที่ผู้ป่วยมีโรคเบาหวานหรือไม่มีโรคเบาหวาน ดังนั้นงานการเรียนรู้ของเครื่องคือการจําแนกประเภท
การทําความเข้าใจกระบวนการทั้งหมดก่อนที่คุณจะเริ่มให้โอกาสในการแมปการตัดสินใจที่คุณจําเป็นต้องทําเพื่อออกแบบโซลูชันการเรียนรู้ของเครื่องที่ประสบความสําเร็จ ต่อไปนี้เป็นแผนภาพที่แสดงวิธีหนึ่งในการเข้าถึงปัญหาในการระบุโรคเบาหวานในผู้ป่วย ในไดอะแกรม ข้อมูลจะถูกเตรียมไว้ล่วงหน้า แยก และฝึกฝนโดยใช้อัลกอริทึมเฉพาะ หลังจากนั้น แบบจําลองจะถูกประเมินเพื่อคุณภาพ
- โหลดข้อมูล: นําเข้าและตรวจสอบชุดข้อมูล
- ประมวลผลข้อมูลล่วงหน้า: ทําให้เป็นมาตรฐานและทําความสะอาดเพื่อความสอดคล้องกัน
- แยกข้อมูล: แยกเป็นชุดการฝึกและชุดการทดสอบ
- เลือกแบบจําลอง: เลือกและกําหนดค่าอัลกอริทึม
- ฝึกแบบจําลอง: เรียนรู้รูปแบบจากข้อมูลการฝึก
- แบบจําลองคะแนน: สร้างการคาดการณ์เกี่ยวกับข้อมูลทดสอบ
- ประเมิน: คํานวณเมตริกประสิทธิภาพการทํางาน
การฝึกแบบจําลองการเรียนรู้ของเครื่องมักจะเป็นกระบวนการวนซ้ํา ที่คุณทําตามขั้นตอนเหล่านี้หลายครั้งเพื่อค้นหาแบบจําลองที่มีประสิทธิภาพดีที่สุด ถัดไป เราลองตรวจสอบกระบวนการเตรียมข้อมูลสําหรับการพัฒนาโซลูชันการเรียนรู้ของเครื่อง