Xác định vấn đề

Đã hoàn thành

Bắt đầu với bước đầu tiên, bạn muốn xác định vấn đề mô hình nên giải quyết, bằng cách hiểu:

  • Đầu ra của mô hình phải là gì.
  • Loại tác vụ máy học bạn sử dụng.
  • Tiêu chí nào giúp mô hình thành công.

Tùy thuộc vào dữ liệu bạn có và đầu ra dự kiến của mô hình, bạn có thể xác định tác vụ machine learning. Nhiệm vụ sẽ xác định loại thuật toán bạn có thể sử dụng để đào tạo mô hình.

Một số tác vụ máy học phổ biến là:

Sơ đồ tổng quan về năm tác vụ máy học phổ biến.

  1. Phân loại: Dự đoán giá trị phân loại.
  2. Hồi quy: Dự đoán giá trị số.
  3. Dự báo chuỗi thời gian: Dự đoán các giá trị số trong tương lai dựa trên dữ liệu chuỗi thời gian.
  4. Thị giác máy tính: Phân loại hình ảnh hoặc phát hiện các đối tượng trong hình ảnh.
  5. Xử lý ngôn ngữ tự nhiên (NLP): Trích xuất thông tin chuyên sâu từ văn bản.

Để đào tạo một mô hình, bạn có một tập hợp các thuật toán mà bạn có thể sử dụng, tùy thuộc vào tác vụ bạn muốn thực hiện. Để đánh giá mô hình, bạn có thể tính toán các chỉ số hiệu suất như độ chính xác hoặc độ chính xác. Các số liệu có sẵn cũng phụ thuộc vào tác vụ mà mô hình của bạn cần thực hiện và giúp bạn quyết định xem một mô hình có thành công trong nhiệm vụ của mô hình hay không.

Khám phá ví dụ

Hãy xem xét một kịch bản mà bạn muốn xác định xem bệnh nhân có bị bệnh tiểu đường hay không. Vấn đề bạn đang tìm cách giải quyết và loại dữ liệu sẵn dùng sẽ quyết định tác vụ máy học bạn chọn. Trong trường hợp này, dữ liệu có sẵn là các điểm dữ liệu sức khỏe khác từ bệnh nhân. Chúng tôi có thể đại diện cho đầu ra mà chúng tôi muốn như là thông tin phân loại rằng bệnh nhân bị bệnh tiểu đường hoặc không có bệnh tiểu đường. Vì vậy, nhiệm vụ máy học là phân loại.

Hiểu toàn bộ quy trình trước khi bắt đầu mang đến cho bạn cơ hội để đưa ra các quyết định bạn cần thực hiện để thiết kế giải pháp máy học thành công. Sau đây là sơ đồ hiển thị một cách để tiếp cận vấn đề xác định bệnh tiểu đường ở bệnh nhân. Trong sơ đồ, dữ liệu được chuẩn bị, tách và được đào tạo bằng các thuật toán cụ thể. Sau đó, mô hình được đánh giá về chất lượng.

Sơ đồ hiển thị bảy bước để đào tạo mô hình.

  1. Tải dữ liệu: Nhập và kiểm tra tập dữ liệu.
  2. Xử lý trước dữ liệu: Chuẩn hóa và làm sạch cho nhất quán.
  3. Tách dữ liệu: Tách riêng thành các tập hợp đào tạo và kiểm tra.
  4. Chọn mô hình: Chọn và cấu hình thuật toán.
  5. Mô hình đào tạo: Học mẫu từ dữ liệu đào tạo.
  6. Mô hình điểm số: Tạo các dự đoán trên dữ liệu kiểm tra.
  7. Đánh giá: Tính toán số liệu hiệu suất.

Đào tạo một mô hình máy học thường là một quy trình lặp, nơi bạn thực hiện từng bước trong số này nhiều lần để tìm ra mô hình hiệu suất tốt nhất. Tiếp theo, chúng ta hãy kiểm tra quy trình chuẩn bị dữ liệu để phát triển một giải pháp máy học.