Cải thiện các mô hình bằng siêu ký tự đại diện
Các mô hình đơn giản với các tập dữ liệu nhỏ thường có thể phù hợp trong một bước duy nhất, trong khi các tập dữ liệu lớn hơn và mô hình phức tạp hơn phải phù hợp bằng cách sử dụng nhiều lần mô hình với dữ liệu đào tạo và so sánh đầu ra với nhãn dự kiến. Nếu dự đoán đủ chính xác, chúng tôi sẽ xem xét mô hình đã được đào tạo. Nếu không, chúng tôi sẽ điều chỉnh mô hình một chút và lặp lại.
Hyperparameters là các giá trị thay đổi cách mô hình phù hợp trong những vòng lặp này. Ví dụ, tốc độ học tập là một siêu ký tự đặt số lượng mô hình được điều chỉnh trong mỗi chu kỳ đào tạo. Một tỷ lệ học tập cao có nghĩa là một mô hình có thể được đào tạo nhanh hơn; nhưng nếu nó quá cao, các điều chỉnh có thể lớn đến mức mô hình không bao giờ "tinh chỉnh" và không tối ưu.
Xử lý trước dữ liệu
Xử lý trước đề cập đến những thay đổi bạn thực hiện cho dữ liệu của mình trước khi thông qua mô hình. Trước đây, chúng tôi đã đọc rằng quá trình xử lý trước có thể liên quan đến việc làm sạch tập dữ liệu của bạn. Mặc dù điều này rất quan trọng, việc xử lý trước cũng có thể bao gồm việc thay đổi định dạng dữ liệu của bạn để mô hình dễ sử dụng hơn. Ví dụ: dữ liệu được mô tả là "đỏ," "cam", "vàng", "chanh" và "xanh lá cây" có thể hoạt động tốt hơn nếu được chuyển đổi thành định dạng có nguồn gốc từ máy tính hơn, chẳng hạn như các số cho biết màu đỏ và màu xanh lục.
Tính năng xác định tỷ lệ
Bước xử lý trước phổ biến nhất là co giãn các tính năng để chúng nằm trong khoảng từ 0 đến một. Ví dụ, trọng lượng của một chiếc xe đạp và khoảng cách một người đi trên một chiếc xe đạp có thể là hai số rất khác nhau, nhưng bằng cách xác định cả hai số ở giữa không và một cho phép các mô hình tìm hiểu hiệu quả hơn từ dữ liệu.
Sử dụng thể loại làm tính năng
Trong máy học, bạn cũng có thể sử dụng các tính năng phân loại như "xe đạp", "ván trượt" hoặc "xe hơi". Các tính năng này được thể hiện bằng các giá trị 0 hoặc 1 các véc-tơ một nóng; các véc-tơ có số 0 hoặc 1 cho mỗi giá trị có thể xảy ra. Ví dụ: xe đạp, ván trượt và xe hơi có thể tương ứng (1,0,0), (0,1,0) và (0,0,1).