Chia sẻ qua


Cải thiện hiệu suất của mô hình phân loại danh mục của bạn

Nếu hiệu suất mô hình của bạn không như mong muốn, bạn có thể thử một số điều sau. Những mẹo này có thể giúp bạn điều chỉnh mô hình để cải thiện khả năng dự đoán của nó.

Thêm dữ liệu đào tạo được dán nhãn chính xác hơn

Dữ liệu đào tạo được dán nhãn càng chính xác thì mô hình của bạn sẽ hoạt động càng tốt. Ví dụ, giả sử bạn có nhãn Có/Không. Nếu hầu hết dữ liệu của bạn chỉ có trong cột này, thì mô hình AI của bạn có thể sẽ không học được nhiều từ dữ liệu này. Nếu dữ liệu của bạn không được dán nhãn chính xác, mô hình có thể sẽ không học tốt. Tốt nhất là nên bắt đầu với một tập hợp nhỏ các ví dụ được dán nhãn chính xác - có thể là 100 ví dụ hoặc ít hơn. Từ đó, bạn có thể tiếp tục nhân đôi số lượng ví dụ theo từng lần lặp lại và đào tạo lại sau mỗi lần, ghi nhận sự thay đổi về hiệu suất. Nói chung, càng nhiều dữ liệu thì càng tốt, nhưng việc thêm dữ liệu sẽ có xu hướng giảm dần khi tập dữ liệu của bạn càng lớn.

Thêm mẹo

  • Hãy đảm bảo việc sử dụng thẻ của bạn được cân bằng trong dữ liệu đào tạo. Ví dụ: Bạn có bốn thẻ cho 100 mục văn bản. Hai thẻ đầu tiên (tag1tag2) được sử dụng cho 90 mục văn bản, nhưng hai thẻ còn lại (tag3tag4) chỉ được sử dụng cho 10 mục văn bản còn lại. Việc thiếu cân bằng có thể khiến mô hình của bạn gặp khó khăn trong việc dự đoán chính xác thẻ3 hoặc thẻ4.
  • Hãy đảm bảo rằng bạn đào tạo mô hình của mình bằng dữ liệu tương tự với mục đích mà bạn mong muốn sử dụng mô hình.

Bước tiếp theo

Xuất bản mô hình phân loại danh mục của bạn

Mô hình phân loại danh mục được xây dựng sẵn