Đọc bằng tiếng Anh

Chia sẻ qua


Thu thập hình ảnh

Để đào tạo mô hình Phát hiện đối tượng để nhận dạng đối tượng của bạn, bạn phải thu thập hình ảnh có chứa các đối tượng đó. Tuân thủ các nguyên tắc về số lượng và chất lượng hình ảnh để có kết quả tốt hơn.

Định dạng và kích thước

Những hình ảnh bạn sẽ cung cấp cho mô hình Phát hiện đối tượng của mình cần có những đặc điểm sau:

  • Định dạng:

    • JPG
    • PNG
    • BMP
  • Kích thước:

    • Tối đa 6 MB cho đào tạo
    • Chiều rộng / chiều cao tối thiểu 256 pixel x 256 pixel

Số lượng dữ liệu và cân bằng dữ liệu

Điều quan trọng là tải lên đủ hình ảnh để huấn luyện mô hình AI của bạn. Điểm khởi đầu tốt là có ít nhất 15 hình ảnh cho mỗi đối tượng trong tập huấn luyện. Với ít hình ảnh hơn, mô hình của bạn có nguy cơ cao sẽ học các khái niệm nhiễu hoặc không liên quan. Đào tạo mô hình của bạn với nhiều hình ảnh hơn sẽ tăng độ chính xác.

Một cân nhắc khác là đảm bảo dữ liệu của bạn được cân bằng. Nếu bạn có 500 hình ảnh cho một đối tượng và chỉ có 50 hình ảnh cho đối tượng khác thì tập dữ liệu huấn luyện của bạn không cân bằng. Điều này có thể khiến mô hình nhận dạng một trong các đối tượng tốt hơn. Để có kết quả nhất quán hơn, hãy duy trì tỷ lệ ít nhất là 1:2 giữa đối tượng có ít hình ảnh nhất và đối tượng có nhiều hình ảnh nhất. Ví dụ: nếu đối tượng có số lượng hình ảnh lớn nhất có 500 hình ảnh thì đối tượng có ít hình ảnh nhất phải có ít nhất 250 hình ảnh để huấn luyện.

Sử dụng hình ảnh đa dạng hơn

Cung cấp hình ảnh đại diện cho những gì sẽ được gửi tới mô hình trong quá trình sử dụng bình thường. Ví dụ: giả sử bạn đang đào tạo một mô hình để nhận biết táo. Nếu bạn chỉ huấn luyện hình ảnh những quả táo trên đĩa, nó có thể không nhận dạng được những quả táo trên cây một cách nhất quán. Việc bao gồm các loại hình ảnh khác nhau sẽ đảm bảo rằng mô hình của bạn không bị sai lệch và có thể khái quát hóa tốt. Sau đây là một số cách bạn có thể làm cho tập huấn luyện của mình đa dạng hơn.

Nền

Sử dụng hình ảnh của các đồ vật của bạn trước các nền khác nhau—ví dụ: trái cây trên đĩa, trên tay và trên cây. Ảnh có bối cảnh tốt hơn ảnh có nền trung tính vì chúng cung cấp nhiều thông tin hơn cho bộ phân loại.

Hình nền.

Thắp sáng

Sử dụng hình ảnh đào tạo có ánh sáng khác nhau, đặc biệt nếu hình ảnh dùng để phát hiện có thể có ánh sáng khác nhau. Ví dụ: bao gồm các hình ảnh được chụp bằng đèn flash, độ phơi sáng cao, v.v. Việc bao gồm các hình ảnh có độ bão hòa, màu sắc và độ sáng khác nhau cũng rất hữu ích. Camera trên thiết bị của bạn có thể cho phép bạn kiểm soát các cài đặt này.

Chiếu sáng hình ảnh.

Kích thước đối tượng

Cung cấp hình ảnh trong đó các vật thể có kích thước khác nhau, chụp các phần khác nhau của vật thể—ví dụ: ảnh chụp những chùm chuối và ảnh cận cảnh của một quả chuối. Kích thước khác nhau giúp mô hình khái quát hóa tốt hơn.

Kích thước đối tượng.

Góc máy ảnh

Cố gắng cung cấp hình ảnh được chụp từ các góc độ khác nhau. Nếu tất cả ảnh của bạn là từ một bộ camera cố định, chẳng hạn như camera giám sát, hãy gán nhãn khác nhau cho mỗi camera. Điều này có thể giúp tránh lập mô hình các đối tượng không liên quan như cột đèn làm đặc điểm chính. Gán nhãn camera ngay cả khi các camera chụp cùng một đối tượng.

Các gốc máy quay.

Kết quả ngoài mong đợi

Các mô hình AI có thể tìm hiểu không chính xác các đặc điểm chung của hình ảnh của bạn. Giả sử bạn muốn tạo một mô hình để phân biệt táo với cam quýt. Nếu bạn sử dụng hình ảnh quả táo trên tay và quả cam quýt trên đĩa trắng, mô hình có thể huấn luyện tay so với đĩa trắng thay vì táo so với cam quýt.

Kết quả bất ngờ.

Để khắc phục điều này, hãy sử dụng hướng dẫn ở trên về đào tạo với các hình ảnh đa dạng hơn: cung cấp hình ảnh với các góc, nền, kích thước đối tượng, nhóm và các biến thể khác.

Bắt đầu với Phát hiện đối tượng