Ανάγνωση στα Αγγλικά

Κοινή χρήση μέσω


Συλλογή εικόνων

Για να εκπαιδεύσετε ένα μοντέλο εντοπισμού αντικειμένων ώστε να αναγνωρίζει τα αντικείμενά σας, πρέπει να συγκεντρώσετε εικόνες που περιέχουν εκείνα τα αντικείμενα. Για καλύτερα αποτελέσματα, τηρήστε τις κατευθυντήριες γραμμές για την ποσότητα και την ποιότητα των εικόνων.

Μορφή και μέγεθος

Οι εικόνες με τις οποίες θα τροφοδοτήσετε το μοντέλο εντοπισμού αντικειμένων σας πρέπει να έχουν τα εξής χαρακτηριστικά:

  • Μορφή:

    • JPG
    • PNG
    • BMP
  • Μέγεθος:

    • 6 MB το μέγιστο για εκπαίδευση
    • ελάχιστο πλάτος / ύψος 256 pixel x 256 pixel

Ποσότητα δεδομένων και ισορροπία δεδομένων

Η αποστολή αρκετών εικόνων για την εκπαίδευση του μοντέλου AI είναι πολύ σημαντική. Ένα καλό σημείο εκκίνησης είναι να έχετε τουλάχιστον 15 εικόνες ανά αντικείμενο για το σύνολο εκπαίδευσης. Με λιγότερες εικόνες, υπάρχει έντονος κίνδυνος το μοντέλο να εκπαιδευτεί με έννοιες που είναι απλώς άκυρες ή μη σχετικές. Η εκπαίδευση του μοντέλου σας με περισσότερες εικόνες πρέπει να αυξάνει την ακρίβεια.

Μια άλλη εκτίμηση είναι να βεβαιωθείτε ότι τα δεδομένα σας είναι ισορροπημένα. Εάν έχετε 500 εικόνες για ένα αντικείμενο και μόνο 50 εικόνες για ένα άλλο, το σύνολο δεδομένων εκπαίδευσης δεν είναι ισορροπημένο. Αυτό μπορεί να έχει ως αποτέλεσμα το μοντέλο να είναι καλύτερο στην αναγνώριση ενός από τα αντικείμενα. Για πιο συνεπή αποτελέσματα, διατηρήστε τουλάχιστον μια αναλογία 1:2 ανάμεσα στο αντικείμενο με τις λιγότερες εικόνες έναντι του αντικειμένου με τις περισσότερες. Για παράδειγμα, εάν το αντικείμενο με τον μεγαλύτερο αριθμό εικόνων έχει 500 εικόνες, το αντικείμενο με τις λιγότερες εικόνες πρέπει να έχει τουλάχιστον 250 εικόνες για εκπαίδευση.

Χρήση πιο διαφορετικών εικόνων

Δώστε εικόνες αντιπροσωπευτικές για το τι θα υποβληθεί στο μοντέλο κατά την κανονική χρήση. Για παράδειγμα, ας υποθέσουμε ότι εκπαιδεύετε ένα μοντέλο έτσι ώστε να αναγνωρίζει τα μήλα. Εάν το εκπαιδεύετε μόνο με εικόνες μήλων σε πιάτα, ενδέχεται να μην αναγνωρίζει με συνέπεια τα μήλα στα δένδρα. Η χρήση διαφορετικών ειδών εικόνων θα διασφαλίσει ότι το μοντέλο σας δεν είναι μεροληπτικό και μπορεί να γενικεύσει σωστά. Ακολουθούν μερικοί τρόποι με τους οποίους μπορείτε να κάνετε το σύνολο εκπαίδευσης πιο ποικιλόμορφο.

Φόντο

Χρησιμοποιήστε εικόνες των αντικειμένων σας μπροστά σε διαφορετικά φόντα—για παράδειγμα, φρούτα σε πιάτα, στα χέρια, σε δέντρα. Οι φωτογραφίες στο περιβάλλον είναι καλύτερες από τις φωτογραφίες που βρίσκονται μπροστά από ουδέτερο φόντο, επειδή παρέχουν περισσότερες πληροφορίες για τον αλγόριθμο ταξινόμησης.

Φόντα εικόνας.

Φωτισμός

Χρησιμοποιήστε εικόνες εκπαίδευσης που έχουν διαφορετικό φωτισμό, ειδικά εάν οι εικόνες που χρησιμοποιούνται για τον εντοπισμό μπορεί να έχουν διαφορετικό φωτισμό. Για παράδειγμα, συμπεριλάβετε φωτογραφίες που τραβήχτηκαν με φλας, υψηλή έκθεση και ούτω καθεξής. Επίσης, είναι χρήσιμο να συμπεριλάβετε εικόνες με ποικίλο κορεσμό, απόχρωση και φωτεινότητα. Κατά πάσα πιθανότητα, η κάμερα της συσκευής σας σάς επιτρέπει να ελέγχετε αυτές τις ρυθμίσεις.

Φωτισμός εικόνας.

Μέγεθος αντικειμένου

Προμηθεύστε εικόνες στις οποίες τα αντικείμενα έχουν διαφορετικά μεγέθη, αποτυπώνοντας διαφορετικά τμήματα του αντικειμένου—για παράδειγμα, μια φωτογραφία με τσαμπιά μπανάνες και ένα κοντινό πλάνο μίας μπανάνας. Τα διαφορετικά μεγέθη βοηθούν στην καλύτερη γενίκευση του μοντέλου.

Μεγέθη αντικειμένου.

Γωνία κάμερας

Προσπαθήστε να παρέχετε εικόνες που έχουν ληφθεί από διαφορετικές γωνίες. Εάν όλες οι φωτογραφίες σας προέρχονται από σταθερές κάμερες, όπως είναι οι κάμερες επιτήρησης, αντιστοιχίστε μια διαφορετική ετικέτα σε κάθε κάμερα. Αυτό μπορεί να σας βοηθήσει να αποφύγετε τη μοντελοποίηση άσχετων αντικειμένων, όπως είναι οι στύλοι φαναριών, ως το βασικό χαρακτηριστικό. Αντιστοιχίστε ετικέτες κάμερας, ακόμα και αν οι κάμερες καταγράφουν τα ίδια αντικείμενα.

Γωνίες κάμερας.

Μη αναμενόμενα αποτελέσματα

Τα μοντέλα AI μπορεί να μάθουν εσφαλμένα χαρακτηριστικά που είναι κοινά μεταξύ των εικόνων σας. Ας υποθέσουμε ότι θέλετε να δημιουργήσετε ένα μοντέλο το οποίο διακρίνει τα μήλα από τα εσπεριδοειδή. Αν χρησιμοποιείτε εικόνες μήλων στα χέρια και εσπεριδοειδών σε λευκά πιάτα, το μοντέλο ίσως εκπαιδευτεί ώστε να διακρίνει τα χέρια από τα λευκά πιάτα αντί για τα μήλα από τα εσπεριδοειδή.

Μη αναμενόμενα αποτελέσματα.

Για να διορθώσετε αυτό το πρόβλημα, χρησιμοποιήστε τις παραπάνω οδηγίες σχετικά με την εκπαίδευση με περισσότερες διαφορετικές εικόνες: Δώστε εικόνες με διαφορετικές γωνίες, φόντα, μέγεθος αντικειμένου, ομάδες και άλλες παραλλαγές.

Γρήγορα αποτελέσματα με τον εντοπισμό αντικειμένων