Κοινοποίηση μέσω


Χρησιμοποιήστε ai.similarity με pandas

Η ai.similarity συνάρτηση χρησιμοποιεί γενετικό AI για να συγκρίνει δύο εκφράσεις συμβολοσειρών και, στη συνέχεια, να υπολογίσει μια σημασιολογική βαθμολογία ομοιότητας. Χρησιμοποιεί μόνο μία γραμμή κώδικα. Μπορείτε να συγκρίνετε τιμές κειμένου από μία στήλη ενός DataFrame με μία κοινή τιμή κειμένου ή με τιμές κειμένου κατά ζεύγη σε μια άλλη στήλη.

Σημείωμα

Επισκόπηση

Η ai.similarity λειτουργία επεκτείνει την κατηγορία pandas Series .

Για να υπολογίσετε τη σημασιολογική ομοιότητα κάθε γραμμής εισόδου για μία κοινή τιμή κειμένου, καλέστε τη συνάρτηση σε μια στήλη κειμένου pandas DataFrame . Η συνάρτηση μπορεί επίσης να υπολογίσει τη σημασιολογική ομοιότητα κάθε σειράς για αντίστοιχες τιμές κατά ζεύγη σε μια άλλη στήλη που έχει τις ίδιες διαστάσεις με τη στήλη εισαγωγής.

Η συνάρτηση επιστρέφει μια σειρά πάντα που περιέχει βαθμολογίες ομοιότητας, οι οποίες μπορούν να αποθηκευτούν σε μια νέα στήλη DataFrame.

Σύνταξη

df["similarity"] = df["col1"].ai.similarity("value")

Παράμετροι

'Ονομα Περιγραφή
other
Απαραίτητο
Μια συμβολοσειρά που περιέχει είτε:
- Μια ενιαία κοινή τιμή κειμένου, η οποία χρησιμοποιείται για τον υπολογισμό των βαθμολογιών ομοιότητας για κάθε σειρά εισαγωγής.
- Μια άλλη σειρά pandas με τις ίδιες διαστάσεις με την είσοδο. Περιέχει τιμές κειμένου που χρησιμοποιούνται για τον υπολογισμό βαθμολογιών ομοιότητας κατά ζεύγη για κάθε γραμμή εισόδου.

Επιστρέφει

Η συνάρτηση επιστρέφει μια σειρά πάντα που περιέχει βαθμολογίες ομοιότητας για κάθε γραμμή κειμένου εισαγωγής. Οι βαθμολογίες ομοιότητας εξόδου είναι σχετικές και χρησιμοποιούνται καλύτερα για κατάταξη. Οι τιμές βαθμολογίας μπορεί να κυμαίνονται από -1 (αντίθετα) έως 1* (πανομοιότυπες). Μια τιμή βαθμολογίας του 0 υποδεικνύει ότι οι τιμές δεν σχετίζονται με το νόημα.

Παράδειγμα

# This code uses AI. Always review output for mistakes.

df = pd.DataFrame([ 
        ("Bill Gates"), 
        ("Satya Nadella"), 
        ("Joan of Arc")
    ], columns=["name"])
    
df["similarity"] = df["name"].ai.similarity("Microsoft")
display(df)

Αυτό το παράδειγμα κελιού κώδικα παρέχει την ακόλουθη έξοδο:

Στιγμιότυπο οθόνης ενός πλαισίου δεδομένων με στήλες