Σημείωση
Η πρόσβαση σε αυτή τη σελίδα απαιτεί εξουσιοδότηση. Μπορείτε να δοκιμάσετε να συνδεθείτε ή να αλλάξετε καταλόγους.
Η πρόσβαση σε αυτή τη σελίδα απαιτεί εξουσιοδότηση. Μπορείτε να δοκιμάσετε να αλλάξετε καταλόγους.
Η ai.similarity συνάρτηση χρησιμοποιεί γενετικό AI για να συγκρίνει δύο εκφράσεις συμβολοσειρών και, στη συνέχεια, να υπολογίσει μια σημασιολογική βαθμολογία ομοιότητας. Χρησιμοποιεί μόνο μία γραμμή κώδικα. Μπορείτε να συγκρίνετε τιμές κειμένου από μία στήλη ενός DataFrame με μία κοινή τιμή κειμένου ή με τιμές κειμένου κατά ζεύγη σε μια άλλη στήλη.
Σημείωμα
- Αυτό το άρθρο καλύπτει τη χρήση του ai.similarity με τα πάντα. Για να χρησιμοποιήσετε το ai.similarity με το PySpark, ανατρέξτε σε αυτό το άρθρο.
- Δείτε άλλες λειτουργίες AI σε αυτό το άρθρο επισκόπησης.
- Μάθετε πώς μπορείτε να προσαρμόσετε τη διαμόρφωση των λειτουργιών AI.
Επισκόπηση
Η ai.similarity λειτουργία επεκτείνει την κατηγορία pandas Series .
Για να υπολογίσετε τη σημασιολογική ομοιότητα κάθε γραμμής εισόδου για μία κοινή τιμή κειμένου, καλέστε τη συνάρτηση σε μια στήλη κειμένου pandas DataFrame . Η συνάρτηση μπορεί επίσης να υπολογίσει τη σημασιολογική ομοιότητα κάθε σειράς για αντίστοιχες τιμές κατά ζεύγη σε μια άλλη στήλη που έχει τις ίδιες διαστάσεις με τη στήλη εισαγωγής.
Η συνάρτηση επιστρέφει μια σειρά πάντα που περιέχει βαθμολογίες ομοιότητας, οι οποίες μπορούν να αποθηκευτούν σε μια νέα στήλη DataFrame.
Σύνταξη
df["similarity"] = df["col1"].ai.similarity("value")
Παράμετροι
| 'Ονομα | Περιγραφή |
|---|---|
other Απαραίτητο |
Μια συμβολοσειρά που περιέχει είτε: - Μια ενιαία κοινή τιμή κειμένου, η οποία χρησιμοποιείται για τον υπολογισμό των βαθμολογιών ομοιότητας για κάθε σειρά εισαγωγής. - Μια άλλη σειρά pandas με τις ίδιες διαστάσεις με την είσοδο. Περιέχει τιμές κειμένου που χρησιμοποιούνται για τον υπολογισμό βαθμολογιών ομοιότητας κατά ζεύγη για κάθε γραμμή εισόδου. |
Επιστρέφει
Η συνάρτηση επιστρέφει μια σειρά πάντα που περιέχει βαθμολογίες ομοιότητας για κάθε γραμμή κειμένου εισαγωγής. Οι βαθμολογίες ομοιότητας εξόδου είναι σχετικές και χρησιμοποιούνται καλύτερα για κατάταξη. Οι τιμές βαθμολογίας μπορεί να κυμαίνονται από -1 (αντίθετα) έως 1* (πανομοιότυπες). Μια τιμή βαθμολογίας του 0 υποδεικνύει ότι οι τιμές δεν σχετίζονται με το νόημα.
Παράδειγμα
# This code uses AI. Always review output for mistakes.
df = pd.DataFrame([
("Bill Gates"),
("Satya Nadella"),
("Joan of Arc")
], columns=["name"])
df["similarity"] = df["name"].ai.similarity("Microsoft")
display(df)
Αυτό το παράδειγμα κελιού κώδικα παρέχει την ακόλουθη έξοδο:
Σχετικό περιεχόμενο
Χρησιμοποιήστε το ai.similarity με το PySpark.
Εντοπίστε το συναίσθημα με ai.analyze_sentiment.
Κατηγοριοποιήστε το κείμενο με το ai.classify.
Δημιουργήστε διανυσματικές ενσωματώσεις με το ai.embed.
Εξαγωγή οντοτήτων με ai_extract.
Διορθώστε τη γραμματική με ai.fix_grammar.
Απαντήστε σε προσαρμοσμένες προτροπές χρήστη με ai.generate_response.
Συνοψίστε το κείμενο με το ai.summarize.
Μεταφράστε κείμενο με το ai.translate.
Μάθετε περισσότερα σχετικά με το πλήρες σύνολο λειτουργιών AI.
Προσαρμόστε τη διαμόρφωση των λειτουργιών AI.
Χάσαμε κάποια δυνατότητα που χρειάζεστε; Προτείνετε το στο φόρουμ Ιδεών Fabric.