Usare ai.similarity con pandas

La ai.similarity funzione usa l'intelligenza artificiale generativa per confrontare due espressioni stringa e quindi calcolare un punteggio di somiglianza semantica. Usa solo una singola riga di codice. È possibile confrontare i valori di testo di una colonna di un dataframe con un singolo valore di testo comune o con valori di testo abbinati in un'altra colonna.

Annotazioni

Questo articolo illustra l'uso di ai.similarity con pandas. Per usare ai.similarity con PySpark, vedere questo articolo.
Vedere altre funzioni di intelligenza artificiale in questo articolo di panoramica.
Informazioni su come personalizzare la configurazione delle funzioni di intelligenza artificiale.

Informazioni generali

La ai.similarity funzione estende la classe Pandas Series .

Per calcolare la somiglianza semantica di ogni riga di input per un singolo valore di testo comune, chiamare la funzione in una colonna di testo Pandas DataFrame . La funzione può anche calcolare la somiglianza semantica di ogni riga per i valori pairwise corrispondenti in un'altra colonna con le stesse dimensioni della colonna di input.

La funzione restituisce una serie pandas che contiene punteggi di somiglianza, che possono essere archiviati in una nuova colonna DataFrame.

df["similarity"] = df["col1"].ai.similarity("value")

df["similarity"] = df["col1"].ai.similarity(df["col2"])

Parametri

Nome	Description
`other` Obbligatorio	Stringa che contiene uno dei due elementi seguenti: - Singolo valore di testo comune, usato per calcolare i punteggi di somiglianza per ogni riga di input. - Un'altra serie pandas con le stesse dimensioni dell'input. Contiene valori di testo da usare per calcolare i punteggi di somiglianza pairwise per ogni riga di input.

Restituzioni

La funzione restituisce una serie pandas che contiene punteggi di somiglianza per ogni riga di testo di input. I punteggi di somiglianza dell'output sono relativi e vengono usati meglio per la classificazione. I valori di punteggio possono variare da -1 (opposti) a 1* (identici). Un valore di punteggio di 0 indica che i valori non sono correlati nel significato.

Example

Confrontare con un singolo valore
Confrontare i valori a coppie

# This code uses AI. Always review output for mistakes.

df = pd.DataFrame([ 
        ("Bill Gates"), 
        ("Satya Nadella"), 
        ("Joan of Arc")
    ], columns=["name"])
    
df["similarity"] = df["name"].ai.similarity("Microsoft")
display(df)

Questa cella di codice di esempio fornisce l'output seguente:

# This code uses AI. Always review output for mistakes.

df = pd.DataFrame([ 
        ("Bill Gates", "Technology"), 
        ("Satya Nadella", "Healthcare"), 
        ("Joan of Arc", "Agriculture") 
    ], columns=["names", "industries"])
    
df["similarity"] = df["names"].ai.similarity(df["industries"])
display(df)

Questa cella di codice di esempio fornisce l'output seguente:

Usare ai.similarity con PySpark.
Rilevare il sentiment con ai.analyze_sentiment.
Classificare il testo con ai.classify.
Generare incorporamenti vettoriali con ai.embed.
Estrarre entità con ai_extract.
Correggere la grammatica con ai.fix_grammar.
Rispondere alle richieste dell'utente personalizzate con ai.generate_response.
Riepilogare il testo con ai.summarize.
Tradurre il testo con ai.translate.
Altre informazioni sul set completo di funzioni di intelligenza artificiale.
Personalizzare la configurazione delle funzioni di intelligenza artificiale.
Abbiamo perso una funzionalità necessaria? Suggeriscilo nel forum Fabric Ideas.

Commenti e suggerimenti

Questa pagina è stata utile?

Last updated on 2025-11-13