Bruk ai.similarity med pandaer

Funksjonen ai.similarity bruker generativ AI til å sammenligne to strenguttrykk og deretter beregne en semantisk likhetspoengsum. Den bruker bare en enkelt kodelinje. Du kan sammenligne tekstverdier fra én kolonne i en DataFrame med én felles tekstverdi eller med tekstverdier i en annen kolonne.

Note

Denne artikkelen dekker bruk av ai.similarity med pandaer. For å bruke ai.similarity med PySpark, se denne artikkelen.
Se andre AI-funksjoner i denne oversiktsartikkelen.
Lær hvordan du tilpasser konfigurasjonen av AI-funksjoner.

Oversikt

Funksjonen ai.similarityutvider pandas Series-klassen .

Hvis du vil beregne den semantiske likheten til hver inndatarad for én enkelt felles tekstverdi, kaller du funksjonen på en pandas DataFrame-tekstkolonne . Funksjonen kan også beregne den semantiske likheten til hver rad for tilsvarende parvise verdier i en annen kolonne som har samme dimensjoner som inndatakolonnen.

Funksjonen returnerer en pandaserie som inneholder likhetspoengsum, som kan lagres i en ny DataFrame-kolonne.

df["similarity"] = df["col1"].ai.similarity("value")

df["similarity"] = df["col1"].ai.similarity(df["col2"])

Parametere

Name	Beskrivelse
`other` Obligatorisk	En streng som inneholder enten: - En enkelt felles tekstverdi, som brukes til å beregne likhetspoeng for hver inndatarad. - En annen pandaserie med samme dimensjoner som inngangen. Den inneholder tekstverdier som skal brukes til å beregne parvise likhetspoeng for hver inndatarad.

Returnerer

Funksjonen returnerer en pandaserie som inneholder likhetspoeng for hver inndatatekstrad. Resultatene for utdatasamsentitet er relative, og de brukes best til rangering. Poengverdier kan variere fra -1 (motsetninger) til 1* (identiske). En poengsumverdi på 0 indikerer at verdiene ikke er relatert i betydning.

Eksempel

Sammenlign med én enkelt verdi
Sammenlign med parvise verdier

# This code uses AI. Always review output for mistakes.

df = pd.DataFrame([ 
        ("Bill Gates"), 
        ("Satya Nadella"), 
        ("Joan of Arc")
    ], columns=["name"])
    
df["similarity"] = df["name"].ai.similarity("Microsoft")
display(df)

Denne eksempelkodecellen gir følgende utdata:

# This code uses AI. Always review output for mistakes.

df = pd.DataFrame([ 
        ("Bill Gates", "Technology"), 
        ("Satya Nadella", "Healthcare"), 
        ("Joan of Arc", "Agriculture") 
    ], columns=["names", "industries"])
    
df["similarity"] = df["names"].ai.similarity(df["industries"])
display(df)

Denne eksempelkodecellen gir følgende utdata:

Bruk ai.similarity med PySpark.
Oppdag sentiment med ai.analyze_sentiment.
Kategoriser tekst med ai.classify.
Generer vektorinnlegginger med ai.embed.
Trekk ut enheter med ai_extract.
Fiks grammatikk med ai.fix_grammar.
Svar på egendefinerte brukermeldinger med ai.generate_response.
Oppsummer tekst med ai.summarize.
Oversett tekst med ai.translate.
Finn ut mer om hele settet med AI-funksjoner.
Tilpass konfigurasjonen av AI-funksjoner.
Gikk vi glipp av en funksjon du trenger? Foreslå det på Fabric Ideas-forumet.

Tilbakemeldinger

Var denne siden nyttig?

Last updated on 2025-11-21