Sdílet prostřednictvím


Použití ai.similarity s knihovnou pandas

Funkce ai.similarity používá generující AI k porovnání dvou řetězcových výrazů a následnému výpočtu sémantického skóre podobnosti. Používá pouze jeden řádek kódu. Textové hodnoty z jednoho sloupce datového rámce můžete porovnat s jednou běžnou textovou hodnotou nebo s párovými textovými hodnotami v jiném sloupci.

Poznámka:

Přehled

Funkce ai.similarity rozšiřuje třídu pandas Series.

Pokud chcete vypočítat sémantickou podobnost každého vstupního řádku pro jednu společnou textovou hodnotu, zavolejte funkci v textovém sloupci datového rámce pandas . Funkce může také vypočítat sémantickou podobnost každého řádku pro odpovídající párové hodnoty v jiném sloupci, který má stejné dimenze jako vstupní sloupec.

Funkce vrátí řadu pandas, která obsahuje skóre podobnosti, která se dají uložit do nového sloupce datového rámce.

Syntaxe

df["similarity"] = df["col1"].ai.similarity("value")

Parametry

Název Description
other
Povinné
Řetězec, který obsahuje:
– Jedna společná textová hodnota, která se používá k výpočtu skóre podobnosti pro každý vstupní řádek.
- Další řada pandas se stejnými rozměry jako vstup. Obsahuje textové hodnoty, které se mají použít k výpočtu skóre párové podobnosti pro každý vstupní řádek.

Návraty

Funkce vrátí řadu pandas , která obsahuje skóre podobnosti pro každý vstupní textový řádek. Skóre podobnosti výstupu jsou relativní a nejlépe se používají pro hodnocení. Hodnoty skóre můžou být v rozsahu od -1 (protilehlých) až 1* po (identické). Hodnota 0 skóre značí, že hodnoty nesouvisejí ve významu.

Example

# This code uses AI. Always review output for mistakes.

df = pd.DataFrame([ 
        ("Bill Gates"), 
        ("Satya Nadella"), 
        ("Joan of Arc")
    ], columns=["name"])
    
df["similarity"] = df["name"].ai.similarity("Microsoft")
display(df)

Tato ukázková buňka kódu poskytuje následující výstup:

Snímek obrazovky s datovým rámcem se sloupci 'name' a 'similarity'. Sloupec 'similarity' obsahuje skóre podobnosti pro jména a vstupní slovo.