Sdílet prostřednictvím


Použití ai.embed s pandas

Funkce ai.embed používá generující AI k převodu textu na vektorové vkládání. Tyto vektory umožňují umělé inteligenci porozumět vztahům mezi texty, takže můžete vyhledávat, seskupovat a porovnávat obsah na základě významu, a ne přesného formulace. S jedním řádkem kódu můžete vygenerovat vektorové vkládání ze sloupce do datového rámce.

Poznámka:

Přehled

Funkce ai.embed rozšiřuje třídu pandas Series.

Pokud chcete vygenerovat vektorové reprezentace jednotlivých vstupních řádků, zavolejte funkci buď na pandas Series nebo na textovém sloupci pandas DataFrame.

Funkce vrátí řadu pandas, která obsahuje vložené objekty, které lze uložit do nového sloupce datového rámce.

Syntaxe

df["embed"] = df["col1"].ai.embed()

Parametry

Žádné.

Návraty

Funkce vrátí řadu pandas , která obsahuje vložené hodnoty jako numpy pole float-32 pro každý vstupní textový řádek. Počet prvků v poli závisí na dimenzích vloženého modelu, které lze konfigurovat ve funkcích AI.

Example

# This code uses AI. Always review output for mistakes.

df = pd.DataFrame([
        "This duvet, lovingly hand-crafted from all-natural fabric, is perfect for a good night's sleep.",
        "Tired of friends judging your baking? With these handy-dandy measuring cups, you'll create culinary delights.",
        "Enjoy this *BRAND NEW CAR!* A compact SUV perfect for the professional commuter!"
    ], columns=["descriptions"])
    
df["embed"] = df["descriptions"].ai.embed()
display(df)

Tato ukázková buňka kódu poskytuje následující výstup:

Snímek obrazovky s datovým rámcem se sloupci 'descriptions' a 'embed'. Sloupec 'embed' obsahuje vložené reprezentace pro popisy.