Zdieľať cez


Použite ai.embed s pandas

Funkcia ai.embed využíva generatívnu AI na prevod textu na vektorové embeddingy. Tieto vektory umožňujú AI pochopiť vzťahy medzi textami, takže môžete vyhľadávať, zoskupovať a porovnávať obsah na základe významu, nie presného znenia. Jedným riadkom kódu môžete generovať vektorové embeddingy zo stĺpca v DataFrame.

Poznámka

Prehľad

Táto ai.embed funkcia rozširuje triedu série pandas .

Na generovanie vektorových vkladov každého vstupného riadku zavolajte funkciu buď na sérii pandas, alebo na textovom stĺpci pandas DataFrame.

Funkcia vracia sériu pandas, ktorá obsahuje embeddingy, ktoré je možné uložiť do nového stĺpca DataFrame.

Syntax

df["embed"] = df["col1"].ai.embed()

Parametre

Žiadne.

Vrátené hodnoty

Funkcia vracia sériu pandas, ktorá obsahuje embeddingy ako numpy pole float-32 pre každý riadok vstupného textu. Počet prvkov v poli závisí od rozmerov modelu vkladania, ktoré sú konfigurovateľné v AI funkciách

Príklad

# This code uses AI. Always review output for mistakes.

df = pd.DataFrame([
        "This duvet, lovingly hand-crafted from all-natural fabric, is perfect for a good night's sleep.",
        "Tired of friends judging your baking? With these handy-dandy measuring cups, you'll create culinary delights.",
        "Enjoy this *BRAND NEW CAR!* A compact SUV perfect for the professional commuter!"
    ], columns=["descriptions"])
    
df["embed"] = df["descriptions"].ai.embed()
display(df)

Táto príkladová bunka kódu poskytuje nasledujúci výstup:

Snímka obrazovky dátového rámca so stĺpcami 'description' a 'embed'. Stĺpec 'embed' obsahuje embeddingy pre popisy.