Använd ai.embed med pandas

Funktionen ai.embed använder generativ AI för att konvertera text till vektorbäddningar. Med dessa vektorer kan AI förstå relationer mellan texter, så att du kan söka, gruppera och jämföra innehåll baserat på innebörd snarare än exakta formuleringar. Med en enda kodrad kan du generera vektorbäddningar från en kolumn i en DataFrame.

Anmärkning

Översikt

Klassen ai.embed utökas av funktionen .

Om du vill generera vektorinbäddningar för varje indatarad anropar du funktionen på antingen en Pandas-serie eller en textkolumn i Pandas DataFrame.

Funktionen returnerar en Pandas-serie som innehåller inbäddningar, som kan lagras i en ny DataFrame-kolumn.

Syntax

df["embed"] = df["col1"].ai.embed()

Parameterar

Ingen.

Retur

Funktionen returnerar en Pandas-serie som innehåller inbäddningar som numpy-matris med float-32 för varje indatatextrad. Antalet element i matrisen beror på inbäddningsmodellens dimensioner, som kan konfigureras i AI-funktioner

Example

# This code uses AI. Always review output for mistakes.

df = pd.DataFrame([
        "This duvet, lovingly hand-crafted from all-natural fabric, is perfect for a good night's sleep.",
        "Tired of friends judging your baking? With these handy-dandy measuring cups, you'll create culinary delights.",
        "Enjoy this *BRAND NEW CAR!* A compact SUV perfect for the professional commuter!"
    ], columns=["descriptions"])
    
df["embed"] = df["descriptions"].ai.embed()
display(df)

Den här exempelkodcellen innehåller följande utdata:

Skärmbild av en dataram med kolumnerna