Condividi tramite


Usare ai.embed con pandas

La ai.embed funzione usa l'intelligenza artificiale generativa per convertire il testo in incorporamenti vettoriali. Questi vettori consentono all'intelligenza artificiale di comprendere le relazioni tra testi, in modo da poter cercare, raggruppare e confrontare il contenuto in base al significato anziché alla formulazione esatta. Con una singola riga di codice, è possibile generare incorporamenti vettoriali da una colonna in un dataframe.

Annotazioni

Informazioni generali

La ai.embed funzione estende la classe Pandas Series .

Per generare incorporamenti vettoriali di ogni riga di input, richiamare la funzione su una serie pandas o su una colonna di testo di un pandas DataFrame.

La funzione restituisce una serie pandas contenente incorporamenti, che può essere archiviata in una nuova colonna DataFrame.

Sintassi

df["embed"] = df["col1"].ai.embed()

Parametri

Nessuno.

Restituzioni

La funzione restituisce una serie pandas che contiene incorporamenti come matrice numpy di float-32 per ogni riga di testo di input. Il numero di elementi nella matrice dipende dalle dimensioni del modello di incorporamento, configurabili nelle funzioni di intelligenza artificiale

Example

# This code uses AI. Always review output for mistakes.

df = pd.DataFrame([
        "This duvet, lovingly hand-crafted from all-natural fabric, is perfect for a good night's sleep.",
        "Tired of friends judging your baking? With these handy-dandy measuring cups, you'll create culinary delights.",
        "Enjoy this *BRAND NEW CAR!* A compact SUV perfect for the professional commuter!"
    ], columns=["descriptions"])
    
df["embed"] = df["descriptions"].ai.embed()
display(df)

Questa cella di codice di esempio fornisce l'output seguente:

Screenshot di un frame di dati con colonne 'description' e 'embed'. La colonna 'embed' contiene incorporamenti per le descrizioni.