Compartir a través de


Uso de ai.embed con pandas

La función ai.embed usa IA generativa para convertir texto en representaciones vectoriales. Estos vectores permiten a la inteligencia artificial comprender las relaciones entre los textos, por lo que puede buscar, agrupar y comparar contenido en función del significado en lugar de la redacción exacta. Con una sola línea de código, puede generar incrustaciones vectoriales a partir de una columna de un dataframe.

Nota:

Información general

La función ai.embed extiende la clase de la serie de pandas.

Para generar incrustaciones vectoriales de cada fila de entrada, llame a la función en una serie pandas o en una columna de texto de Pandas DataFrame.

La función devuelve una serie pandas que contiene incrustaciones, que se pueden almacenar en una nueva columna DataFrame.

Syntax

df["embed"] = df["col1"].ai.embed()

Parámetros

Ninguno.

Devoluciones

La función devuelve una serie pandas que contiene embeddings como un array de numpy de tipo float-32 para cada fila de texto de la entrada. El número de elementos de la matriz depende de las dimensiones del modelo de inserción, que se pueden configurar en las funciones de IA.

Example

# This code uses AI. Always review output for mistakes.

df = pd.DataFrame([
        "This duvet, lovingly hand-crafted from all-natural fabric, is perfect for a good night's sleep.",
        "Tired of friends judging your baking? With these handy-dandy measuring cups, you'll create culinary delights.",
        "Enjoy this *BRAND NEW CAR!* A compact SUV perfect for the professional commuter!"
    ], columns=["descriptions"])
    
df["embed"] = df["descriptions"].ai.embed()
display(df)

Esta celda de código de ejemplo proporciona la siguiente salida:

Captura de pantalla de una trama de datos con columnas