Compartir a través de


Uso de ai.fix_grammar con PySpark

La ai.fix_grammar función usa ia generativa para corregir la ortografía, gramática y puntuación del texto de entrada, con una sola línea de código.

Nota:

Información general

La ai.fix_grammar función está disponible para DataFrames de Spark. Debe especificar el nombre de una columna de entrada existente como parámetro.

La función devuelve un nuevo DataFrame que incluye texto corregido para cada fila de texto de entrada, almacenada en una columna de salida.

Syntax

df.ai.fix_grammar(input_col="input", output_col="corrections")

Parámetros

Nombre Description
input_col
Obligatorio
Cadena que contiene el nombre de una columna existente con valores de texto de entrada para corregir la ortografía, gramática y puntuación.
output_col
Opcional
Cadena que contiene el nombre de una nueva columna para almacenar texto corregido para cada fila de texto de entrada. Si no establece este parámetro, se genera un nombre predeterminado para la columna de salida.
error_col
Opcional
La cadena que contiene el nombre de una nueva columna para almacenar los errores de OpenAI que resultan del procesamiento de cada fila de texto de entrada. Si no establece este parámetro, se genera un nombre predeterminado para la columna de error. Si no hay ningún error para una fila de entrada, el valor de esta columna es null.

Devoluciones

La función devuelve un DataFrame de Spark que incluye una nueva columna que contiene texto corregido para cada fila de texto de la columna de entrada. Si el texto de entrada es null, el resultado es null.

Example

# This code uses AI. Always review output for mistakes.

df = spark.createDataFrame([
        ("There are an error here.",),
        ("She and me go weigh back. We used to hang out every weeks.",),
        ("The big picture are right, but you're details is all wrong.",)
    ], ["text"])

results = df.ai.fix_grammar(input_col="text", output_col="corrections")
display(results)

Esta celda de código de ejemplo proporciona la siguiente salida:

Captura de pantalla que muestra un marco de datos con una columna