Поделиться через


Используйте ai.translate с PySpark

Функция ai.translate использует генерированный ИИ для перевода входного текста на новый язык (выбранного вами) с одной строкой кода.

Замечание

Обзор

Функция ai.translate доступна для кадров данных Spark. Необходимо указать существующее имя входного столбца в качестве параметра вместе с целевым языком.

Функция возвращает новый кадр данных с переводами для каждой входной текстовой строки, хранящейся в выходном столбце.

Синтаксис

df.ai.translate(to_lang="spanish", input_col="text", output_col="translations")

Параметры

Имя Description
to_lang
Обязательно
Строка , представляющая целевой язык для перевода текста.
input_col
Обязательно
Строка, содержащая имя существующего столбца с входными текстовыми значениями для перевода.
output_col
Необязательно
Строка , содержащая имя нового столбца, в котором хранятся переводы для каждой входной текстовой строки. Если этот параметр не задан, имя по умолчанию создается для выходного столбца.
error_col
Необязательно
Строка, содержащая имя нового столбца, в котором хранятся ошибки OpenAI, возникающие в результате обработки каждой входной текстовой строки. Если этот параметр не задан, для столбца ошибок генерируется имя по умолчанию. Если во входной строке нет ошибок, то значение в этом столбце будет равно null.

Возвраты

Функция возвращает кадр данных Spark , содержащий новый столбец, содержащий переводы текста в строке входного столбца. Если входной текст null, результат null.

Example

# This code uses AI. Always review output for mistakes.

df = spark.createDataFrame([
        ("Hello! How are you doing today?",),
        ("Tell me what you'd like to know, and I'll do my best to help.",),
        ("The only thing we have to fear is fear itself.",),
    ], ["text"])

translations = df.ai.translate(to_lang="spanish", input_col="text", output_col="translations")
display(translations)

В этом примере ячейка кода предоставляет следующие выходные данные:

Снимок экрана: кадр данных с столбцами