使用 ai.translate 函数翻译文本

ai.translate 函数使用生成式人工智能,将输入文本翻译为您选择的新语言——而这一切仅需一行代码。

AI 函数让 Fabric 内置大型语言模型的强大功能唾手可得,为数据工程注入了强劲动力。 若要了解详细信息,请访问此概述文章

重要

此功能在 预览版中,用于 Fabric 1.3 运行时 及更高版本。

  • 请查看此概述文章中的先决条件,包括暂时需要完成哪些库安装才能使用 AI 功能。
  • 默认情况下,AI 函数目前由 gpt-3.5-turbo (0125) 模型提供支持。 若要详细了解计费和消耗率,请访问本文
  • 尽管基础模型可以处理多种语言,但大多数 AI 函数经过优化,可用于英语文本。
  • 在 AI 函数的初始推出期间,用户使用 Fabric 的内置 AI 终结点时,每分钟的请求数暂时限制为 1,000 个。

提示

ai.translate 函数使用 10 种语言进行测试:捷克英语芬兰语法语德语希腊、意大利 、波兰西班牙语瑞典。 其他语言的结果可能会有所不同。

ai.translate 与 pandas 配合使用

ai.translate 函数扩展了 pandas Series 类。 对 pandas DataFrame 文本列调用函数,将每个输入行转换为所选的目标语言。

该函数返回一个包含翻译的 pandas Series,你可以将其存储在新的 DataFrame 列中。

语法

df["translations"] = df["text"].ai.translate("target_language")

参数

名称 说明
to_lang
必选
表示文本翻译的目标语言的字符串

退货

包含每行输入文本的翻译的 pandas Series。 如果输入的文本是 null,则结果为 null

# This code uses AI. Always review output for mistakes. 
# Read terms: https://azure.microsoft.com/support/legal/preview-supplemental-terms/

df = pd.DataFrame([
        "Hello! How are you doing today?", 
        "Tell me what you'd like to know, and I'll do my best to help.", 
        "The only thing we have to fear is fear itself."
    ], columns=["text"])

df["translations"] = df["text"].ai.translate("spanish")
display(df)

ai.translate 与 PySpark 配合使用

ai.translate 函数也适用于 Spark 数据帧。 必须将现有输入列名称指定为参数,以及目标语言。

该函数返回一个新的 DataFrame,其中每个输入文本行的翻译存储在输出列中。

语法

df.ai.translate(to_lang="spanish", input_col="text", output_col="translations")

参数

名称 说明
to_lang
必选
用于表示文本翻译目标语言的字符串
input_col
必选
一个 字符串,其中包含现有列的名称,该列包含要翻译的输入文本值。
output_col
自选
一个 字符串,其中包含一个新列的名称,该列用于存储每个输入文本行的翻译。 如果未设置此参数,则会为输出列生成默认名称。
error_col
自选
一个 字符串,该字符串包含新列的名称,该列存储因处理每个输入文本行而导致的任何 OpenAI 错误。 如果未设置此参数,则会为错误列生成默认名称。 如果输入行没有错误,则此列中的值 null

退货

带有新列的 Spark 数据帧,该列包含输入列行中文本的翻译。 如果输入的文本是 null,则结果为 null

# This code uses AI. Always review output for mistakes. 
# Read terms: https://azure.microsoft.com/support/legal/preview-supplemental-terms/

df = spark.createDataFrame([
        ("Hello! How are you doing today?",),
        ("Tell me what you'd like to know, and I'll do my best to help.",),
        ("The only thing we have to fear is fear itself.",),
    ], ["text"])

translations = df.ai.translate(to_lang="spanish", input_col="text", output_col="translations")
display(translations)