将 ai.classify 与 PySpark 配合使用

该 ai.classify 函数使用生成 AI 根据所选的自定义标签对输入文本进行分类，只需一行代码。

注释

本文介绍如何将 ai.classify 与 PySpark 配合使用。若要将 ai.classify 与 pandas 配合使用，请参阅本文。
请参阅本概述文章中的其他 AI 函数。
了解如何自定义 AI 函数的配置。

概述

该 ai.classify 函数可用于 Spark 数据帧。必须将现有输入列的名称指定为参数，以及分类标签的列表。

该函数返回一个新的数据帧，其中包含与每行输入文本匹配的标签，这些标签存储在输出列中。

Syntax

df.ai.classify(labels=["category1", "category2", "category3"], input_col="text", output_col="classification")

参数

Name	Description
`labels` 必选	一个字符串数组，表示要与输入列中的文本值匹配的分类标签集。
`input_col` 必选	一个字符串，包含现有列的名称，其中包含输入文本值，以便根据自定义标签进行分类。
`output_col` 可选	一个字符串，其中包含要为每个输入文本行存储分类标签的新列的名称。如果未设置此参数，则会为输出列生成默认名称。
`error_col` 可选	一个包含新列名称的字符串。新列存储因处理每行输入文本而导致的任何 OpenAI 错误。如果未设置此参数，则会为错误列生成默认名称。如果输入行没有错误，则此列中的值为 `null`。

退货

该函数返回一个 Spark 数据帧，其中包含一个新列，其中包含与每个输入文本行匹配的分类标签。如果无法对文本值进行分类，则对应的标签为 null。

Example

# This code uses AI. Always review output for mistakes. 

df = spark.createDataFrame([
        ("This duvet, lovingly hand-crafted from all-natural fabric, is perfect for a good night's sleep.",),
        ("Tired of friends judging your baking? With these handy-dandy measuring cups, you'll create culinary delights.",),
        ("Enjoy this *BRAND NEW CAR!* A compact SUV perfect for the professional commuter!",)
    ], ["descriptions"])
    
categories = df.ai.classify(labels=["kitchen", "bedroom", "garage", "other"], input_col="descriptions", output_col="categories")
display(categories)

此示例代码单元提供以下输出：

将 ai.classify 与 pandas 配合使用。
使用 ai.analyze_sentiment检测情绪。
使用 ai.embed 生成矢量嵌入。
使用 ai_extract提取实体。
使用 ai.fix_grammar修复语法。
使用 ai.generate_response回答自定义用户提示。
使用 ai.similarity 计算相似性。
使用ai.summarize功能汇总文本。
使用 ai.translate 翻译文本。
详细了解完整的 AI 函数集。
自定义 AI 函数的配置。
我们错过了所需的功能吗？在面料创意论坛上提出建议。

反馈

此页面是否有帮助？

Last updated on 2025-11-21

通过

将 ai.classify 与 PySpark 配合使用

概述

Syntax

参数

退货

Example

相关内容

反馈

其他资源