次の方法で共有


pandas で ai.summarize を使用する

ai.summarize関数では、ジェネレーティブ AI を使用して、1 行のコードで入力テキストの概要を生成します。 この関数は、DataFrame の 1 つの列の値またはすべての列の値を集計できます。

  • この記事では、pandas での ai.summarize の使用について説明します。 PySpark で ai.summarize を使用するには、 この記事を参照してください。
  • この概要記事では、他の AI 関数を参照してください。
  • AI 関数の構成をカスタマイズする方法について説明します。

概要

ai.summarize 関数は、pandas Series クラスを拡張します。 その列の各行の値を集計するには、 pandas DataFrame テキスト列で関数を呼び出します。 DataFrame 全体で ai.summarize 関数を呼び出して、すべての列の値を集計することもできます。

この関数は、新しい DataFrame 列に格納できる概要を含む pandas Series を返します。

構文

df["summaries"] = df["text"].ai.summarize()

パラメーター

名前 Description
instructions
オプション
出力の長さ、トーンなどを指定するなど、AI モデルのより多くのコンテキストを含む 文字列 。 より正確な命令により、より良い結果が得られます。

返品ポリシー

この関数は、各入力テキスト行の概要を含む pandas Series を返します。 入力テキストが null場合、結果は null

Example

# This code uses AI. Always review output for mistakes.

df= pd.DataFrame([
        ("Microsoft Teams", "2017",
        """
        The ultimate messaging app for your organization—a workspace for real-time 
        collaboration and communication, meetings, file and app sharing, and even the 
        occasional emoji! All in one place, all in the open, all accessible to everyone.
        """),
        ("Microsoft Fabric", "2023",
        """
        An enterprise-ready, end-to-end analytics platform that unifies data movement, 
        data processing, ingestion, transformation, and report building into a seamless, 
        user-friendly SaaS experience. Transform raw data into actionable insights.
        """)
    ], columns=["product", "release_year", "description"])

df["summaries"] = df["description"].ai.summarize()
display(df)

このコード セルの例では、次の出力が提供されます。

データ フレームを示すスクリーンショット。'summarys' 列には、対応する行の 'description' 列のみの概要があります。