Aracılığıyla paylaş


PySpark ile ai.summarize kullanma

İşlev, ai.summarize tek bir kod satırıyla giriş metninin özetlerini oluşturmak için üretken yapay zeka kullanır. İşlev, DataFrame'in bir sütunundaki değerleri veya tüm sütunlardaki değerleri özetleyebilir.

Uyarı

Genel Bakış

ai.summarize işlevi Spark DataFramesiçin de kullanılabilir. Var olan bir giriş sütununun adını parametre olarak belirtirseniz, işlev yalnızca bu sütundaki her değeri özetler. Aksi takdirde işlev, DataFrame'in tüm sütunlarında değerleri satır satır özetler.

İşlev, tek bir sütundan veya tüm sütunlarda bir çıkış sütununda depolanan her giriş metin satırı için özetler içeren yeni bir DataFrame döndürür.

Sözdizimi

df.ai.summarize(input_col="text", output_col="summaries")

Parametreler

İsim Description
input_col
Opsiyonel
Özetlemek için giriş metin değerlerine sahip mevcut bir sütunun adını içeren bir dizesi. Bu parametreyi ayarlamazsanız işlev, belirli bir sütundaki değerler yerine DataFrame'deki tüm sütunlar arasında değerleri özetler.
instructions
Opsiyonel
Çıktı uzunluğunu, tonunu veya daha fazlasını belirtme gibi yapay zeka modeli için daha fazla bağlam içeren bir dize . Daha kesin yönergeler daha iyi sonuçlar verir.
error_col
Opsiyonel
Her giriş metin satırının işlenmesinden kaynaklanan OpenAI hatalarını depolamak için yeni sütunun adını içeren bir dizesi. Bu parametreyi ayarlamazsanız hata sütunu için varsayılan bir ad oluşturur. Giriş satırında hata yoksa, bu sütundaki değer nullolur.
output_col
Opsiyonel
Her giriş metin satırının özetlerini depolamak için yeni bir sütunun adını içeren bir dizesi. Bu parametreyi ayarlamazsanız, çıkış sütunu için varsayılan bir ad oluşturur.

İade

İşlev, her giriş metin satırı için özetlenmiş metin içeren yeni bir sütun içeren bir Spark DataFrame döndürür. Giriş metni nullise, sonuç nullolur. Herhangi bir giriş sütunu belirtilmezse işlev, DataFrame'deki tüm sütunlar genelinde değerleri özetler.

Example

# This code uses AI. Always review output for mistakes.

df = spark.createDataFrame([
        ("Microsoft Teams", "2017",
        """
        The ultimate messaging app for your organization—a workspace for real-time 
        collaboration and communication, meetings, file and app sharing, and even the 
        occasional emoji! All in one place, all in the open, all accessible to everyone.
        """,),
        ("Microsoft Fabric", "2023",
        """
        An enterprise-ready, end-to-end analytics platform that unifies data movement, 
        data processing, ingestion, transformation, and report building into a seamless, 
        user-friendly SaaS experience. Transform raw data into actionable insights.
        """,)
    ], ["product", "release_year", "description"])

summaries = df.ai.summarize(input_col="description", output_col="summaries")
display(summaries)

Bu örnek kod hücresi aşağıdaki çıkışı sağlar:

Veri çerçevesini gösteren ekran görüntüsü. 'Summaries' sütununda, karşılık gelen satırda yalnızca 'description' sütununun özeti bulunur.