Bagikan melalui


Meringkas teks dengan fungsi ai.summarize

Fungsi ai.summarize menggunakan AI Generatif untuk ringkasan produk teks input—baik nilai dari satu kolom DataFrame atau nilai di semua kolom—dengan satu baris kode.

AI meningkatkan kemampuan rekayasa data dengan menggunakan kekuatan model bahasa besar bawaan Fabric yang ada di tangan Anda. Untuk mempelajari lebih lanjut, kunjungi artikel ini yang memberikan gambaran umum .

Penting

Fitur ini dalam pratinjau, untuk digunakan dalam runtime Fabric 1.3 ke atas.

  • Tinjau prasyarat di artikel gambaran umum ini, termasuk penginstalan perpustakaan yang sementara ini diperlukan untuk menggunakan fungsi AI.
  • Secara default, fungsi AI saat ini didukung oleh model gpt-3.5-turbo (0125). Untuk mempelajari selengkapnya tentang tarif pembayaran dan pemakaian, kunjungi artikel ini.
  • Meskipun model yang mendasar dapat menangani beberapa bahasa, sebagian besar fungsi AI dioptimalkan untuk digunakan pada teks berbahasa Inggris.
  • Selama peluncuran awal fungsi AI, pengguna untuk sementara diberi batas 1.000 permintaan per menit dengan AI endpoint bawaan dari Fabric.

Gunakan ai.summarize dengan Pandas

Fungsi ai.summarize memperluas kelas pandas Series. Panggil fungsi pada kolom teks pandas DataFrame untuk meringkas setiap nilai baris dari kolom tersebut saja. Atau, Anda dapat memanggil fungsi ai.summarize pada seluruh DataFrame, untuk meringkas nilai di semua kolom.

Fungsi mengembalikan Seri panda yang berisi ringkasan, yang dapat disimpan di kolom DataFrame baru.

Sintaksis

df["summaries"] = df["text"].ai.summarize()

Parameter

Tidak

Pengembalian

Seri panda yang berisi ringkasan untuk setiap baris teks input. Jika teks input null, hasilnya null.

Contoh

# This code uses AI. Always review output for mistakes. 
# Read terms: https://azure.microsoft.com/support/legal/preview-supplemental-terms/

df= pd.DataFrame([
        ("Microsoft Teams", "2017",
        """
        The ultimate messaging app for your organization—a workspace for real-time 
        collaboration and communication, meetings, file and app sharing, and even the 
        occasional emoji! All in one place, all in the open, all accessible to everyone.
        """),
        ("Microsoft Fabric", "2023",
        """
        An enterprise-ready, end-to-end analytics platform that unifies data movement, 
        data processing, ingestion, transformation, and report building into a seamless, 
        user-friendly SaaS experience. Transform raw data into actionable insights.
        """)
    ], columns=["product", "release_year", "description"])

df["summaries"] = df["description"].ai.summarize()
display(df)

Menggunakan ai.summarize dengan PySpark

Fungsi ai.summarize juga tersedia untuk Spark DataFrames. Jika Anda menentukan nama kolom input yang ada sebagai parameter, fungsi ini meringkas setiap nilai dari kolom tersebut saja. Jika tidak, fungsi ini meringkas nilai di semua kolom DataFrame, baris demi baris.

Fungsi mengembalikan DataFrame baru dengan ringkasan untuk setiap baris teks input, dari satu kolom atau di semua kolom, disimpan dalam kolom output.

Sintaksis

df.ai.summarize(input_col="text", output_col="summaries")

Parameter

Nama Deskripsi
input_col
Fakultatif
String yang berisi nama kolom yang sudah ada dengan nilai teks input untuk dirangkum. Jika parameter ini tidak diatur, fungsi ini meringkas nilai di semua kolom di DataFrame, alih-alih nilai dari kolom tertentu.
output_col
Fakultatif
String yang berisi nama kolom baru untuk menyimpan ringkasan untuk setiap baris teks input. Jika parameter ini tidak diatur, nama default dihasilkan untuk kolom output.
error_col
Fakultatif
String yang berisi nama kolom baru untuk menyimpan kesalahan OpenAI yang dihasilkan dari pemrosesan setiap baris teks input. Jika parameter ini tidak diatur, nama default dihasilkan untuk kolom kesalahan. Jika baris input tidak memiliki kesalahan, nilai dalam kolom ini null.

Pengembalian

Spark DataFrame dengan kolom baru yang berisi ringkasan teks untuk setiap baris teks input. Jika teks input null, hasilnya null. Jika tidak ada kolom input yang ditentukan, fungsi ini meringkas nilai di semua kolom di DataFrame.

Contoh

# This code uses AI. Always review output for mistakes. 
# Read terms: https://azure.microsoft.com/support/legal/preview-supplemental-terms/

df = spark.createDataFrame([
        ("Microsoft Teams", "2017",
        """
        The ultimate messaging app for your organization—a workspace for real-time 
        collaboration and communication, meetings, file and app sharing, and even the 
        occasional emoji! All in one place, all in the open, all accessible to everyone.
        """,),
        ("Microsoft Fabric", "2023",
        """
        An enterprise-ready, end-to-end analytics platform that unifies data movement, 
        data processing, ingestion, transformation, and report building into a seamless, 
        user-friendly SaaS experience. Transform raw data into actionable insights.
        """,)
    ], ["product", "release_year", "description"])

summaries = df.ai.summarize(input_col="description", output_col="summaries")
display(summaries)