ai_summarize fungsi

Berlaku untuk:centang ditandai ya Databricks SQL centang ditandai ya Databricks Runtime

Penting

Fungsionalitas ini sesuai dengan Pratinjau Umum dan HIPAA.

Selama pratinjau:

  • Model bahasa yang mendasar dapat menangani beberapa bahasa, tetapi Fungsi AI ini disetel untuk bahasa Inggris.
  • Lihat Fitur dengan ketersediaan regional terbatas untuk mengetahui ketersediaan regional dari Fungsi AI.

Fungsi ai_summarize() memungkinkan Anda memanggil model AI generatif state-of-the-art untuk menghasilkan ringkasan teks tertentu menggunakan SQL. Fungsi ini menggunakan model chat yang melayani endpoint layanan yang disediakan oleh Databricks Foundation Model APIs.

Persyaratan

Lisensi Apache 2.0

Model dasar yang mungkin digunakan saat ini dilisensikan di bawah Lisensi Apache 2.0, Hak Cipta © Apache Software Foundation. Pelanggan bertanggung jawab untuk memastikan kepatuhan terhadap lisensi model yang berlaku.

Databricks merekomendasikan untuk meninjau lisensi ini untuk memastikan kepatuhan terhadap persyaratan yang berlaku. Jika model muncul di masa depan yang berkinerja lebih baik sesuai dengan tolok ukur internal Databricks, Databricks mungkin mengubah model (dan daftar lisensi yang berlaku yang disediakan di halaman ini).

  • Fungsi ini hanya tersedia di ruang kerja di wilayah yang mendukung Fungsi AI yang dioptimalkan untuk inferensi batch.
  • Fungsi ini tidak tersedia di Azure Databricks SQL Classic.
  • Periksa halaman harga Databricks SQL.
  • Beban kerja inferensi batch memerlukan Databricks Runtime 15.4 ML LTS untuk meningkatkan performa.

Sintaks

ai_summarize(content[, max_words])

Argumen

  • content: Ekspresi STRING , teks yang akan diringkas.
  • max_words: Ekspresi numerik integral non-negatif yang opsional, yang mewakili jumlah kata target yang diupayakan secara maksimal dalam teks ringkasan yang dikembalikan. Nilai defaultnya adalah 50. Jika diatur ke 0, tidak ada batas kata.

Pengembalian

STRING.

Jika contentNULL, hasilnya adalah NULL.

Contoh

> SELECT ai_summarize(
    'Apache Spark is a unified analytics engine for large-scale data processing. ' ||
    'It provides high-level APIs in Java, Scala, Python and R, and an optimized ' ||
    'engine that supports general execution graphs. It also supports a rich set ' ||
    'of higher-level tools including Spark SQL for SQL and structured data ' ||
    'processing, pandas API on Spark for pandas workloads, MLlib for machine ' ||
    'learning, GraphX for graph processing, and Structured Streaming for incremental ' ||
    'computation and stream processing.',
    20
  );
 "Apache Spark is a unified, multi-language analytics engine for large-scale data processing
 with additional tools for SQL, machine learning, graph processing, and stream computing."