Apa itu ringkasan dokumen dan percakapan?

Penting

Wilayah pratinjau kami, Swedia Tengah, menampilkan teknik penyetelan halus LLM terbaru dan terus berkembang berdasarkan model GPT. Anda dipersilakan untuk mencobanya dengan sumber daya Bahasa di wilayah Swedia Tengah.

Ringkasan percakapan hanya tersedia dengan:

  • REST API
  • Python
  • C#

Ringkasan adalah salah satu fitur yang ditawarkan oleh Azure AI Language, kumpulan pembelajaran mesin dan algoritma AI di cloud untuk mengembangkan aplikasi cerdas yang melibatkan bahasa tertulis. Gunakan artikel ini untuk mempelajari selengkapnya tentang fitur ini, dan cara menggunakannya di aplikasi Anda.

Meskipun layanan diberi label ringkasan dokumen dan percakapan, ringkasan dokumen hanya menerima blok teks biasa, dan ringkasan percakapan menerima berbagai artefak ucapan agar model mempelajari lebih lanjut. Jika Anda ingin memproses percakapan tetapi hanya peduli tentang teks, Anda bisa menggunakan ringkasan dokumen untuk skenario tersebut.

Dokumentasi ini berisi jenis artikel berikut:

  • Mulai cepat adalah instruksi awal untuk memandu Anda dalam membuat permintaan ke layanan.
  • Panduan berisi instruksi untuk menggunakan layanan dengan cara yang lebih spesifik atau disesuaikan.

Ringkasan dokumen menggunakan teknik pemrosesan bahasa alami untuk menghasilkan ringkasan untuk dokumen. Ada tiga pendekatan API yang didukung untuk ringkasan otomatis: ekstraktif, abstraktif, dan berfokus pada kueri.

Ringkasan ekstraktif mengekstrak kalimat yang secara kolektif mewakili informasi yang paling penting atau relevan dalam konten asli. Ringkasan abstraktif menghasilkan ringkasan dengan kalimat ringkas, koheren, atau kata-kata yang bukan kalimat ekstrak verbatim dari dokumen asli. Fitur-fitur ini dirancang untuk mempersingkat konten yang dapat dianggap terlalu lama untuk dibaca.

Dukungan dokumen asli

Dokumen asli mengacu pada format file yang digunakan untuk membuat dokumen asli seperti Microsoft Word (docx) atau file dokumen portabel (pdf). Dukungan dokumen asli menghilangkan kebutuhan akan praproses teks sebelum menggunakan kemampuan sumber daya Bahasa Azure AI. Saat ini, dukungan dokumen asli tersedia untuk kemampuan AbstractiveSummarization dan ExtractiveSummarization.

Ringkasan Dokumen saat ini mendukung format dokumen asli berikut:

Jenis file Ekstensi {i>file Deskripsi
SMS .txt Dokumen teks yang tidak diformat.
Adobe PDF .pdf Dokumen berformat file dokumen portabel.
Microsoft Word .docx File dokumen Microsoft Word.

Untuk informasi selengkapnya, lihatMenggunakan dokumen asli untuk pemrosesan bahasa

Fitur utama

Ada aspek ringkasan dokumen yang disediakan API ini:

  • Ringkasan ekstraktif: Menghasilkan ringkasan dengan mengekstrak kalimat yang gagah dalam dokumen.

    • Beberapa kalimat yang diekstrak: Kalimat-kalimat ini secara kolektif menyampaikan gagasan utama dokumen. Ini adalah kalimat asli yang diekstrak dari konten dokumen input.
    • Skor peringkat: Skor peringkat menunjukkan seberapa relevan kalimat dengan topik utama dokumen. Ringkasan dokumen mengurutkan kalimat yang diambil dengan peringkat, dan Anda dapat menentukan apakah kalimat tersebut ditampilkan dalam urutan kalimat yang muncul, atau sesuai dengan peringkatnya.
    • Beberapa kalimat yang dikembalikan: Tentukan jumlah maksimum kalimat yang akan dikembalikan. Misalnya, jika Anda meminta ringkasan ekstraktif ringkasan tiga kalimat mengembalikan tiga kalimat dengan skor tertinggi.
    • Informasi posisional: Posisi mulai dan panjang kalimat yang diambil.
  • Ringkasan abstraktif: Menghasilkan ringkasan yang tidak menggunakan kata yang sama seperti dalam dokumen, tetapi menangkap ide utama.

    • Teks ringkasan: Ringkasan abstraktif mengembalikan ringkasan untuk setiap rentang input kontekstual dalam dokumen. Dokumen panjang dapat disegmentasi sehingga beberapa grup teks ringkasan dapat dikembalikan dengan rentang input kontekstualnya.
    • Rentang input kontekstual: Rentang dalam dokumen input yang digunakan untuk menghasilkan teks ringkasan.
  • Ringkasan yang berfokus pada kueri: Menghasilkan ringkasan berdasarkan kueri

Sebagai contoh, pertimbangkan paragraf teks berikut:

"Di Microsoft, kami sedang berusaha untuk memajukan AI di luar teknik yang ada, dengan mengambil pendekatan yang lebih holistik dan berfokus pada manusia untuk belajar dan memahami. Sebagai Chief Technology Officer layanan Azure AI, saya telah bekerja dengan tim ilmuwan dan insinyur luar biasa untuk mengubah pencarian ini menjadi kenyataan. Dalam peran saya, saya menikmati perspektif unik dalam melihat hubungan antara tiga atribut kognisi manusia: teks monolingual (X), sinyal sensorik audio atau visual, (Y) dan multibahasa (Z). Di persimpangan ketiganya, ada sihir—yang kami sebut kode XYZ seperti yang diilustrasikan pada Gambar 1—representasi bersama untuk menciptakan AI yang lebih kuat yang dapat berbicara, mendengar, melihat, dan memahami manusia dengan lebih baik. Kami percaya XYZ-code memungkinkan kami memenuhi visi jangka panjang kami: pembelajaran transfer lintas domain, mencakup modalitas dan bahasa. Tujuannya adalah untuk memiliki model terlatih yang dapat bersama-sama mempelajari representasi untuk mendukung berbagai tugas AI hilir, seperti yang dilakukan manusia saat ini. Selama lima tahun terakhir, kami mencapai performa manusia pada tolok ukur dalam pengenalan ucapan percakapan, terjemahan mesin, jawaban atas pertanyaan percakapan, pemahaman pembacaan mesin, dan keterangan gambar. Lima terobosan ini memberi kami sinyal kuat menuju aspirasi kami yang lebih progresif untuk menghasilkan inovasi dalam kemampuan AI, mencapai pembelajaran multi-indera dan multi-bahasa yang lebih dekat dengan cara manusia belajar dan memahami. Saya percaya kode XYZ bersama adalah komponen dasar dari aspirasi ini, jika didasarkan pada sumber pengetahuan eksternal dalam tugas AI hilir."

Permintaan API ringkasan dokumen diproses setelah menerima permintaan dengan membuat pekerjaan untuk backend API. Jika pekerjaan berhasil, output API dikembalikan. Output tersedia untuk pengambilan selama 24 jam. Setelah waktu ini, output akan dihapus secara menyeluruh. Karena dukungan multibahasa dan emoji, respons dapat berisi offset teks. Untuk informasi selengkapnya, lihat cara memproses offset.

Jika kita menggunakan contoh di atas, API mungkin mengembalikan kalimat ringkasan ini:

Ringkasan ekstraktif:

  • "Di Microsoft, kami sedang berusaha untuk memajukan AI di luar teknik yang ada, dengan mengambil pendekatan yang lebih holistik dan berfokus pada manusia untuk belajar dan memahami."
  • "Kami percaya XYZ-code memungkinkan kami memenuhi visi jangka panjang kami: pembelajaran transfer lintas domain, mencakup modalitas dan bahasa."
  • "Tujuannya adalah untuk memiliki model yang telah dilatih sebelumnya yang dapat secara bersama-sama mempelajari representasi untuk mendukung berbagai tugas AI hilir, banyak dalam cara yang dilakukan manusia saat ini."

Ringkasan abstraktif:

  • "Microsoft mengambil pendekatan yang lebih holistik dan berfokus pada manusia untuk belajar dan memahami. Kami percaya XYZ-code memungkinkan kami memenuhi visi jangka panjang kami: pembelajaran transfer lintas domain, mencakup modalitas dan bahasa. Selama lima tahun terakhir, kami mencapai performa manusia pada tolok ukur dalam pengenalan ucapan percakapan."

Mulai dengan peringkasan

Untuk menggunakan ringkasan, Anda mengirimkan analisis dan menangani output API di aplikasi Anda. Analisis dilakukan apa adanya, tanpa penyesuaian tambahan ke model yang digunakan pada data Anda. Terdapat dua cara untuk menggunakan ringkasan teks:

Opsi pengembangan Deskripsi
Studio bahasa Language Studio adalah platform berbasis web yang memungkinkan Anda mencoba penautan entitas dengan contoh teks tanpa akun Azure, dan data Anda sendiri saat mendaftar. Untuk informasi selengkapnya, lihat mulai cepat situs web Language Studio atau studio bahasa.
REST API atau Pustaka Klien (Azure SDK) Integrasikan ringkasan dokumen ke dalam aplikasi Anda menggunakan REST API, atau pustaka klien yang tersedia dalam berbagai bahasa. Untuk informasi selengkapnya, lihat mulai cepat ringkasan.

Persyaratan input dan batas layanan

  • Ringkasan mengambil teks untuk analisis. Untuk informasi selengkapnya, lihat Batas data dan layanan dalam panduan cara penggunaan.
  • Ringkasan berfungsi dengan berbagai bahasa tertulis. Untuk informasi selengkapnya, lihat dukungan bahasa.

Dokumentasi referensi dan sampel kode

Saat Anda menggunakan ringkasan dokumen di aplikasi Anda, lihat dokumentasi referensi dan sampel berikut untuk Bahasa Azure AI:

Opsi pengembangan/bahasa Dokumentasi rujukan Sampel
C# Dokumentasi C# Sampel C++
Java Dokumentasi Java Sampel Java
JavaScript Dokumentasi JavaScript Sampel JavaScript
Python Dokumentasi Python Sampel Python

AI yang Bertanggung Jawab

Sistem AI tidak hanya mencakup teknologi, tetapi juga orang-orang yang menggunakannya, orang-orang yang terkena dampaknya, dan lingkungan penyebaran. Baca catatan transparansi untuk ringkasan untuk mempelajari penggunaan dan penyebaran AI yang bertanggung jawab di sistem Anda. Untuk informasi lebih lanjut, baca artikel berikut: