Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Azure AI Content Understanding adalah layanan AI generatif tingkat lanjut yang dirancang untuk mendapatkan wawasan terstruktur dari konten multi-modal seperti dokumen, gambar, video, dan audio. Dengan pengenalan 2025-05-01-preview
versi, layanan sekarang menawarkan dua mode yang berbeda: standard
dan pro
.
Standar: Mode ini berfungsi sebagai solusi default untuk memproses berbagai jenis konten. Ini dioptimalkan untuk menyediakan ekstraksi skema yang efisien yang disesuaikan dengan tugas tertentu di semua format data. Mode ini menekankan efektivitas biaya dan latensi yang berkurang, memastikan wawasan terstruktur dapat diakses untuk kebutuhan pemrosesan umum Anda.
Pro: Mode ini dirancang untuk kasus penggunaan tingkat lanjut, terutama yang membutuhkan penalaran multi-langkah, dan pengambilan keputusan yang kompleks (misalnya, mengidentifikasi inkonsistensi, menggambar inferensi, dan membuat keputusan yang canggih). Mode pro memungkinkan input dari beberapa file konten dan menyertakan opsi untuk menyediakan data referensi pada waktu pembuatan penganalisis. Saat ini, mode pro hanya ditawarkan untuk data berbasis dokumen Anda.
Gambaran umum mode standar
Mode standar Content Understanding memberikan wawasan terstruktur di berbagai jenis data, termasuk dokumen, video, gambar, audio, dan teks. Meskipun tidak mendukung inferensi data, ini meminimalkan biaya dan latensi, membuatnya ideal untuk skenario yang luas dan berpusat pada data. Mode ini memungkinkan pembuatan atau penyesuaian skema untuk mengekstrak wawasan yang tepat yang disesuaikan dengan kebutuhan Anda. Selain itu, ini menggabungkan pelabelan data untuk data dokumen, memungkinkan input manusia untuk meningkatkan kualitas output Anda.
Mode standar: kasus penggunaan
Standar adalah layanan ideal untuk mengekstrak wawasan yang tepat yang Anda butuhkan pada semua jenis data. Jika Anda hanya ingin membuka kunci konten data Anda, skenario Anda mungkin tidak memerlukan penalaran atau pengambilan keputusan yang kompleks. Skenario yang berfungsi dengan baik untuk mode standar meliputi:
- Menyusun data untuk menggerakkan alur kerja pencarian RAG Anda dan mengintegrasikan dengan AI Search.
- Mengekstrak data untuk diintegrasikan dengan Microsoft Fabric.
- Menganalisis video iklan untuk memeriksa kesesuaian dengan panduan konten.
- Mengesegmentasi rekaman video untuk membuat bab dan mengidentifikasi jeda iklan yang ideal.
- Mengekstrak poin data penting dari game olahraga dan memberikan rekap pasca-game.
Gambaran umum mode pro
Mode pro Pemahaman Konten dirancang khusus untuk pelanggan dengan kasus penggunaan yang kompleks, menyediakan kemampuan penalaran bertahap, dan dukungan untuk dokumen multi-input. Ini memungkinkan penalaran atas konten input dan data referensi, membuatnya ideal untuk skenario yang membutuhkan analisis yang kompleks. Dengan menggabungkan data referensi, mode pro menambahkan konteks ke setiap permintaan, membantu tugas seperti validasi dan pengayaan. Saat ini, mode pro tersedia secara eksklusif untuk data dokumen.
Data referensi Mode Pro
Selama pembuatan penganalisis, Anda dapat menyediakan dokumen yang dapat membantu dalam menyediakan konteks yang mereferensikan layanan pada waktu inferensi. Misalnya, jika Anda ingin menganalisis faktur untuk memastikan faktur konsisten dengan perjanjian kontraktual, Anda dapat menyediakan faktur dan dokumen lain yang relevan (misalnya, pesanan pembelian) sebagai input, dan menyediakan file kontrak sebagai data referensi. Layanan ini menerapkan penalaran untuk memeriksa dokumen masukan sesuai dengan skema Anda, yang mungkin digunakan untuk mengidentifikasi ketidaksesuaian untuk ditandai dan ditinjau lebih lanjut. Jika dokumen Anda berada dalam batas layanan dokumen input mode pro, kami juga merekomendasikan mencoba untuk memberikan semua dokumen Anda sebagai dokumen input jika Anda mengalami masalah kualitas.
Penalaran multi-langkah
Penalaran multi-langkah menawarkan kemampuan untuk menguraikan masalah kompleks menjadi tugas sederhana. Penalaran multi-langkah mengambil analisis data selangkah lebih jauh daripada mengekstrak dan menggabungkan data terstruktur dan memungkinkan Anda untuk menarik kesimpulan pada data tersebut, meminimalkan kebutuhan akan tinjauan manusia. Contoh jenis pertanyaan dalam mode pro yang dapat dijawab dengan penalaran berdasarkan beberapa langkah meliputi:
- Apakah x cocok dengan y?
- Apakah x memenuhi kriteria yang diuraikan?
- Apakah dokumen x mengikuti panduan yang diperlukan?
- Apakah total sama dengan jumlah item?
- Temukan semua inkonsistensi antara faktur dan kontrak.
Fitur mode standar dan pro
Tidak yakin mode mana yang tepat untuk skenario Anda? Bagan berikut membandingkan fitur mode standar dan pro.
Fitur | Mode standar | Mode profesional |
---|---|---|
Dokumen besar | ✓ | ✓ |
Mode lapangan | ✓ | ✓ |
Mengekstrak, mengklasifikasikan, dan menghasilkan bidang | ✓ | ✓ |
Skor grounding dan keyakinan | ✓ | ✗ |
Jenis dokumen input | Dokumen, gambar, video, audio | Dokumen |
Bidang maksimum | 100 | 100 |
Pemrosesan dokumen beberapa input | ✗ | ✓ |
Integrasi himpunan data referensi | ✗ | ✓ |
Penalaran multi-langkah | ✗ | ✓ |
Menerapkan mode standar atau pro ke skenario Anda
Anda dapat menerapkan mode standar dan pro Content Understanding ke hampir semua skenario, tetapi bagaimana Anda membangun solusi tergantung pada pertanyaan yang ingin Anda jawab. Skenario berikut menyajikan contoh bagaimana Anda dapat menerapkan mode standar dan pro ke data Anda.
Skenario | Mode standar | Mode profesional |
---|---|---|
Analisis faktur | Ekstrak wawasan tentang data faktur dalam skala besar dan aktifkan pencarian RAG serta analisis dan visualisasi data lebih lanjut. Jawab pertanyaan seperti: • Ekstrak nomor pesanan pembelian, total, tanggal jatuh tempo, dan item baris untuk masuk ke database. |
Analisis faktur dan perjanjian kontraktual dengan klien dan terapkan penalaran multi-langkah untuk menarik kesimpulan pada data tersebut. Jawab pertanyaan seperti: • Apakah faktur ini memenuhi perjanjian kontraktual yang kami miliki dengan klien ini? • Apakah faktur ini perlu ditinjau lebih lanjut? |
Analitik transkrip pusat panggilan | Ekstrak wawasan tentang data pusat panggilan dalam volume besar untuk mendapatkan wawasan berharga tentang sentimen, memahami masalah pelanggan, dan membuat pelatihan yang ditargetkan untuk mengatasi titik nyeri utama. Jawab pertanyaan seperti: • Apa masalah utama yang dipanggil pelanggan? • Berapa lama rata-rata panggilan yang dilakukan tentang masalah x? |
Analisis data transkrip pusat panggilan dan terapkan penalaran multi-langkah untuk memahami bagaimana karyawan pusat panggilan memenuhi kebutuhan pelanggan, dan jika mereka mengikuti panduan. Jawab pertanyaan seperti: • Apakah karyawan call center memperkenalkan diri? • Apakah jawaban ini lulus kriteria tertentu? |
Pemrosesan aplikasi hipotret | Ekstrak nilai kunci dari data aplikasi hipotek dan membuatnya dapat dicari dan lebih mudah diakses. Jawab pertanyaan seperti: • Tahun berapa pengajuan KPR diajukan? • Apa nama pada aplikasi? |
Analisis dokumentasi pendukung tambahan dan aplikasi hipotek untuk menentukan apakah calon pembeli rumah menyediakan semua dokumentasi yang diperlukan untuk mengamankan hipotek. Jawab pertanyaan seperti: • Apakah nama dan nomor jaminan sosial pada aplikasi hipotek cocok dengan dokumentasi pendukung? |
Coba mode pro
Anda dapat mencoba fitur mode standar dan pro Pemahaman Konten menggunakan Azure AI Foundry. Layanan ini memungkinkan Anda membawa data Anda sendiri dan bereksperimen dengan semua fungsionalitas kedua mode dalam pendekatan tanpa kode yang ringan untuk membantu Anda menemukan yang paling cocok untuk skenario unik Anda.
Batasan dan praktik terbaik yang diketahui mode pro
Mode pro Pemahaman Konten saat ini tidak menawarkan skor keyakinan atau grounding. Saat ini mendukung pembuatan dan klasifikasi bidang Anda, tetapi tidak mendukung hanya ekstraksi saja.
Mode pro Pemahaman Konten saat ini hanya tersedia untuk dokumen.
Sistem beroperasi dalam mode pencarian saat mereferensikan dokumen. Akibatnya, pengambilan informasi komprehensif tidak perlu diharapkan. Apabila pemulihan data yang lengkap diperlukan, kami sarankan Anda memasukkan dokumen ke dalam set masukan.
Skema harus dirancang dengan tingkat kekhususan tertinggi yang mungkin. Misalnya, alih-alih menyajikan daftar inkonsistensi umum, disarankan untuk membuat bidang yang berbeda untuk setiap jenis inkonsistensi, disertai dengan deskripsi terperinci. Selain itu, di mana pun layak, referensi ke bagian tertentu dari dokumen yang relevan yang harus ditinjau harus disertakan.
Dokumen referensi harus ringkas dan terfokus. Prioritaskan dokumen penting dan pastikan dokumen tersebut sesingkat mungkin untuk meningkatkan retensi dan pengenalan.
Langkah selanjutnya
Untuk informasi selengkapnya tentang pemrosesan dokumen, lihat Gambaran umum pemrosesan dokumen.