Sesi Debug di Pencarian Azure AI
Sesi Debug adalah editor visual yang bekerja dengan set keterampilan yang ada di portal Azure, mengekspos struktur dan konten dokumen tunggal yang diperkaya karena diproduksi oleh pengindeks dan set keterampilan selama durasi sesi. Karena Anda bekerja dengan dokumen langsung, sesinya interaktif - Anda dapat mengidentifikasi kesalahan, memodifikasi, dan memanggil eksekusi keterampilan, dan memvalidasi hasilnya secara real time. Jika perubahan Anda menyelesaikan masalah, Anda dapat menerapkannya ke set keterampilan yang diterbitkan untuk menerapkan perbaikan secara global.
Artikel ini menjelaskan skenario yang didukung dan bagaimana editor diatur. Tab dan bagian editor membuka kemasan berbagai lapisan set keterampilan sehingga Anda dapat memeriksa struktur set keterampilan, aliran, dan konten yang dihasilkannya pada waktu proses.
Gunakan Sesi Debug untuk menyelidiki dan mengatasi masalah dengan:
Keterampilan bawaan yang digunakan untuk pengayaan AI, seperti OCR, analisis gambar, pengenalan entitas, dan ekstraksi kata kunci.
Keterampilan bawaan yang digunakan untuk vektorisasi terintegrasi, dengan pemotongan data melalui Pemisahan Teks, dan vektorisasi melalui keterampilan penyematan.
Keterampilan kustom yang digunakan untuk mengintegrasikan pemrosesan eksternal yang Anda sediakan.
Bandingkan gambar sesi debug berikut untuk dua skenario pertama. Untuk kedua skenario, area permukaan menunjukkan perkembangan keterampilan yang menghasilkan atau mengubah konten dalam rute dari dokumen sumber ke indeks pencarian. Alur mencakup opsi pemetaan indeks, dan Anda dapat melacak panah untuk mengikuti jejak pemrosesan. Panel detail di sebelah kanan peka konteks. Ini menunjukkan representasi dokumen yang diperkaya, atau detail keterampilan atau pemetaan.
Gambar pertama menunjukkan pola untuk pengayaan AI yang diterapkan. Keterampilan dapat berjalan secara berurutan atau paralel jika tidak ada dependensi. Pemetaan bidang output mengirim konten yang diperkaya atau dihasilkan dari struktur data dalam memori ke bidang dalam indeks.
Gambar kedua menunjukkan pola umum untuk vektorisasi terintegrasi. Keterampilan untuk vektorisasi terintegrasi biasanya mencakup Pemisahan Teks dan keterampilan penyematan. Keterampilan Pemisahan Teks memotong dokumen ke dalam halaman. Keterampilan penyematan menyediakan vektorisasi. Pemetaan proyeksi mengontrol bagaimana potongan konten diindeks. Skillset khusus ini melewati indeks induk dan membuat indeks konten yang baru saja dipotong, menggunakan metadata untuk mengidentifikasi sumber gugus.
Sesi Debug berfungsi dengan semua sumber data pengindeks yang tersedia secara umum dan sebagian besar sumber data pratinjau, dengan pengecualian berikut:
Pengindeks SharePoint Online.
Pengindeks Azure Cosmos DB for MongoDB.
Untuk Azure Cosmos DB for NoSQL, jika baris gagal selama indeks dan tidak ada metadata yang sesuai, sesi debug mungkin tidak memilih baris yang benar.
Untuk SQL API Azure Cosmos DB, jika koleksi yang dipartisi sebelumnya tidak dipartisi, sesi debug tidak akan menemukan dokumen.
Untuk keterampilan kustom, identitas terkelola yang ditetapkan pengguna tidak didukung untuk koneksi sesi debug ke Azure Storage. Seperti yang dinyatakan dalam prasyarat, Anda dapat menggunakan identitas terkelola sistem, atau menentukan string koneksi akses penuh yang menyertakan kunci. Untuk informasi selengkapnya, lihat Menyambungkan layanan pencarian ke sumber daya Azure lainnya menggunakan identitas terkelola.
Saat ini, kemampuan untuk memilih dokumen mana yang akan di-debug tidak tersedia. Batasan ini tidak permanen dan akan segera diangkat. Saat ini, Sesi Debug memilih dokumen pertama dalam kontainer atau folder data sumber.
Saat Anda memulai sesi, layanan pencarian membuat salinan set keterampilan, pengindeks, dan sumber data yang berisi satu dokumen yang digunakan untuk menguji set keterampilan. Semua status sesi disimpan ke kontainer blob baru yang dibuat oleh azure AI layanan Pencarian di akun Azure Storage yang Anda sediakan. Nama kontainer yang dihasilkan memiliki awalan .ms-az-cognitive-search-debugsession
Awalan diperlukan karena mengurangi kemungkinan mengekspor data sesi secara tidak sengaja ke kontainer lain di akun Anda.
Salinan cache dokumen dan set keterampilan yang diperkaya dimuat ke editor visual sehingga Anda dapat memeriksa konten dan metadata dokumen yang diperkaya, dengan kemampuan untuk memeriksa setiap simpul dokumen dan mengedit aspek apa pun dari definisi set keterampilan. Setiap perubahan yang dilakukan dalam sesi di-cache. Perubahan tersebut tidak akan memengaruhi set keterampilan yang diterbitkan kecuali Anda menerapkannya. Menerapkan perubahan akan menimpa rangkaian keterampilan produksi.
Jika alur pengayaan tidak memiliki kesalahan, sesi debug dapat digunakan untuk memperkaya dokumen secara bertahap, menguji dan memvalidasi setiap perubahan sebelum melakukan perubahan.
Editor visual diatur ke dalam area permukaan yang menunjukkan perkembangan operasi, dimulai dengan pemecahan dokumen, diikuti oleh keterampilan, pemetaan, dan indeks.
Pilih keterampilan atau pemetaan apa pun, dan panel terbuka ke sisi yang menampilkan informasi yang relevan.
Ikuti tautan untuk menelusuri lebih lanjut ke dalam pemrosesan keterampilan. Misalnya, cuplikan layar berikut menunjukkan output perulangan pertama dari keterampilan Pemisahan Teks.
Panel Detail keterampilan memiliki bagian berikut:
- Iterasi: Menunjukkan kepada Anda berapa kali keterampilan dijalankan. Anda dapat memeriksa input dan output masing-masing.
- Pengaturan Keterampilan: Melihat atau mengedit definisi set keterampilan JSON.
- Kesalahan dan peringatan: Menunjukkan kesalahan atau peringatan khusus untuk keterampilan ini.
Panel Struktur Data yang Diperkaya meluncur ke samping saat Anda memilih simbol perlihatkan biru atau sembunyikan panah. Ini adalah representasi yang dapat dibaca manusia dari apa yang dikandung dokumen yang diperkaya. Cuplikan layar sebelumnya dalam artikel ini memperlihatkan contoh struktur data yang diperkaya.
Sekarang setelah Anda memahami elemen sesi debug, mulai sesi debug pertama Anda pada set keterampilan yang ada.