Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Di Azure AI Search, Anda dapat menggunakan wizard Impor data (baru) di portal Microsoft Azure untuk membuat alur kerja aplikasi logika yang mengindeks dan mem-vektorisasi konten Anda. Kemampuan ini setara dengan pengindeks dan sumber data yang menghasilkan alur pengindeksan dan membuat konten yang dapat dicari.
Setelah membuat alur kerja di wizard, Anda dapat mengelola alur kerja di Azure Logic Apps bersama alur kerja Anda yang lain. Di balik layar, penyihir mengikuti template alur kerja yang sudah ditentukan dengan mengambil konten dari sumber untuk diindeks dalam Pencarian Berbasis AI. Konektor yang digunakan dalam skenario ini sudah dibuat sebelumnya dan sudah ada di Azure Logic Apps, sehingga templat alur kerja hanya menyediakan detail bagi konektor tersebut untuk membuat koneksi ke sumber data, Pencarian AI, dan item lainnya untuk menyelesaikan alur kerja penyerapan.
Fitur utama
Integrasi Azure Logic Apps di Azure AI Search menambahkan dukungan untuk:
- Lebih banyak sumber data dari Microsoft dan penyedia lainnya
- Vektorisasi terintegrasi
- Pengindeksan terjadwal atau sesuai permintaan
- Deteksi perubahan dokumen baru dan yang sudah ada
Masukan untuk wizard Impor data (baru) meliputi:
- Sumber data yang didukung
- Model penyematan teks yang didukung
Setelah wizard selesai, Anda memiliki komponen berikut:
| Komponen | Lokasi | Description |
|---|---|---|
| Indeks pencarian | Pencarian Azure AI | Berisi konten terindeks dari konektor Logic Apps yang didukung. Skema indeks adalah indeks default yang dibuat oleh wizard. Anda dapat menambahkan elemen tambahan, seperti profil penilaian atau konfigurasi semantik, tetapi Anda tidak dapat mengubah bidang yang ada. Anda melihat, mengelola, dan mengakses indeks pencarian di Azure AI Search. |
| Sumber daya dan alur kerja aplikasi logika | Azure Logic Apps | Anda dapat melihat alur kerja yang sedang berjalan, atau Anda dapat membuka perancang di Azure Logic Apps untuk mengedit alur kerja, seperti yang Anda lakukan secara teratur jika Anda memulai dari Azure Logic Apps sebagai gantinya. Anda dapat mengedit dan memperluas alur kerja, tetapi berhati-hatilah agar tidak merusak alur pengindeksan. Alur kerja yang dibuat oleh wizard menggunakan opsi hosting Konsumsi . |
| Templat aplikasi logika | Azure Logic Apps | Hingga dua templat yang dibuat per alur kerja: satu untuk pengindeksan sesuai permintaan, dan templat kedua untuk pengindeksan terjadwal. Anda dapat mengubah jadwal pengindeksan di langkah Indeks beberapa dokumen alur kerja. |
Prasyarat
Tinjau persyaratan berikut sebelum Memulai:
Anda harus menjadi Pemilik atau Kontributor di langganan Azure Anda, dengan izin untuk membuat sumber daya.
Azure AI Search, Tingkat harga dasar atau yang lebih tinggi jika Anda ingin menggunakan identitas layanan pencarian untuk koneksi ke sumber data Azure, jika tidak, Anda dapat menggunakan tingkat apa pun, tunduk pada batas tingkat.
Azure OpenAI, dengan penyebaran model penyematan yang didukung . Vektorisasi diintegrasikan ke dalam alur kerja. Jika Anda tidak memerlukan vektor, Anda dapat mengabaikan bidang atau mencoba strategi pengindeksan lain.
Azure Logic Apps adalah wilayah yang didukung. Ini harus memiliki identitas terkelola yang ditetapkan sistem jika Anda ingin menggunakan autentikasi ID Microsoft Entra pada koneksi daripada kunci API.
Nota
Alur kerja aplikasi logika adalah sumber daya yang dapat ditagih. Untuk informasi selengkapnya, lihat Harga Azure Logic Apps.
Wilayah yang didukung
Fungsionalitas end-to-end tersedia di wilayah berikut, yang menyediakan koneksi sumber data, pemecahan dokumen menjadi bagian-bagian, segmen dokumen, dukungan untuk model penyematan Azure OpenAI, dan dukungan pengindeksan bawaan untuk mengambil data. Wilayah berikut untuk Azure Logic Apps menyediakan ParseDocument tindakan yang menjadi dasar integrasi pengindeksan.
- US Timur
- US Timur 2
- US Tengah Selatan
- Barat AS 2
- Barat AS 3
- Brasil Selatan
- Australia Timur
- Asia Timur
- Asia Tenggara
- Eropa Utara
- Swedia Tengah
- UK Selatan
Model yang didukung
Jalur aplikasi logika melalui wizard Impor data (baru) mendukung pilihan model-model penyematan.
Sebarkan salah satu model penyematan berikut di Azure OpenAI untuk alur kerja end-to-end Anda.
- teks-penanaman-3-kecil
- penyisipan-teks-3-besar
- text-embedding-ada-002
Konektor yang didukung
Konektor berikut berguna untuk mengindeks data yang tidak terstruktur, sebagai pelengkap pengindeks klasik yang terutama menargetkan data terstruktur.
Tindakan yang didukung
Integrasi aplikasi logika mencakup tindakan pengindeksan berikut. Untuk informasi selengkapnya, lihat Menyambungkan ke Foundry Tools dari alur kerja di Azure Logic Apps.
- Periksa data baru.
- Dapatkan datanya. Sebuah tindakan HTTP yang mengambil dokumen yang diunggah dengan menggunakan URL file dari keluaran pemicu.
- Buat detail dokumen. Tindakan Operasi Data yang menggabungkan berbagai item.
- Buat string token. Tindakan Operasi Data yang menghasilkan string token menggunakan output dari tindakan Buat.
- Membuat potongan konten. Tindakan Operasi Data yang membagi string token menjadi beberapa bagian, berdasarkan jumlah karakter atau token per potongan konten.
- Mengonversi data yang ditokenisasi ke JSON. Tindakan Operasi Data yang mengonversi potongan string token menjadi array JSON.
- Pilih item array JSON. Tindakan Operasi Data yang memilih beberapa item dari array JSON.
- Hasilkan pemrosesan embedding. Tindakan Azure OpenAI yang menghasilkan embedding untuk setiap item array JSON.
- Pilih penyematan dan informasi lainnya. Tindakan Operasi Data yang memilih penyematan dan informasi dokumen lainnya.
- Indekskan data. Tindakan Pencarian Azure AI yang mengindeks data berdasarkan setiap penyematan yang dipilih.
Ini juga mendukung tindakan kueri berikut:
- Tunggu perintah input. Pemicu yang melakukan polling atau menunggu data baru tiba, baik berdasarkan pengulangan terjadwal atau sebagai respons terhadap peristiwa tertentu masing-masing.
- Pesan sistem input untuk model. Tindakan Operasi Data yang menyediakan input untuk melatih model.
- Masukkan contoh pertanyaan dan respons. Tindakan Operasi Data yang memberikan contoh pertanyaan pelanggan dan peran terkait untuk melatih model.
- Pesan input sistem untuk pencarian. Aksi Operasi Data yang menyediakan masukan kueri pencarian untuk melatih model.
- Buat kueri pencarian. Aksi Kode Inline yang menggunakan JavaScript untuk membuat kueri pencarian untuk toko vektor, berdasarkan output dari aksi Komposisi sebelumnya.
- Mengonversi kueri menjadi embedding. Tindakan Azure OpenAI yang terhubung ke API penyelesaian obrolan, yang menjamin respons yang andal dalam percakapan obrolan.
- Dapatkan penyematan. Tindakan Azure OpenAI yang mendapatkan penyematan vektor tunggal.
- Cari database vektor. Tindakan Pencarian Azure AI yang menjalankan pencarian di penyimpanan vektor.
- Buat perintah. Tindakan Kode Sebaris yang menggunakan JavaScript untuk membuat perintah.
- Selesaikan chat. Tindakan Azure OpenAI yang terhubung ke API penyelesaian obrolan, yang menjamin respons yang andal dalam percakapan obrolan.
- Mengembalikan respon. Aksi Permintaan yang mengembalikan hasil kepada pemanggil ketika pemicu Permintaan digunakan.
Keterbatasan
- Indeks pencarian dihasilkan menggunakan skema tetap (ID dokumen, konten, dan konten vektor), dengan ekstraksi teks saja. Anda dapat mengubah indeks selama pembaruan tidak memengaruhi bidang yang ada.
- Vektorisasi hanya mendukung penyematan teks.
- Deteksi penghapusan tidak didukung. Anda harus menghapus dokumen yatim secara manual dari indeks.
- Dokumen duplikat dalam indeks pencarian adalah masalah yang diketahui dalam pratinjau ini. Pertimbangkan untuk menghapus objek dan memulai kembali jika ini menjadi masalah.
- Tidak ada dukungan untuk endpoint pribadi dalam alur kerja aplikasi logika yang dibuat oleh panduan portal. Alur kerja dihosting menggunakan opsi hosting Konsumsi dan tunduk pada batasannya. Untuk menggunakan opsi hosting Standar , gunakan pendekatan terprogram untuk membuat alur kerja.
- Semua tindakan umumnya tersedia kecuali untuk
Membuat alur kerja aplikasi logika
Ikuti langkah-langkah ini untuk membuat alur kerja aplikasi logika untuk mengindeks konten di Azure AI Search.
Mulai panduan langkah-langkah Impor data (baru) di portal Azure.
Di Sambungkan ke data Anda, berikan awalan nama yang digunakan untuk indeks pencarian dan alur kerja. Memiliki nama umum membantu Anda mengelolanya bersama-sama.
Tentukan frekuensi pengindeksan. Jika Anda memilih sesuai jadwal, templat yang menyertakan opsi penjadwalan digunakan untuk membuat alur kerja. Anda dapat mengubah jadwal pengindeksan di langkah Indeks beberapa dokumen alur kerja setelah dibuat.
Pilih jenis autentikasi tempat alur kerja aplikasi logika tersambung ke mesin pencari dan memulai proses pengindeksan. Alur kerja dapat terhubung menggunakan kunci Azure AI Search API atau wizard dapat membuat penugasan peran yang memberikan izin kepada identitas terkelola yang ditetapkan sistem Logic Apps, dengan mengasumsikan bahwa ia ada.
Pilih Berikutnya untuk melanjutkan ke halaman berikutnya.
Di Vektorisasi teks Anda, berikan penyebaran model dan informasi koneksi Azure OpenAI. Pilih langganan dan layanan, model penyematan teks yang didukung, dan jenis autentikasi yang digunakan alur kerja untuk menyambungkan ke Azure OpenAI.
Pilih Berikutnya untuk melanjutkan ke halaman berikutnya. Tinjau konfigurasi.
Pilih Buat untuk mulai memproses.
Alur kerja berjalan sebagai alur kerja tanpa server di Logic Apps (Consumption), terpisah dari layanan AI Search.
Konfirmasi pembuatan indeks di portal Microsoft Azure, di halaman Indeks di Pencarian Azure AI. Penjelajah Pencarian adalah tab pertama. Pilih Cari untuk mengembalikan beberapa konten.
Mengubah objek yang ada
Anda dapat melakukan modifikasi berikut pada indeks pencarian tanpa melanggar pengindeksan:
- Menambahkan profil penilaian
- Menambahkan peringkat semantik
- Tambahkan pemeriksaan ejaan
- Menambahkan peta sinonim
- Menambahkan pemberi saran
Anda dapat membuat pembaruan berikut untuk alur kerja tanpa melanggar pengindeksan:
- Ubah Daftar file dalam folder untuk mengubah jumlah dokumen yang dikirim ke pengindeksan.
- Ubah Teks Gugus untuk variasi input token. Ukuran token yang direkomendasikan adalah 512 token untuk sebagian besar skenario.
- Ubah Teks Gugus untuk menambahkan panjang halaman yang tumpang tindih.
- Ubah langkah Indeks beberapa dokumen untuk mengontrol frekuensi pengindeksan jika Anda memilih pengindeksan terjadwal dalam wizard.
Di perancang aplikasi logika, tinjau alur kerja dan setiap langkah dalam alur pengindeksan. Alur kerja menentukan ekstraksi dokumen, pemotongan dokumen default (keterampilan Pemisahan Teks), penyematan (keterampilan penyematan Azure OpenAI), pemetaan bidang output, dan akhirnya pengindeksan.
Manajemen templat dan alur kerja
Wizard membuat templat dan alur kerja saat Anda menentukan pengindeks Logic Apps. Untuk membuat dan mengelolanya, termasuk penghapusan templat, gunakan perancang aplikasi logika. Dasbor layanan pencarian portal Microsoft Azure tidak menyediakan templat atau manajemen alur kerja, dan saat ini tidak ada dukungan terprogram di AZURE AI Search API.