Keandalan dalam Azure AI Search

Azure AI Search adalah infrastruktur pencarian yang dapat diskalakan yang mengindeks konten heterogen dan memungkinkan pengambilan melalui API, aplikasi, dan agen AI. Ini cocok untuk skenario pencarian perusahaan dan pengalaman pelanggan yang didukung AI yang memerlukan pembuatan konten dinamis melalui model penyelesaian obrolan. Sebagai layanan Azure, Pencarian AI menyediakan berbagai kemampuan untuk mendukung persyaratan keandalan Anda.

Saat Anda menggunakan Azure, keandalan adalah tanggung jawab bersama. Microsoft menyediakan berbagai kemampuan untuk mendukung ketahanan dan pemulihan. Anda bertanggung jawab untuk memahami cara kerja kemampuan tersebut dalam semua layanan yang Anda gunakan, dan memilih kemampuan yang Anda butuhkan untuk memenuhi tujuan bisnis dan tujuan waktu aktif Anda.

Artikel ini menjelaskan cara membuat Azure AI Search tahan terhadap berbagai potensi pemadaman dan masalah, termasuk kesalahan sementara, pemadaman zona ketersediaan, pemadaman wilayah, dan pemeliharaan layanan. Ini juga menjelaskan bagaimana Anda dapat menggunakan cadangan untuk memulihkan dari jenis masalah lain, dan menyoroti beberapa informasi utama tentang perjanjian tingkat layanan (SLA) Azure AI Search.

Rekomendasi implementasi produksi untuk keandalan

Untuk beban kerja produksi, kami sarankan Anda:

Gunakan tingkat tarif yang memiliki setidaknya dua replika. Konfigurasi ini membuat layanan pencarian Anda lebih tahan terhadap kesalahan sementara dan operasi pemeliharaan. Ini juga memenuhi perjanjian tingkat layanan (SLA) untuk Pencarian AI. SLA memerlukan dua replika untuk beban kerja baca-saja dan tiga replika atau lebih untuk beban kerja baca-tulis.
Jangan gunakan tingkat Gratis untuk penggunaan produksi. Pencarian AI tidak menyediakan Perjanjian Tingkat Layanan (SLA) untuk tingkat Gratis, yang terbatas pada satu replika.

Gambaran umum arsitektur keandalan

Saat menggunakan Pencarian AI, Anda membuat layanan pencarian. Setiap layanan pencarian mendukung banyak indeks pencarian yang menyimpan konten yang dapat dicari.

Pencarian AI tidak dirancang sebagai penyimpanan data utama. Sebagai gantinya, Anda menggunakan pengindeks untuk menyambungkan layanan pencarian Anda ke sumber data eksternal. Pengindeks merayapi data sumber, memanggil keterampilan yang melakukan pemrosesan dan pengayaan, dan mengisi indeks Anda dengan output keterampilan.

Anda juga mengonfigurasi jumlah replika untuk layanan Anda. Dalam Pencarian AI, replika adalah salinan dari mesin pencari yang digunakan oleh layanan Anda. Anda dapat menganggap replika sebagai mewakili satu komputer virtual (VM). Setiap layanan pencarian dapat memiliki antara 1 dan 12 replika.

Penambahan beberapa replika memungkinkan Pencarian AI untuk:

Tingkatkan ketersediaan layanan pencarian Anda.
Lakukan pemeliharaan pada satu replika sambil kueri tetap berjalan pada replika-replika lainnya.
Tangani beban kerja pengindeksan dan kueri yang lebih tinggi.
Tingkatkan ketahanan dengan mencoba menyediakan replika di zona ketersediaan yang berbeda, jika wilayah Anda mendukungnya.

Pencarian AI secara otomatis menetapkan satu replika untuk menjadi replika utama. Semua operasi tulis dilakukan terhadap replika tersebut. Replika lainnya digunakan untuk operasi pembacaan.

Diagram berikut menggambarkan bagaimana layanan pencarian dengan tiga replika mungkin tersebar di tiga zona ketersediaan:

Anda juga dapat mengonfigurasi jumlah partisi, yang mewakili penyimpanan yang digunakan indeks pencarian.

Penting untuk memahami dampak penambahan replika dan partisi karena masing-masing memengaruhi performa baca dan tulis dengan cara yang berbeda. Untuk informasi selengkapnya tentang replika dan partisi, lihat Memperkirakan dan mengelola kapasitas layanan pencarian.

Ketahanan terhadap kesalahan sementara

Kesalahan sementara adalah kegagalan yang bersifat sementara dan intermiten dalam komponen. Mereka sering terjadi di lingkungan terdistribusi seperti cloud, dan mereka adalah bagian normal dari operasi. Kesalahan sementara memperbaiki diri setelah waktu yang singkat. Penting bahwa aplikasi Anda dapat menangani kesalahan sementara, biasanya dengan mencoba kembali permintaan yang terpengaruh.

Semua aplikasi yang dihosting cloud harus mengikuti panduan penanganan kesalahan sementara Azure saat berkomunikasi dengan API, database, dan komponen lain yang dihosting cloud. Untuk informasi selengkapnya, lihat Rekomendasi untuk menangani kesalahan sementara.

Pengindeks Pencarian AI memiliki penanganan kesalahan sementara bawaan. Jika sumber data tidak tersedia secara singkat, pengindeks dirancang untuk memulihkan dan mencoba kembali. Ini menggunakan pelacakan perubahan untuk melanjutkan pengindeksan dari dokumen terakhir yang berhasil diindeks.

Layanan pencarian mungkin mengalami kesalahan sementara selama operasi pemeliharaan standar yang tidak terjadwal. Azure AI Search tidak memberikan pemberitahuan terlebih dahulu atau mengizinkan penjadwalan pemeliharaan pada waktu tertentu. Meskipun setiap upaya dilakukan untuk meminimalkan waktu henti, bahkan untuk layanan replika tunggal, gangguan singkat masih dapat terjadi. Untuk meningkatkan ketahanan terhadap kesalahan sementara ini, kami sarankan Anda menggunakan dua replika atau lebih.

Jika Anda membangun aplikasi apa pun yang berinteraksi dengan AI Search, aplikasi tersebut harus menangani kesalahan sementara. Gunakan strategi coba lagi dengan backoff eksponensial untuk operasi baca dan tulis.

Ketahanan terhadap kegagalan zona ketersediaan

Zona ketersediaan adalah grup pusat data yang terpisah secara fisik dalam wilayah Azure. Ketika satu zona gagal, layanan dapat melakukan failover ke salah satu zona yang tersisa.

Pencarian AI adalah layanan pencarian yang memiliki redundansi zona, yang berarti bahwa replika Anda didistribusikan di beberapa zona ketersediaan dalam wilayah layanan pencarian.

Saat Anda menambahkan dua replika atau lebih ke layanan Anda, Pencarian AI mencoba menempatkan setiap replika di zona ketersediaan yang berbeda. Untuk layanan yang memiliki lebih banyak replika daripada zona yang tersedia, replika didistribusikan di seluruh zona secara merata.

Diagram berikut menggambarkan bagaimana contoh layanan pencarian dengan empat replika mungkin disebarkan di tiga zona ketersediaan:

Penting

Pencarian AI tidak menjamin penempatan replika yang tepat. Penempatan tunduk pada batasan kapasitas, operasi penskalaan, dan faktor lainnya.

Persyaratan

Redundansi zona diaktifkan secara otomatis saat layanan pencarian Anda memenuhi semua kriteria berikut:

Dukungan wilayah: Dukungan untuk zona ketersediaan tergantung pada infrastruktur dan penyimpanan. Untuk daftar wilayah yang didukung, lihat Memilih wilayah untuk Pencarian AI.
Tier: Layanan Anda harus berada di tingkat Dasar atau yang lebih tinggi
Jumlah replika: Layanan Anda harus memiliki setidaknya dua replika

Nota

Pencarian AI mencoba mendistribusikan replika di beberapa zona saat Anda memiliki dua replika atau lebih. Namun, untuk beban kerja baca-tulis, Anda harus menggunakan tiga replika atau lebih sehingga Anda menerima SLA ketersediaan setingkat mungkin.

Distribusi instans di seluruh zona

Pencarian AI mencoba menempatkan replika di berbagai zona ketersediaan. Namun, terkadang ada situasi di mana semua replika layanan pencarian mungkin ditempatkan ke zona ketersediaan yang sama. Situasi ini dapat terjadi ketika replika dihapus dari layanan Anda, seperti ketika Anda menskalakan dengan mengonfigurasi layanan Anda untuk menggunakan lebih sedikit replika. Penghapusan replika tidak memicu replika yang tersisa untuk menyeimbangkan ulang di seluruh zona ketersediaan.

Untuk mengurangi kemungkinan semua replika Anda ditempatkan ke dalam satu zona ketersediaan, Anda dapat memicu secara manual operasi skala-out segera setelah operasi skala-in. Misalnya, layanan pencarian Anda memiliki 10 replika dan Anda ingin menskalakan ke 7 replika. Alih-alih melakukan operasi skala tunggal, Anda dapat menskalakan sementara ke 6 instans dan kemudian segera menskalakan ke 7 instans untuk memicu penyeimbangan ulang zona.

Biaya

Setiap layanan pencarian dimulai dengan satu replika. Redundansi zona memerlukan dua replika atau lebih, yang meningkatkan biaya untuk menjalankan layanan. Untuk memahami implikasi penagihan replika, gunakan kalkulator harga.

Mengonfigurasi dukungan zona ketersediaan

Jika layanan pencarian Anda memenuhi persyaratan untuk redundansi zona, tidak ada konfigurasi tambahan yang diperlukan. Jika memungkinkan, Pencarian AI mencoba menempatkan replika Anda di zona ketersediaan yang berbeda.

Perencanaan dan manajemen kapasitas

Untuk mempersiapkan kegagalan zona ketersediaan, pertimbangkan untuk menyediakan jumlah replika secara berlebihan. Provisi berlebih memungkinkan layanan pencarian untuk mentolerir beberapa kehilangan kapasitas dan terus berfungsi tanpa penurunan performa. Menambahkan replika selama pemadaman sangat menantang, jadi provisi berlebih membantu memastikan bahwa layanan pencarian Anda dapat menangani volume permintaan normal, bahkan dengan kapasitas yang berkurang. Untuk informasi selengkapnya, lihat Mengelola kapasitas dengan pengalokasian berlebih.

Perilaku ketika semua zona sehat

Bagian ini menjelaskan apa yang diharapkan ketika layanan pencarian dikonfigurasi untuk redundansi zona dan semua zona ketersediaan beroperasi.

Pengaturan lalu lintas antar zona: Pencarian AI melakukan penyeimbangan beban otomatis dari semua kueri dan penulisan di antara semua replika yang tersedia. Pencarian AI dapat mengirimkan operasi pembacaan ke replika mana pun di zona ketersediaan mana pun. Ini mengirimkan operasi tulis ke satu replika utama yang dipilih oleh layanan AI Search.
Replikasi data antar zona: Perubahan data secara otomatis direplikasi antar replika di seluruh zona ketersediaan. Replikasi terjadi secara asinkron, yang berarti bahwa penulisan diterapkan ke satu replika utama sebelum direplikasi ke replika lain.

Perilaku selama kegagalan zona

Bagian ini menjelaskan apa yang dapat diharapkan ketika layanan pencarian dikonfigurasi untuk redundansi zona, dan terjadi pemadaman di zona ketersediaan.

Deteksi dan respons: Pencarian AI bertanggung jawab untuk mendeteksi kegagalan di zona ketersediaan. Anda tidak perlu melakukan apa pun untuk memulai failover zona.

Pemberitahuan: Microsoft tidak secara otomatis memberi tahu Anda saat zona tidak berfungsi. Namun, Anda dapat menggunakan Azure Resource Health untuk memantau kesehatan sumber daya individual, dan Anda dapat menyiapkan pemberitahuan Resource Health untuk memberi tahu Anda tentang masalah. Anda juga dapat menggunakan Azure Service Health untuk memahami kesehatan layanan secara keseluruhan, termasuk kegagalan zona apa pun, dan Anda dapat menyiapkan pemberitahuan Service Health untuk memberi tahu Anda tentang masalah.

Permintaan aktif: Permintaan agar proses replika di zona yang gagal dihentikan. Klien harus mencoba kembali permintaan dengan mengikuti panduan untuk menangani kesalahan sementara.
Kehilangan data yang diharapkan: Jika zona ketersediaan yang terpengaruh hanya berisi replika baca, tidak ada kehilangan data yang diharapkan.

Jika replika utama hilang karena berada di zona yang terpengaruh, maka operasi tulis apa pun yang belum direplikasi mungkin hilang.
Waktu henti yang diperkirakan: Dalam kebanyakan situasi, kegagalan zona tidak diharapkan menimbulkan waktu henti pada layanan pencarian Anda untuk operasi baca karena replika baca di zona ketersediaan lain terus memproses permintaan.

Jika replika utama hilang karena berada di zona yang terpengaruh, Pencarian AI secara otomatis mempromosikan replika lain untuk menjadi primer baru sehingga operasi tulis dapat dilanjutkan. Biasanya perlu waktu beberapa detik agar promosi replika terjadi. Selama waktu ini, operasi tulis mungkin tidak berhasil. Pastikan aplikasi Anda disiapkan dengan mengikuti panduan penanganan kesalahan sementara.

Namun, ada beberapa situasi yang tidak mungkin terjadi di mana semua replika layanan pencarian Anda mungkin berada dalam satu zona ketersediaan. Dalam skenario ini, Anda mungkin mengalami waktu henti hingga zona pulih. Untuk informasi selengkapnya, dan untuk memahami cara mengatasinya, lihat Distribusi Instans.
Pengalihan lalu lintas: Ketika zona gagal, Pencarian AI mendeteksi kegagalan dan mengalihkan permintaan ke replika aktif di zona yang masih aktif. Jika replika utama hilang, replika lain dipromosikan menjadi primer baru.

Pemulihan Zona

Saat zona ketersediaan pulih, Pencarian AI secara otomatis memulihkan operasi normal dan mulai merutekan lalu lintas ke replika yang tersedia di semua zona, termasuk zona yang dipulihkan.

Uji kegagalan zona

Pencarian AI mengelola perutean lalu lintas untuk layanan yang memiliki redundansi zona. Anda tidak perlu memulai atau memvalidasi proses kegagalan zona apa pun.

Ketahanan terhadap kegagalan di seluruh wilayah

Pencarian AI adalah layanan satu wilayah. Jika wilayah menjadi tidak tersedia, layanan pencarian Anda juga menjadi tidak tersedia.

Solusi multi-wilayah kustom untuk ketahanan

Anda dapat secara opsional menyebarkan beberapa layanan Pencarian AI di berbagai wilayah. Anda bertanggung jawab untuk menyebarkan dan mengonfigurasi layanan terpisah di setiap wilayah. Jika Anda membuat penyebaran yang identik di wilayah Azure sekunder yang menggunakan arsitektur multi-wilayah, aplikasi Anda menjadi kurang rentan terhadap bencana satu wilayah.

Saat mengikuti pendekatan ini, Anda harus menyinkronkan indeks di seluruh wilayah untuk memulihkan status aplikasi terakhir. Anda juga harus mengonfigurasi kebijakan penyeimbangan beban dan failover.

Untuk mengoptimalkan performa solusi Anda secara keseluruhan, cari peluang untuk melakukan pengindeksan pada replika baca-saja dari sumber data Anda. Misalnya, beberapa pengindeks mendukung pembacaan dari replika baca sumber data yang didistribusikan secara geografis.

Untuk informasi selengkapnya, lihat Penyebaran multi-wilayah di Azure AI Search.

Pencadangan dan pemulihan

Karena Pencarian AI bukan solusi penyimpanan data utama, ia tidak menyediakan opsi pencadangan dan pemulihan mandiri. Namun, Anda dapat menggunakan index-backup-restore sampel untuk .NET atau Python untuk mencadangkan definisi indeks Anda dan dokumennya ke serangkaian file JSON, yang kemudian digunakan untuk memulihkan indeks.

Namun, jika Anda secara tidak sengaja menghapus indeks dan tidak memiliki cadangan, Anda dapat membangun kembali indeks. Pembangunan ulang melibatkan pembuatan ulang indeks pada layanan pencarian Anda lalu memuat ulang dengan mengambil data dari penyimpanan data utama Anda.

Perjanjian tingkat layanan

Perjanjian tingkat layanan (SLA) untuk layanan Azure menjelaskan ketersediaan yang diharapkan dari setiap layanan dan kondisi yang harus dipenuhi solusi Anda untuk mencapai harapan ketersediaan tersebut. Untuk informasi selengkapnya, lihat SLA untuk layanan online.

Dalam Pencarian AI, ketersediaan SLA berlaku untuk layanan pencarian yang:

Dikonfigurasi untuk menggunakan tingkat berbayar.
Memiliki minimal dua replika untuk beban kerja hanya baca (kueri).
Memiliki setidaknya tiga replika untuk beban kerja baca-tulis (kueri dan pengindeksan).

Saran dan Komentar

Apakah halaman ini membantu?

Last updated on 2026-01-22