Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Bagian dari membuat layanan pencarian adalah memilih tingkat harga (atau SKU). Di portal Azure, tingkat harga ditentukan di halaman Pilih Tingkat Harga saat Anda membuat layanan. Di PowerShell atau Azure CLI, tingkat ditentukan melalui -Sku
parameter .
Tingkat menentukan:
- Jumlah maksimum indeks dan objek lain yang diizinkan pada layanan.
- Ukuran dan kecepatan partisi (penyimpanan fisik).
- Tarif yang dapat ditagih sebagai biaya bulanan tetap, tetapi juga biaya tambahan jika Anda menambahkan kapasitas.
- Karakteristik beban kerja. Beberapa tingkatan dioptimalkan untuk beban kerja tertentu.
Dalam beberapa kasus, tingkat yang Anda pilih menentukan ketersediaan fitur premium.
Tarif penagihan ditampilkan di halaman Pilih Tingkat Harga portal Azure. Anda dapat memeriksa halaman harga untuk tarif regional dan meninjau Rencana dan mengelola biaya untuk mempelajari selengkapnya tentang model penagihan.
Catatan
layanan Pencarian yang dibuat setelah 3 April 2024 memiliki partisi yang lebih besar dan kuota vektor yang lebih tinggi di hampir setiap tingkatan. Untuk informasi selengkapnya, lihat Batas layanan.
Deskripsi kategori
Tingkatan meliputi Gratis, Dasar, Standar, dan Penyimpanan Dioptimalkan. Standar dan Penyimpanan Dioptimalkan tersedia dengan beberapa konfigurasi dan kapasitas. Cuplikan layar berikut dari portal Azure menunjukkan tingkat yang tersedia tanpa mencantumkan harga (yang dapat Anda temukan di portal Azure dan di halaman penentuan harga).
Gratis membuat layanan pencarian terbatas untuk proyek yang lebih kecil, seperti menjalankan tutorial dan sampel kode. Secara internal, sumber daya sistem dibagikan di antara beberapa pelanggan. Anda tidak dapat menskalakan layanan gratis, menjalankan beban kerja yang signifikan, dan beberapa fitur premium tidak tersedia. Anda hanya dapat memiliki satu layanan pencarian gratis per langganan Azure. Jika layanan tidak aktif untuk jangka waktu yang lama, layanan mungkin dihapus untuk membebaskan kapasitas, terutama jika wilayah berada di bawah batasan kapasitas.
Tingkat yang dapat ditagih yang paling umum digunakan meliputi:
Dasar memiliki kemampuan untuk memenuhi SLA (Perjanjian Tingkat Layanan) dengan dukungannya untuk tiga replika.
Standar (S1, S2, S3) adalah default. Ini memberi Anda lebih banyak fleksibilitas dalam penskalaan untuk beban kerja. Anda dapat mengubah skala partisi dan replika. Dengan sumber daya khusus di bawah kendali Anda, Anda dapat menyebarkan proyek yang lebih besar, mengoptimalkan kinerja, dan meningkatkan kapasitas.
Beberapa tingkatan dirancang untuk jenis pekerjaan tertentu:
Kepadatan Tinggi Standar 3 (S3 HD) adalah mode hosting untuk S3, di mana perangkat keras yang mendasarinya dioptimalkan untuk sejumlah besar indeks yang lebih kecil dan ditujukan untuk skenario multitenansi. S3 HD memiliki biaya per unit yang sama dengan S3, tetapi perangkat kerasnya dioptimalkan untuk pembacaan file yang cepat pada sejumlah besar indeks yang lebih kecil.
Tingkat Storage Optimized (L1, L2) menawarkan kapasitas penyimpanan yang lebih besar dengan harga yang lebih rendah per TB daripada tingkat Standar. Tingkatan ini dirancang untuk indeks besar yang tidak terlalu sering berubah. Konsekuensi utamanya adalah latensi kueri yang lebih tinggi, yang harus Anda validasi untuk persyaratan aplikasi spesifik Anda.
Anda dapat mengetahui selengkapnya tentang berbagai tingkatan di halaman harga, di artikel Batas layanan di Azure AI Search, dan di halaman portal Azure saat Anda menyediakan layanan.
Ketersediaan wilayah menurut tingkat
Daftar wilayah menyediakan lokasi tempat Azure AI Search ditawarkan. Beberapa wilayah mungkin memiliki batasan kapasitas untuk tingkat tertentu, yang mencegah pembuatan layanan pencarian baru pada tingkat tersebut. Daftar menggunakan catatan kaki untuk menunjukkan wilayah dan tingkatan yang dibatasi.
Saat Anda membuat layanan pencarian di portal Microsoft Azure, kombinasi tingkat wilayah yang tidak tersedia secara otomatis dikecualikan.
Ketersediaan fitur berdasarkan tingkatan
Sebagian besar fitur tersedia di semua tingkatan, termasuk tingkat Gratis. Dalam beberapa kasus, tingkat menentukan ketersediaan fitur. Tabel berikut ini menjelaskan batasan.
Fitur | Pertimbangan tingkatan |
---|---|
pengindeks | Pengindeks tidak tersedia di S3 HD. Pengindeks memiliki lebih banyak batasan pada tingkat gratis. |
parameter konfigurasi pengindeks executionEnvironment |
Kemampuan untuk menyematkan semua pemrosesan pengindeksan hanya untuk kluster pencarian yang dialokasikan untuk layanan pencarian Anda memerlukan S2 atau lebih tinggi. |
Pengayaan AI | Berjalan pada tingkat Gratis tetapi tidak direkomendasikan. |
Identitas terkelola atau tepercaya untuk akses keluar (pengindeks) | Tidak tersedia di tingkat Gratis. |
Kunci enkripsi yang dikelola pelanggan | Tidak tersedia di tingkat Gratis. |
Akses firewall IP | Tidak tersedia di tingkat Gratis. |
Titik akhir privat (integrasi dengan Azure Private Link) | Untuk koneksi masuk ke layanan pencarian, tidak tersedia pada tingkat Gratis. Untuk koneksi keluar oleh pengindeks ke sumber daya Azure lainnya, tidak tersedia pada Gratis atau S3 HD. Untuk pengindeks yang menggunakan set kemampuan, tidak tersedia pada Gratis, Dasar, S1, atau S3 HD. |
Zona Ketersediaan | Tidak tersedia di tingkat Gratis atau Dasar. |
Pemeringkat semantik | Tidak tersedia di tingkat Gratis. |
Fitur intensif sumber daya mungkin tidak berfungsi dengan baik kecuali Anda memberikan kapasitas yang memadai. Misalnya, Pengayaan AI memiliki kemampuan yang berjalan lama dan kedaluwarsa pada layanan Gratis kecuali jika kumpulan datanya kecil.
Batas atas
Tingkatan menentukan penyimpanan maksimum layanan itu sendiri, ditambah jumlah maksimum indeks, pengindeks, sumber data, set keterampilan, dan peta sinonim yang dapat Anda buat. Untuk perincian penuh dari semua batas, lihat Batas layanan di Azure AI Search.
Ukuran dan kecepatan partisi
Harga tingkat mencakup detail tentang penyimpanan per partisi yang berkisar antara 15 GB untuk Dasar, hingga 2 TB untuk tingkat Storage Optimized (L2). Karakteristik perangkat keras lainnya, seperti kecepatan operasi, latensi, dan laju transfer, tidak diterbitkan, tetapi tingkatan yang dirancang untuk arsitektur solusi tertentu dibangun di atas perangkat keras yang memiliki fitur untuk mendukung skenario tersebut. Untuk informasi selengkapnya tentang partisi, lihat Memperkirakan dan mengelola kapasitas dan Keandalan di Azure AI Search.
Catatan
Partisi kapasitas yang lebih tinggi tersedia di wilayah tertentu pada bulan April 2024. Gelombang kedua partisi berkapasitas lebih tinggi diluncurkan pada Mei 2024. Jika Anda memiliki layanan pencarian yang lebih lama, Anda mungkin dapat meningkatkan layanan Anda untuk mendapatkan manfaat dari lebih banyak kapasitas dengan tarif penagihan yang sama.
Tarif penagihan
Tingkatan memiliki tarif penagihan yang berbeda, dengan tarif yang lebih tinggi untuk tingkatan yang berjalan pada perangkat keras yang lebih mahal atau menyediakan fitur yang lebih mahal. Tingkat penagihan dapat ditemukan di halaman harga Azure untuk Azure AI Search.
Setelah Anda membuat layanan, tingkat penagihan menjadi biaya tetap untuk menjalankan layanan sepanjang waktu dan biaya tambahan jika Anda memilih untuk menambahkan lebih banyak kapasitas.
Sumber daya komputasi untuk layanan pencarian dialokasikan dalam bentuk partisi (untuk penyimpanan) dan replika (instansi mesin kueri). Awalnya, layanan dibuat dengan salah satu dari masing-masing bentuk, dan tarif penagihan sudah termasuk kedua sumber daya. Namun, jika Anda menskalakan kapasitas, biaya akan naik atau turun sesuai dengan kenaikan tarif yang dapat ditagih.
Contoh berikut memberikan ilustrasi. Misalnya tingkat penagihan hipotetis sebesar $100 per bulan. Jika Anda mempertahankan layanan pencarian pada kapasitas awalnya dengan satu partisi dan satu replika, maka $100 adalah biaya yang dapat Anda harapkan untuk dibayar pada akhir bulan. Namun, jika Anda menambahkan dua replika lagi untuk mencapai ketersediaan tinggi, tagihan bulanan meningkat menjadi $300 ($100 untuk pasangan replika-partisi pertama, diikuti oleh $200 untuk dua replika).
Model penagihan ini didasarkan pada konsep penerapan tarif penagihan ke search units (SU) yang digunakan oleh layanan pencarian. Semua layanan awalnya diprovisikan di satu SU, tetapi Anda dapat meningkatkan SU dengan menambahkan partisi atau replika untuk menangani beban kerja yang lebih besar. Untuk mengetahui informasi selengkapnya, lihat Cara memperkirakan biaya layanan pencarian.
Perubahan tingkat
Layanan dapat dialihkan antara tingkat Dasar dan Standar (S1, S2, dan S3). Saat ini, Anda hanya dapat beralih dari tingkat yang lebih rendah ke tingkat yang lebih tinggi, seperti beralih dari Dasar ke S1. Wilayah Anda juga tidak dapat memiliki batasan kapasitas pada tingkat yang lebih tinggi. Untuk informasi selengkapnya, lihat Mengubah tingkat harga Anda.
Jika Anda ingin beralih ke tingkat yang lebih rendah atau ke tingkat yang berbeda dari yang tercantum sebelumnya, pendekatannya adalah:
Buat layanan pencarian baru di tingkat baru.
Sebarkan konten pencarian Anda ke layanan baru. Ikuti cek daftar ini untuk memastikan Anda memiliki semua konten.
Hapus layanan pencarian lama saat Anda yakin layanan tersebut tidak lagi diperlukan.
Untuk indeks besar yang tidak ingin Anda bangun kembali dari awal, pertimbangkan untuk menggunakan salah satu sampel cadangan dan pemulihan untuk memindahkannya:
- Sampel pencadangan dan pemulihan (C#)
- Sampel pencadangan dan pemulihan (Python)
- Pencadangan dan pemulihan indeks terbesar (Python)
Langkah berikutnya
Cara terbaik untuk memilih tingkat harga adalah dengan memulai dengan tingkat yang paling murah, lalu memungkinkan pengalaman dan pengujian untuk menginformasikan keputusan Anda untuk menjaga layanan atau beralih ke tingkat yang lebih tinggi.
Untuk langkah selanjutnya, kami sarankan Anda membuat layanan pencarian di tingkat yang dapat mengakomodasi tingkat pengujian yang Anda usulkan untuk dilakukan, lalu meninjau panduan berikut tentang memperkirakan biaya dan kapasitas: