Memilih tingkat layanan untuk Pencarian Azure AI

Bagian dari membuat layanan pencarian adalah memilih tingkat harga (atau SKU) yang diperbaiki selama masa pakai layanan. Di portal, tingkat ditentukan di halaman Pilih Tingkat Harga saat Anda membuat layanan. Jika Anda menyediakan melalui PowerShell atau Azure CLI sebagai gantinya, tingkat ditentukan melalui parameter -Sku

Tingkatan yang Anda pilih menentukan:

  • Jumlah maksimum indeks dan objek lain yang diperbolehkan pada layanan
  • Ukuran dan kecepatan partisi (memori fisik)
  • Tarif yang dapat ditagih sebagai biaya bulanan tetap, tetapi juga menjadi biaya tambahan jika Anda menambahkan kapasitas

Dalam beberapa kasus, tingkat yang Anda pilih menentukan ketersediaan fitur premium.

Harga - atau perkiraan biaya bulanan untuk menjalankan layanan - ditampilkan di halaman Pilih Tingkat Harga. Anda perlu memeriksa harga layanan untuk mempelajari estimasi biaya.

Catatan

layanan Pencarian yang dibuat setelah 3 April 2024 memiliki partisi yang lebih besar dan kuota vektor yang lebih tinggi di hampir setiap tingkatan. Untuk informasi selengkapnya, lihat batas layanan.

Deskripsi tingkat

Tingkatan meliputi Gratis, Dasar, Standar, dan Penyimpanan Dioptimalkan. Standar dan Penyimpanan Dioptimalkan tersedia dengan beberapa konfigurasi dan kapasitas. Cuplikan layar berikut dari portal Azure menunjukkan tingkat yang tersedia, harga minus (yang dapat Anda temukan di portal dan di halaman harga).

Bagan tingkat harga

Gratis membuat layanan pencarian terbatas untuk proyek yang lebih kecil, seperti menjalankan tutorial dan sampel kode. Secara internal, sumber daya sistem dibagikan di antara beberapa pelanggan. Anda tidak dapat menskalakan layanan gratis atau menjalankan beban kerja yang signifikan. Anda hanya dapat memiliki satu layanan pencarian gratis per langganan Azure.

Tingkat yang dapat ditagih yang paling umum digunakan meliputi yang berikut ini:

  • Dasar memiliki kemampuan untuk memenuhi SLA dengan dukungannya untuk tiga replika.

  • Standar (S1, S2, S3) adalah default. Ini memberi Anda lebih banyak fleksibilitas dalam penskalaan untuk beban kerja. Anda dapat menskalakan partisi dan replika. Dengan sumber daya khusus di bawah kendali Anda, Anda dapat menyebarkan proyek yang lebih besar, mengoptimalkan kinerja, dan meningkatkan kapasitas.

Beberapa tingkatan dirancang untuk jenis pekerjaan tertentu:

  • Kepadatan Tinggi Standar 3 (S3 HD) adalah mode hosting untuk S3, di mana perangkat keras yang mendasarinya dioptimalkan untuk sejumlah besar indeks yang lebih kecil dan ditujukan untuk skenario multitenansi. S3 HD memiliki biaya per unit yang sama dengan S3, tetapi perangkat kerasnya dioptimalkan untuk pembacaan file yang cepat pada sejumlah besar indeks yang lebih kecil.

  • Tingkat Storage Optimized (L1, L2) menawarkan kapasitas penyimpanan yang lebih besar dengan harga yang lebih rendah per TB daripada tingkat Standar. Tingkatan ini dirancang untuk indeks besar yang tidak terlalu sering berubah. Konsekuensi utamanya adalah latensi kueri yang lebih tinggi, yang harus Anda validasi untuk persyaratan aplikasi spesifik Anda.

Anda dapat mengetahui selengkapnya tentang berbagai tingkatan di halaman harga, di artikel Batas layanan di Azure AI Search , dan di halaman portal saat Anda menyediakan layanan.

Ketersediaan fitur berdasarkan tingkatan

Sebagian besar fitur tersedia di semua tingkatan, termasuk tingkat gratis. Dalam beberapa kasus, tingkat menentukan ketersediaan fitur. Tabel berikut ini menjelaskan batasan.

Fitur Batasan
pengindeks Pengindeks tidak tersedia di S3 HD. Pengindeks memiliki lebih banyak batasan pada tingkat gratis.
Pengayaan AI Berjalan pada tingkat Gratis tetapi tidak direkomendasikan.
Identitas terkelola atau tepercaya untuk akses keluar (pengindeks) Tidak tersedia di tingkat Gratis.
Kunci enkripsi yang dikelola pelanggan Tidak tersedia di tingkat Gratis.
Akses firewall IP Tidak tersedia di tingkat Gratis.
Titik akhir privat (integrasi dengan Azure Private Link) Untuk koneksi masuk ke layanan pencarian, tidak tersedia di tingkat Gratis. Untuk koneksi keluar oleh pengindeks ke sumber daya Azure lainnya, tidak tersedia pada Gratis atau S3 HD. Untuk pengindeks yang menggunakan set kemampuan, tidak tersedia pada Gratis, Dasar, S1, atau S3 HD.
Zona Ketersediaan Tidak tersedia di tingkat Gratis atau Dasar.
Pemeringkat semantik Tidak tersedia di tingkat Gratis.

Fitur intensif sumber daya mungkin tidak berfungsi dengan baik kecuali Anda memberikan kapasitas yang memadai. Misalnya, Pengayaan AI memiliki keterampilan jangka panjang yang habis pada layanan Gratis kecuali jika kumpulan datanya kecil.

Batas atas

Tingkatan menentukan penyimpanan maksimum layanan itu sendiri, serta jumlah maksimum indeks, pengindeks, sumber data, keterampilan, dan peta sinonim yang dapat Anda buat. Untuk perincian penuh dari semua batas, lihat Batas layanan di Azure AI Search.

Ukuran dan kecepatan partisi

Harga tingkat mencakup detail tentang penyimpanan per partisi yang berkisar antara 15 GB untuk Dasar, hingga 2 TB untuk tingkat Storage Optimized (L2). Karakteristik perangkat keras lainnya, seperti kecepatan operasi, latensi, dan laju transfer, tidak diterbitkan, tetapi tingkatan yang dirancang untuk arsitektur solusi tertentu dibangun di atas perangkat keras yang memiliki fitur untuk mendukung skenario tersebut. Untuk informasi selengkapnya tentang partisi, lihat Memperkirakan dan mengelola kapasitas dan Keandalan di Azure AI Search.

Tarif penagihan

Tingkatan memiliki tarif penagihan yang berbeda, dengan tarif yang lebih tinggi untuk tingkatan yang berjalan pada perangkat keras yang lebih mahal atau menyediakan fitur yang lebih mahal. Tingkat penagihan tingkat dapat ditemukan di halaman harga Azure untuk Azure AI Search.

Setelah Anda membuat layanan, tingkat penagihan menjadi biaya tetap untuk menjalankan layanan sepanjang waktu dan biaya tambahan jika Anda memilih untuk menambahkan lebih banyak kapasitas.

Layanan pencarian adalah sumber daya komputasi yang dialokasikan dalam bentuk partisi (untuk penyimpanan) dan replika (contoh mesin kueri). Awalnya, layanan dibuat dengan salah satu dari masing-masing bentuk, dan tarif penagihan sudah termasuk kedua sumber daya. Namun, jika Anda menskalakan kapasitas, biaya akan naik atau turun sesuai dengan kenaikan tarif yang dapat ditagih.

Contoh berikut memberikan ilustrasi. Misalnya tingkat penagihan hipotetis sebesar $100 per bulan. Jika Anda mempertahankan layanan pencarian pada kapasitas awalnya dari satu partisi dan satu replika, maka $100 adalah harga yang Anda bayarkan pada akhir bulan. Namun, jika Anda menambahkan dua replika lagi untuk mencapai ketersediaan tinggi, tagihan bulanan meningkat menjadi $300 ($100 untuk pasangan replika-partisi pertama, diikuti oleh $200 untuk dua replika).

Model penagihan ini didasarkan pada konsep penerapan tarif penagihan ke unit pencarian angka (SU) yang digunakan oleh layanan pencarian. Semua layanan awalnya diprovisikan di satu SU, tetapi Anda dapat meningkatkan SU dengan menambahkan partisi atau replika untuk menangani beban kerja yang lebih besar. Untuk mengetahui informasi selengkapnya, lihat Cara memperkirakan biaya layanan pencarian.

Peningkatan atau penurunan tingkat

Tidak ada dukungan bawaan untuk meningkatkan atau menurunkan tingkatan. Jika Anda ingin beralih ke tingkat yang berbeda, pendekatannya adalah:

  • Buat layanan pencarian baru di tingkat baru.

  • Sebarkan konten pencarian Anda ke layanan baru. Ikuti daftar periksa ini untuk memastikan Anda memiliki semua konten.

  • Hapus layanan pencarian lama setelah Anda yakin layanan tersebut tidak lagi diperlukan.

Untuk indeks besar yang tidak ingin Anda bangun kembali dari awal, pertimbangkan untuk menggunakan sampel pencadangan dan pemulihan untuk memindahkannya.

Langkah berikutnya

Cara terbaik untuk memilih tingkat harga adalah dengan memulai tingkat yang paling murah, lalu mengizinkan pengalaman dan pengujian menginformasikan keputusan Anda untuk mempertahankan layanan atau membuat yang baru di tingkat yang lebih tinggi. Untuk langkah-langkah berikutnya, sebaiknya buat layanan pencarian di tingkat yang dapat mengakomodasi tingkat pengujian yang Anda usulkan, lalu tinjau panduan berikut untuk rekomendasi tentang memperkirakan biaya dan kapasitas.