Baca dalam bahasa Inggris

Bagikan melalui


Memilih tingkat layanan untuk Pencarian Azure AI

Bagian dari membuat layanan pencarian adalah memilih tingkat harga (atau SKU) yang diperbaiki selama masa pakai layanan. Di portal Azure, tingkat ditentukan di halaman Pilih Tingkat Harga saat Anda membuat layanan. Di PowerShell atau Azure CLI, tingkat ditentukan melalui -Sku parameter .

Tingkat menentukan:

  • Jumlah maksimum indeks dan objek lain yang diperbolehkan pada layanan
  • Ukuran dan kecepatan partisi (memori fisik)
  • Tarif yang dapat ditagih sebagai biaya bulanan tetap, tetapi juga menjadi biaya tambahan jika Anda menambahkan kapasitas

Dalam beberapa kasus, tingkat yang Anda pilih menentukan ketersediaan fitur premium.

Tarif penagihan ditampilkan di halaman Pilih Tingkat Harga portal Azure. Anda dapat memeriksa halaman harga untuk tarif regional dan meninjau Rencana dan mengelola biaya untuk mempelajari selengkapnya tentang model penagihan.

Catatan

layanan Pencarian yang dibuat setelah 3 April 2024 memiliki partisi yang lebih besar dan kuota vektor yang lebih tinggi di hampir setiap tingkatan. Untuk informasi selengkapnya, lihat batas layanan.

Deskripsi tingkat

Tingkatan meliputi Gratis, Dasar, Standar, dan Penyimpanan Dioptimalkan. Standar dan Penyimpanan Dioptimalkan tersedia dengan beberapa konfigurasi dan kapasitas. Cuplikan layar berikut dari portal Azure menunjukkan tingkat yang tersedia, harga minus (yang dapat Anda temukan di portal Azure dan di halaman harga).

Bagan tingkat harga

Gratis membuat layanan pencarian terbatas untuk proyek yang lebih kecil, seperti menjalankan tutorial dan sampel kode. Secara internal, sumber daya sistem dibagikan di antara beberapa pelanggan. Anda tidak dapat menskalakan layanan gratis, menjalankan beban kerja yang signifikan, dan beberapa fitur premium tidak tersedia. Anda hanya dapat memiliki satu layanan pencarian gratis per langganan Azure. Jika layanan tidak aktif untuk jangka waktu yang lama, layanan mungkin dihapus untuk membebaskan kapasitas, terutama jika wilayah berada di bawah batasan kapasitas.

Tingkat yang dapat ditagih yang paling umum digunakan meliputi:

  • Dasar memiliki kemampuan untuk memenuhi SLA dengan dukungannya untuk tiga replika.

  • Standar (S1, S2, S3) adalah default. Ini memberi Anda lebih banyak fleksibilitas dalam penskalaan untuk beban kerja. Anda dapat menskalakan partisi dan replika. Dengan sumber daya khusus di bawah kendali Anda, Anda dapat menyebarkan proyek yang lebih besar, mengoptimalkan kinerja, dan meningkatkan kapasitas.

Beberapa tingkatan dirancang untuk jenis pekerjaan tertentu:

  • Kepadatan Tinggi Standar 3 (S3 HD) adalah mode hosting untuk S3, di mana perangkat keras yang mendasarinya dioptimalkan untuk sejumlah besar indeks yang lebih kecil dan ditujukan untuk skenario multitenansi. S3 HD memiliki biaya per unit yang sama dengan S3, tetapi perangkat kerasnya dioptimalkan untuk pembacaan file yang cepat pada sejumlah besar indeks yang lebih kecil.

  • Tingkat Storage Optimized (L1, L2) menawarkan kapasitas penyimpanan yang lebih besar dengan harga yang lebih rendah per TB daripada tingkat Standar. Tingkatan ini dirancang untuk indeks besar yang tidak terlalu sering berubah. Konsekuensi utamanya adalah latensi kueri yang lebih tinggi, yang harus Anda validasi untuk persyaratan aplikasi spesifik Anda.

Anda dapat mengetahui selengkapnya tentang berbagai tingkatan di halaman harga, di artikel Batas layanan di Azure AI Search, dan di halaman portal Azure saat Anda menyediakan layanan.

Ketersediaan wilayah menurut tingkat

Daftar wilayah yang didukung menyediakan lokasi tempat Azure AI Search ditawarkan.

Saat ini, beberapa wilayah berada pada kapasitas untuk tingkat tertentu dan tidak dapat digunakan untuk layanan pencarian baru. Jika Anda menggunakan portal Azure untuk membuat layanan pencarian, portal Azure mengecualikan kombinasi tingkat wilayah apa pun yang tidak tersedia.

Wilayah Tingkat yang dinonaktifkan (SKU) karena kelebihan kapasitas Alternatif yang disarankan
AS Timur 2 Dasar, S1 US Tengah
AS Tengah Bagian Selatan Semua tingkatan/tier AS Tengah
US Gov Virginia Semua tingkatan/tier US Gov Arizona
Eropa Barat Semua tingkatan/tier Eropa Tengah/Utara Swedia
AS Barat 3 Dasar, S1 AS Tengah
Eropa Utara S2, S3, S3 HD, L1, L2 UK Selatan

Ketersediaan fitur berdasarkan tingkatan

Sebagian besar fitur tersedia di semua tingkatan, termasuk tingkat gratis. Dalam beberapa kasus, tingkat menentukan ketersediaan fitur. Tabel berikut ini menjelaskan batasan.

Fitur Pertimbangan tingkat
pengindeks Pengindeks tidak tersedia di S3 HD. Pengindeks memiliki lebih banyak batasan pada tingkat gratis.
parameter konfigurasi pengindeks executionEnvironment Kemampuan untuk menyematkan semua pemrosesan pengindeks hanya untuk kluster pencarian yang dialokasikan untuk layanan pencarian Anda memerlukan S2 dan yang lebih tinggi.
Pengayaan AI Berjalan pada tingkat Gratis tetapi tidak direkomendasikan.
Identitas terkelola atau tepercaya untuk akses keluar (pengindeks) Tidak tersedia di tingkat Gratis.
Kunci enkripsi yang dikelola pelanggan Tidak tersedia di tingkat Gratis.
Akses firewall IP Tidak tersedia di tingkat Gratis.
Titik akhir privat (integrasi dengan Azure Private Link) Untuk koneksi masuk ke layanan pencarian, tidak tersedia di tingkat Gratis.
Untuk koneksi keluar oleh pengindeks ke sumber daya Azure lainnya, tidak tersedia pada Gratis atau S3 HD.
Untuk pengindeks yang menggunakan set kemampuan, tidak tersedia pada Gratis, Dasar, S1, atau S3 HD.
Availability Zones Tidak tersedia di tingkat Gratis atau Dasar.
Pemeringkat semantik Tidak tersedia di tingkat Gratis.

Fitur intensif sumber daya mungkin tidak berfungsi dengan baik kecuali Anda memberikan kapasitas yang memadai. Misalnya, Pengayaan AI memiliki keterampilan jangka panjang yang habis pada layanan Gratis kecuali jika kumpulan datanya kecil.

Batas atas

Tingkatan menentukan penyimpanan maksimum layanan itu sendiri, ditambah jumlah maksimum indeks, pengindeks, sumber data, set keterampilan, dan peta sinonim yang dapat Anda buat. Untuk perincian penuh dari semua batas, lihat Batas layanan di Azure AI Search.

Ukuran dan kecepatan partisi

Harga tingkat mencakup detail tentang penyimpanan per partisi yang berkisar antara 15 GB untuk Dasar, hingga 2 TB untuk tingkat Storage Optimized (L2). Karakteristik perangkat keras lainnya, seperti kecepatan operasi, latensi, dan laju transfer, tidak diterbitkan, tetapi tingkatan yang dirancang untuk arsitektur solusi tertentu dibangun di atas perangkat keras yang memiliki fitur untuk mendukung skenario tersebut. Untuk informasi selengkapnya tentang partisi, lihat Memperkirakan dan mengelola kapasitas dan Keandalan di Azure AI Search.

Catatan

Partisi kapasitas yang lebih tinggi tersedia di wilayah yang dipilih mulai April 2024. Gelombang kedua partisi kapasitas yang lebih tinggi dirilis pada Mei 2024. Jika Anda menggunakan layanan pencarian yang lebih lama, pertimbangkan untuk membuat layanan pencarian baru untuk mendapatkan manfaat dari lebih banyak kapasitas dengan tarif penagihan yang sama. Untuk informasi selengkapnya, lihat Batas layanan. Untuk memeriksa usia layanan pencarian Anda, lihat Cara memeriksa tanggal pembuatan layanan.

Tarif penagihan

Tingkatan memiliki tarif penagihan yang berbeda, dengan tarif yang lebih tinggi untuk tingkatan yang berjalan pada perangkat keras yang lebih mahal atau menyediakan fitur yang lebih mahal. Tingkat penagihan tingkat dapat ditemukan di halaman harga Azure untuk Azure AI Search.

Setelah Anda membuat layanan, tingkat penagihan menjadi biaya tetap untuk menjalankan layanan sepanjang waktu dan biaya tambahan jika Anda memilih untuk menambahkan lebih banyak kapasitas.

Layanan pencarian adalah sumber daya komputasi yang dialokasikan dalam bentuk partisi (untuk penyimpanan) dan replika (contoh mesin kueri). Awalnya, layanan dibuat dengan salah satu dari masing-masing bentuk, dan tarif penagihan sudah termasuk kedua sumber daya. Namun, jika Anda menskalakan kapasitas, biaya akan naik atau turun sesuai dengan kenaikan tarif yang dapat ditagih.

Contoh berikut memberikan ilustrasi. Misalnya tingkat penagihan hipotetis sebesar $100 per bulan. Jika Anda mempertahankan layanan pencarian pada kapasitas awalnya dari satu partisi dan satu replika, maka $100 adalah harga yang Anda bayarkan pada akhir bulan. Namun, jika Anda menambahkan dua replika lagi untuk mencapai ketersediaan tinggi, tagihan bulanan meningkat menjadi $300 ($100 untuk pasangan replika-partisi pertama, diikuti oleh $200 untuk dua replika).

Model penagihan ini didasarkan pada konsep penerapan tarif penagihan ke unit pencarian angka (SU) yang digunakan oleh layanan pencarian. Semua layanan awalnya diprovisikan di satu SU, tetapi Anda dapat meningkatkan SU dengan menambahkan partisi atau replika untuk menangani beban kerja yang lebih besar. Untuk mengetahui informasi selengkapnya, lihat Cara memperkirakan biaya layanan pencarian.

Peningkatan atau penurunan tingkat

Tidak ada dukungan bawaan untuk meningkatkan atau menurunkan tingkatan. Jika Anda ingin beralih ke tingkat yang berbeda, pendekatannya adalah:

  • Buat layanan pencarian baru di tingkat baru.

  • Sebarkan konten pencarian Anda ke layanan baru. Ikuti daftar periksa ini untuk memastikan Anda memiliki semua konten.

  • Hapus layanan pencarian lama setelah Anda yakin layanan tersebut tidak lagi diperlukan.

Untuk indeks besar yang tidak ingin Anda bangun kembali dari awal, pertimbangkan untuk menggunakan sampel pencadangan dan pemulihan untuk memindahkannya.

Langkah berikutnya

Cara terbaik untuk memilih tingkat harga adalah dengan memulai tingkat yang paling murah, lalu mengizinkan pengalaman dan pengujian menginformasikan keputusan Anda untuk mempertahankan layanan atau membuat yang baru di tingkat yang lebih tinggi. Untuk langkah-langkah berikutnya, sebaiknya buat layanan pencarian di tingkat yang dapat mengakomodasi tingkat pengujian yang Anda usulkan, lalu tinjau panduan berikut untuk rekomendasi tentang memperkirakan biaya dan kapasitas.