Mengonfigurasi pemeringkat semantik dan mengembalikan keterangan dalam hasil pencarian
Peringkat semantik berulang selama kumpulan hasil awal, menerapkan metodologi peringkat L2 yang mempromosikan hasil yang paling relevan secara semantik ke bagian atas tumpukan. Anda juga bisa mendapatkan keterangan semantik, dengan sorotan atas istilah dan frasa yang paling relevan, dan jawaban semantik.
Artikel ini menjelaskan cara mengonfigurasi indeks pencarian untuk reranking semantik.
Prasyarat
Layanan pencarian pada tingkat Dasar atau yang lebih tinggi, tergantung pada ketersediaan wilayah.
Peringkat semantik diaktifkan pada layanan pencarian Anda.
Indeks pencarian yang sudah ada dengan konten teks kaya. Peringkat semantik berlaku untuk bidang string (nonvector) dan berfungsi paling baik pada konten yang bersifat informasi atau deskriptif.
Memilih klien
Anda dapat menggunakan salah satu alat dan kit pengembangan perangkat lunak (SDK) berikut untuk menambahkan konfigurasi semantik:
- portal Azure, menggunakan perancang indeks untuk menambahkan konfigurasi semantik.
- Visual Studio Code dengan klien REST
- Azure SDK untuk .Net
- Azure SDK untuk Python
- Azure SDK untuk Java
- Azure SDK untuk JavaScript
Menambahkan konfigurasi semantik
Konfigurasi semantik adalah bagian dalam indeks Anda yang menetapkan input bidang untuk peringkat semantik. Anda dapat menambahkan atau memperbarui konfigurasi semantik kapan saja, tidak perlu membangun kembali. Jika Membuat beberapa konfigurasi, Anda dapat menentukan default. Pada waktu kueri, tentukan konfigurasi semantik pada permintaan kueri, atau biarkan kosong untuk menggunakan default.
Konfigurasi semantik memiliki nama dan properti berikut:
Properti | Karakteristik |
---|---|
Bidang judul | String pendek, idealnya di bawah 25 kata. Bidang ini bisa berupa judul dokumen, nama produk, atau pengidentifikasi unik. Jika Anda tidak memiliki bidang yang sesuai, biarkan bidang kosong. |
Bidang konten | Potongan teks yang lebih panjang dalam bentuk bahasa alami, tunduk pada batas input token maksimum pada model pembelajaran mesin. Contoh umum termasuk isi dokumen, deskripsi produk, atau teks bentuk bebas lainnya. |
Bidang kata kunci | Daftar kata kunci, seperti tag pada dokumen, atau istilah deskriptif, seperti kategori item. |
Anda hanya bisa menentukan satu bidang judul, tetapi Anda bisa memiliki bidang konten dan kata kunci sebanyak yang Anda inginkan. Untuk bidang konten dan kata kunci, cantumkan bidang dalam urutan prioritas karena bidang prioritas yang lebih rendah mungkin terpotong.
Di semua properti konfigurasi semantik, bidang yang Anda tetapkan harus:
- Diatribusikan sebagai
searchable
danretrievable
- String jenis
Edm.String
,Collection(Edm.String)
, subbidang string dariEdm.ComplexType
Masuk ke portal Azure dan navigasikan ke layanan pencarian yang mengaktifkan peringkat semantik.
Dari Indeks di panel navigasi kiri, pilih indeks.
Pilih Konfigurasi semantik lalu pilih Tambahkan konfigurasi semantik.
Pada halaman Konfigurasi semantik baru, masukkan nama konfigurasi semantik dan pilih bidang yang akan digunakan dalam konfigurasi semantik. Hanya bidang string yang dapat dicari dan dapat diambil yang memenuhi syarat. Pastikan untuk mencantumkan bidang konten dan bidang kata kunci dalam urutan prioritas.
Pilih Simpan untuk menyimpan pengaturan konfigurasi.
Pilih Simpan lagi di halaman indeks untuk menyimpan konfigurasi semantik dalam indeks.
Migrasi dari versi pratinjau
Jika kode peringkat semantik Anda menggunakan API pratinjau, bagian ini menjelaskan cara bermigrasi ke versi yang stabil. Anda dapat memeriksa log perubahan untuk verifikasi ketersediaan umum:
- 2024-07-01 (REST)
- Log perubahan Azure SDK untuk .NET (11.5)
- Log perubahan Azure SDK for Python (11.4)
- Log perubahan Azure SDK untuk Java (11.6)
- Log perubahan Azure SDK for JavaScript (12.0)
queryLanguage untuk pemeringkat semantik
Pada 14 Juli 2023, peringkat semantik adalah agnostik bahasa. Ini dapat mererank hasil yang terdiri dari konten multibahasa, tanpa bias terhadap bahasa tertentu. Dalam versi pratinjau, peringkat semantik akan memisahkan hasil yang berbeda dari bahasa yang ditentukan oleh penganalisis bidang.
Berhenti menggunakan queryLanguage
dalam kode Anda jika Anda menggunakannya untuk peringkat semantik. Properti queryLanguage
masih berlaku untuk fitur seperti koreksi ejaan, tetapi tidak untuk peringkat semantik.
searchFields untuk ranker semantik
Untuk REST API dan semua paket SDK yang menargetkan versi 2021-04-30-Preview
dan yang lebih baru, searchFields
properti tidak lagi digunakan untuk peringkat semantik.
Sebagai gantinya semanticConfiguration
, gunakan properti (dalam indeks pencarian) untuk menentukan bidang pencarian mana yang digunakan dalam peringkat semantik. Untuk menentukan prioritas bidang, tambahkan semanticConfiguration
ke dalam skema indeks dengan mengikuti instruksi dalam artikel ini.
Anda bisa menyimpan searchFields
dalam permintaan kueri jika Anda menggunakannya untuk membatasi pencarian teks lengkap ke daftar bidang bernama.
Langkah berikutnya
Uji konfigurasi semantik Anda dengan menjalankan kueri semantik.