Bagikan melalui


Mengonfigurasi pemeringkat semantik dan mengembalikan keterangan dalam hasil pencarian

Peringkat semantik berulang selama kumpulan hasil awal, menerapkan metodologi peringkat L2 yang mempromosikan hasil yang paling relevan secara semantik ke bagian atas tumpukan. Anda juga bisa mendapatkan keterangan semantik, dengan sorotan atas istilah dan frasa yang paling relevan, dan jawaban semantik.

Artikel ini menjelaskan cara mengonfigurasi indeks pencarian untuk reranking semantik.

Prasyarat

  • Layanan pencarian pada tingkat Dasar atau yang lebih tinggi, tergantung pada ketersediaan wilayah.

  • Peringkat semantik diaktifkan pada layanan pencarian Anda.

  • Indeks pencarian yang sudah ada dengan konten teks kaya. Peringkat semantik berlaku untuk bidang string (nonvector) dan berfungsi paling baik pada konten yang bersifat informasi atau deskriptif.

Memilih klien

Anda dapat menggunakan salah satu alat dan kit pengembangan perangkat lunak (SDK) berikut untuk menambahkan konfigurasi semantik:

Menambahkan konfigurasi semantik

Konfigurasi semantik adalah bagian dalam indeks Anda yang menetapkan input bidang untuk peringkat semantik. Anda dapat menambahkan atau memperbarui konfigurasi semantik kapan saja, tidak perlu membangun kembali. Jika Membuat beberapa konfigurasi, Anda dapat menentukan default. Pada waktu kueri, tentukan konfigurasi semantik pada permintaan kueri, atau biarkan kosong untuk menggunakan default.

Konfigurasi semantik memiliki nama dan properti berikut:

Properti Karakteristik
Bidang judul String pendek, idealnya di bawah 25 kata. Bidang ini bisa berupa judul dokumen, nama produk, atau pengidentifikasi unik. Jika Anda tidak memiliki bidang yang sesuai, biarkan bidang kosong.
Bidang konten Potongan teks yang lebih panjang dalam bentuk bahasa alami, tunduk pada batas input token maksimum pada model pembelajaran mesin. Contoh umum termasuk isi dokumen, deskripsi produk, atau teks bentuk bebas lainnya.
Bidang kata kunci Daftar kata kunci, seperti tag pada dokumen, atau istilah deskriptif, seperti kategori item.

Anda hanya bisa menentukan satu bidang judul, tetapi Anda bisa memiliki bidang konten dan kata kunci sebanyak yang Anda inginkan. Untuk bidang konten dan kata kunci, cantumkan bidang dalam urutan prioritas karena bidang prioritas yang lebih rendah mungkin terpotong.

Di semua properti konfigurasi semantik, bidang yang Anda tetapkan harus:

  • Diatribusikan sebagai searchable dan retrievable
  • String jenis Edm.String, Collection(Edm.String), subbidang string dari Edm.ComplexType
  1. Masuk ke portal Azure dan navigasikan ke layanan pencarian yang mengaktifkan peringkat semantik.

  2. Dari Indeks di panel navigasi kiri, pilih indeks.

  3. Pilih Konfigurasi semantik lalu pilih Tambahkan konfigurasi semantik.

    Cuplikan layar yang memperlihatkan opsi untuk menambahkan konfigurasi semantik di portal Azure.

  4. Pada halaman Konfigurasi semantik baru, masukkan nama konfigurasi semantik dan pilih bidang yang akan digunakan dalam konfigurasi semantik. Hanya bidang string yang dapat dicari dan dapat diambil yang memenuhi syarat. Pastikan untuk mencantumkan bidang konten dan bidang kata kunci dalam urutan prioritas.

    Cuplikan layar yang memperlihatkan cara membuat konfigurasi semantik di portal Azure.

  5. Pilih Simpan untuk menyimpan pengaturan konfigurasi.

  6. Pilih Simpan lagi di halaman indeks untuk menyimpan konfigurasi semantik dalam indeks.

Migrasi dari versi pratinjau

Jika kode peringkat semantik Anda menggunakan API pratinjau, bagian ini menjelaskan cara bermigrasi ke versi yang stabil. Anda dapat memeriksa log perubahan untuk verifikasi ketersediaan umum:

queryLanguage untuk pemeringkat semantik

Pada 14 Juli 2023, peringkat semantik adalah agnostik bahasa. Ini dapat mererank hasil yang terdiri dari konten multibahasa, tanpa bias terhadap bahasa tertentu. Dalam versi pratinjau, peringkat semantik akan memisahkan hasil yang berbeda dari bahasa yang ditentukan oleh penganalisis bidang.

Berhenti menggunakan queryLanguage dalam kode Anda jika Anda menggunakannya untuk peringkat semantik. Properti queryLanguage masih berlaku untuk fitur seperti koreksi ejaan, tetapi tidak untuk peringkat semantik.

searchFields untuk ranker semantik

Untuk REST API dan semua paket SDK yang menargetkan versi 2021-04-30-Preview dan yang lebih baru, searchFields properti tidak lagi digunakan untuk peringkat semantik.

Sebagai gantinya semanticConfiguration , gunakan properti (dalam indeks pencarian) untuk menentukan bidang pencarian mana yang digunakan dalam peringkat semantik. Untuk menentukan prioritas bidang, tambahkan semanticConfiguration ke dalam skema indeks dengan mengikuti instruksi dalam artikel ini.

Anda bisa menyimpan searchFields dalam permintaan kueri jika Anda menggunakannya untuk membatasi pencarian teks lengkap ke daftar bidang bernama.

Langkah berikutnya

Uji konfigurasi semantik Anda dengan menjalankan kueri semantik.