Bagikan melalui


Mengonfigurasi pemeringkat semantik dan mengembalikan keterangan dalam hasil pencarian

Peringkat semantik menjalankan iterasi pada kumpulan hasil awal, dengan menerapkan metodologi peringkat L2 yang mempromosikan hasil yang paling relevan secara semantik ke posisi teratas. Anda juga bisa mendapatkan keterangan semantik, dengan sorotan atas istilah dan frasa yang paling relevan, dan jawaban semantik.

Artikel ini menjelaskan cara mengonfigurasi indeks pencarian untuk reranking semantik.

Catatan

Jika Anda memiliki kode yang sudah ada yang memanggil pratinjau atau versi API sebelumnya, lihat Memigrasikan kode peringkat semantik untuk mendapatkan bantuan dalam memodifikasi kode Anda.

Prasyarat

  • Pencarian Azure AI di wilayah mana pun yang menyediakan peringkat semantik.

  • Peringkat semantik diaktifkan pada layanan pencarian Anda.

  • Indeks pencarian yang sudah ada dengan konten teks kaya. Peringkat semantik berlaku untuk bidang string (nonvector) dan berfungsi paling baik pada konten yang bersifat informasi atau deskriptif.

Memilih klien

Anda dapat menentukan konfigurasi semantik pada indeks baru atau yang sudah ada, menggunakan salah satu alat dan kit pengembangan perangkat lunak (SDK) berikut untuk menambahkan konfigurasi semantik:

Menambahkan konfigurasi semantik

Beberapa beban kerja membuat konfigurasi semantik secara otomatis. Jika Anda menggunakan pengambilan agenik dan sumber pengetahuan yang mengindeks konten di Azure AI Search, indeks yang Anda buat sudah memiliki konfigurasi semantik yang berfungsi untuk konten Anda.

Untuk beban kerja lain, Anda dapat menyiapkan konfigurasi semantik sendiri. Konfigurasi semantik adalah bagian dalam indeks Anda yang menetapkan input bidang yang digunakan untuk peringkat semantik. Anda dapat menambahkan atau memperbarui konfigurasi semantik kapan saja, tidak perlu membangun kembali. Jika Membuat beberapa konfigurasi, Anda dapat menentukan default. Pada waktu kueri, tentukan konfigurasi semantik pada permintaan kueri, atau biarkan kosong untuk menggunakan konfigurasi default.

Anda dapat membuat hingga 100 konfigurasi semantik dalam satu indeks.

Konfigurasi semantik memiliki nama dan properti berikut:

Properti Karakteristik
Bidang judul String pendek, idealnya di bawah 25 kata. Bidang ini bisa berupa judul dokumen, nama produk, atau pengidentifikasi unik. Jika Anda tidak memiliki bidang yang sesuai, biarkan bidang kosong.
Bidang konten Potongan teks yang lebih panjang dalam bentuk bahasa alami, tunduk pada batas input token maksimum pada model pembelajaran mesin. Contoh umum termasuk isi dokumen, deskripsi produk, atau teks bentuk bebas lainnya.
Bidang kata kunci Daftar kata kunci, seperti tag pada dokumen, atau istilah deskriptif, seperti kategori item.

Anda hanya bisa menentukan satu bidang judul, tetapi Anda bisa memiliki bidang konten dan kata kunci sebanyak yang Anda inginkan. Untuk bidang konten dan kata kunci, cantumkan bidang dalam urutan prioritas karena bidang prioritas yang lebih rendah mungkin terpotong.

Di semua properti konfigurasi semantik, bidang yang Anda tetapkan harus:

  • Diatribusikan sebagai searchable dan retrievable
  • String bertipe Edm.String, Collection(Edm.String), subjenis string dari Edm.ComplexType
  1. Masuk ke portal Azure dan navigasikan ke layanan pencarian yang mengaktifkan peringkat semantik.

  2. Dari Indeks di panel navigasi kiri, pilih indeks.

  3. Pilih Konfigurasi semantik lalu pilih Tambahkan konfigurasi semantik.

    Cuplikan layar yang memperlihatkan opsi untuk menambahkan konfigurasi semantik di portal Azure.

  4. Pada halaman Konfigurasi semantik baru, masukkan nama konfigurasi semantik dan pilih bidang yang akan digunakan dalam konfigurasi semantik. Hanya bidang string yang dapat dicari dan dapat diambil yang memenuhi syarat. Pastikan untuk mencantumkan bidang konten dan bidang kata kunci dalam urutan prioritas.

    Cuplikan layar yang memperlihatkan cara membuat konfigurasi semantik di portal Azure.

  5. Pilih Simpan untuk menyimpan pengaturan konfigurasi.

  6. Pilih Simpan lagi di halaman indeks untuk menyimpan konfigurasi semantik dalam indeks.

Ikut serta untuk model peringkat semantik prarilis

Catatan

Fitur ini saat ini dalam pratinjau publik. Pratinjau ini disediakan tanpa perjanjian tingkat layanan dan tidak direkomendasikan untuk beban kerja produksi. Fitur tertentu mungkin tidak didukung atau mungkin memiliki kemampuan terbatas. Untuk informasi lebih lanjut, lihat Supplemental Terms of Use for Microsoft Azure Previews.

Dengan menggunakan PREVIEWREST API dan pratinjau Azure SDK yang menyediakan properti , Anda dapat secara opsional mengonfigurasi indeks untuk menggunakan model peringkat semantik prarilis jika disebarkan di wilayah Anda. Tidak ada mekanisme untuk mengetahui apakah sebuah prarilis tersedia, atau apakah prarilis tersebut telah digunakan pada kueri tertentu. Untuk alasan ini, kami sarankan Anda menggunakan properti ini di lingkungan pengujian, dan hanya jika Anda tertarik untuk mencoba model peringkat semantik terbaru.

Properti konfigurasi adalah "flightingOptIn": true, dan diatur dalam bagian konfigurasi semantik dari sebuah indeks. Sebuah properti tidak bernilai atau salah dalam keadaan default. Anda dapat mengaturnya ke benar pada permintaan buat atau perbarui kapan saja, dan memengaruhi kueri semantik di masa mendatang, dengan asumsi kueri menetapkan konfigurasi semantik yang menyertakan properti.

PUT https://myservice.search.windows.net/indexes('hotels')?allowIndexDowntime=False&api-version=2025-11-01-preview

{
  "name": "hotels",
  "fields": [ ],
  "scoringProfiles": [ ],
  "defaultScoringProfile": "geo",
  "suggesters": [ ],
  "analyzers": [ ],
  "corsOptions": { },
  "encryptionKey": { },
  "similarity": { },
  "semantic": {
    "configurations": [
      {
        "name": "semanticHotels",
        "prioritizedFields": {
          "titleField": {
            "fieldName": "hotelName"
          },
        "prioritizedContentFields": [
            {
              "fieldName": "description"
            },
            {
              "fieldName": "description_fr"
            }
          ],
        "prioritizedKeywordsFields": [
            {
              "fieldName": "tags"
            },
            {
              "fieldName": "category"
            }
          ],
        "flightingOptIn": true
        }
      }
    ]
  },
  "vectorSearch": {  }
}

Langkah berikutnya

Uji konfigurasi semantik Anda dengan menjalankan kueri semantik.