Bagikan melalui


Mulai cepat: Membuat indeks pencarian di portal Microsoft Azure

Dalam mulai cepat Pencarian Azure AI ini, buat indeks pencarian pertama Anda dengan menggunakan wizard Impor data dan sumber data sampel bawaan yang terdiri dari data hotel fiktif yang dihosting oleh Microsoft. Wizard memandu Anda melalui pembuatan tanpa kode indeks pencarian untuk membantu Anda menulis kueri yang menarik dalam hitungan menit.

Wizard membuat beberapa objek pada layanan pencarian Anda - indeks yang dapat dicari - tetapi juga koneksi pengindeks dan sumber data untuk pengambilan data otomatis. Di akhir mulai cepat ini, kami meninjau setiap objek.

Catatan

Wizard Impor data menyertakan opsi untuk OCR, terjemahan teks, dan pengayaan AI lainnya yang tidak tercakup dalam mulai cepat ini. Untuk panduan serupa yang berfokus pada AI yang diterapkan, lihat Mulai Cepat: Membuat set keterampilan di portal Azure.

Prasyarat

Untuk mulai cepat ini, yang menggunakan data sampel bawaan, pastikan layanan pencarian tidak memiliki kontrol akses jaringan. Pengontrol portal menggunakan titik akhir publik untuk mengambil data dan metadata dari sumber data sampel bawaan yang dihosting oleh Microsoft. Untuk informasi selengkapnya, lihat Mengamankan koneksi di wizard impor.

Periksa ruang

Banyak pelanggan mulai dengan layanan gratis. Tingkat gratis terbatas pada tiga indeks, tiga sumber data, dan tiga pengindeks. Pastikan Anda memiliki ruang untuk item tambahan sebelum memulai. Mulai cepat ini membuat salah satu dari setiap objek.

Periksa tab Penggunaan Gambaran Umum > untuk layanan untuk melihat berapa banyak indeks, pengindeks, dan sumber data yang sudah Anda miliki.

Cuplikan layar halaman Gambaran Umum untuk instans azure AI layanan Pencarian di portal Azure, memperlihatkan jumlah indeks, pengindeks, dan sumber data.

Memulai wizard

  1. Masuk ke portal Azure dengan akun Azure Anda, dan buka layanan Pencarian Azure AI Anda.

  2. Pada halaman Gambaran Umum , pilih Impor data untuk memulai wizard.

    Cuplikan layar yang memperlihatkan cara membuka wizard Impor data di portal Azure.

Membuat dan memuat indeks

Di bagian ini, buat dan muat indeks dalam empat langkah.

Menyambungkan ke sumber data

Wizard membuat koneksi sumber data untuk sampel data yang dihosting oleh Microsoft di Azure Cosmos DB. Data sampel ini diambil diakses melalui titik akhir publik. Anda tidak memerlukan akun Azure Cosmos DB atau file sumber Anda sendiri untuk menjalankan mulai cepat ini.

  1. Pada Sambungkan ke data Anda, perluas daftar dropdown Sumber Data dan pilih Sampel.

  2. Dalam daftar sampel bawaan, pilih hotel-sample.

    Cuplikan layar yang memperlihatkan cara memilih sumber data sampel hotel di wizard Impor data.

  3. Pilih Berikutnya: Tambahkan keterampilan kognitif (Opsional) untuk melanjutkan.

Lewati konfigurasi untuk keterampilan kognitif

Wizard Impor data mendukung pembuatan set keterampilan dan pengayaan AI ke dalam pengindeksan.

  1. Untuk mulai cepat ini, abaikan opsi konfigurasi pengayaan AI pada tab Tambahkan keterampilan kognitif.

  2. Pilih Lewati ke: Sesuaikan indeks target untuk melanjutkan.

    Cuplikan layar yang memperlihatkan cara Melompat ke tab Kustomisasi indeks target di wizard Impor data.

Tip

Tertarik dengan pengayaan AI? Coba Mulai Cepat ini: Membuat set keterampilan di portal Azure

Mengonfigurasi indeks

Wizard menyimpulkan skema untuk indeks sampel hotel bawaan. Ikuti langkah-langkah berikut untuk mengonfigurasi indeks:

  1. Terima nilai yang dihasilkan sistem untuk Nama indeks (hotels-sample-index) dan bidang Kunci (HotelId).

  2. Terima nilai yang dihasilkan sistem untuk semua atribut bidang.

  3. Pilih Berikutnya: Buat pengindeks untuk melanjutkan.

Cuplikan layar yang memperlihatkan definisi indeks yang dihasilkan untuk sumber data sampel hotel di wizard Impor data.

Minimal, indeks memerlukan nama Indeks dan kumpulan Bidang. Satu bidang harus ditandai sebagai kunci dokumen untuk mengidentifikasi setiap dokumen secara unik. Nilainya selalu string. Wizard memindai bidang string unik dan memilih satu untuk kunci.

Setiap bidang memiliki nama, jenis data, dan atribut yang mengontrol cara menggunakan bidang dalam indeks pencarian. Kotak centang mengaktifkan atau menonaktifkan atribut berikut:

  • Dapat diambil: Bidang yang dikembalikan dalam respons kueri.
  • Dapat difilter: Bidang yang menerima ekspresi filter.
  • Dapat diurutkan: Bidang yang menerima ekspresi orderby.
  • Faset: Bidang yang digunakan dalam struktur navigasi tersaring.
  • Dapat dicari: Bidang yang digunakan dalam pencarian teks lengkap. String dapat dicari. Bidang numerik dan bidang Boolean sering ditandai sebagai tidak dapat dicari.

String dikaitkan sebagai Dapat Diambil dan Dapat Dicari. Bilangan bulat dikaitkan sebagai Dapat Diambil, Dapat Difilter, Dapat Diurutkan, dan Dapat Difaset.

Atribut memengaruhi penyimpanan. Bidang yang dapat difilter menggunakan penyimpanan tambahan, tetapi Dapat diambil tidak. Untuk informasi selengkapnya, lihat Contoh yang menunjukkan implikasi penyimpanan atribut dan pemberi saran.

Jika Anda ingin melengkapi otomatis atau menyarankan kueri, tentukan Penganalisis atau Pemberi Saran bahasa.

Mengonfigurasi dan menjalankan pengindeks

Langkah terakhir mengonfigurasi dan menjalankan pengindeks. Objek ini mendefinisikan proses yang dapat dijalankan. Sumber data, indeks, dan pengindeks dibuat dalam langkah ini.

  1. Terima nilai yang dihasilkan sistem untuk nama Pengindeks (hotels-sample-indexer).

  2. Untuk mulai cepat ini, gunakan opsi default untuk menjalankan pengindeks sekali, segera. Data yang dihosting statis sehingga tidak ada pelacakan perubahan yang diaktifkan untuknya.

  3. Pilih Kirim untuk membuat dan menjalankan pengindeks secara bersamaan.

    Cuplikan layar yang memperlihatkan cara mengonfigurasi pengindeks untuk sumber data sampel hotel di wizard Impor data.

Memantau kemajuan pengindeks

Anda dapat memantau pembuatan pengindeks atau indeks di portal. Halaman Gambaran Umum layanan menyediakan tautan ke sumber daya yang dibuat di layanan Pencarian Azure AI Anda.

  1. Di sebelah kiri, pilih Pengindeks.

    Cuplikan layar yang memperlihatkan pembuatan pengindeks yang sedang berlangsung di portal Azure.

    Dibutuhkan beberapa menit agar hasil halaman diperbarui di portal Azure. Anda akan melihat pengindeks yang baru dibuat dalam daftar dengan status Sedang berlangsung atau Berhasil. Daftar ini juga memperlihatkan jumlah dokumen yang diindeks.

Periksa hasil indeks pencarian

  1. Di sebelah kiri, pilih Indeks.

  2. Pilih hotels-sample-index.

    Tunggu hingga halaman portal Azure di-refresh. Anda akan melihat indeks dengan jumlah dokumen dan ukuran penyimpanan.

    Cuplikan layar daftar Indeks di dasbor azure AI layanan Pencarian di portal Azure.

  3. Pilih tab Bidang untuk melihat skema indeks.

    Periksa untuk melihat bidang mana yang Dapat Difilter atau Dapat Diurutkan sehingga Anda tahu kueri apa yang akan ditulis.

    Cuplikan layar yang memperlihatkan definisi skema untuk indeks di layanan Pencarian Azure AI di portal Azure.

Menambahkan atau mengubah bidang

Pada tab Bidang , Anda bisa membuat bidang baru menggunakan bidang Tambahkan dengan nama, tipe data yang didukung, dan atribusi.

Mengubah bidang yang ada lebih sulit. Bidang yang ada memiliki representasi fisik dalam indeks sehingga tidak dapat dimodifikasi, bahkan tidak dalam kode. Untuk mengubah bidang yang ada secara mendasar, Anda perlu membuat bidang baru yang menggantikan bidang asli. Konstruksi lain, seperti profil penilaian dan opsi CORS, dapat ditambahkan ke indeks kapan saja.

Untuk memahami dengan jelas apa yang dapat dan tidak dapat Anda edit selama desain indeks, luangkan waktu satu menit untuk melihat opsi definisi indeks. Opsi berwarna abu-abu dalam daftar bidang menunjukkan nilai yang tidak dapat dimodifikasi atau dihapus.

Kueri dengan Penjelajah pencarian

Anda sekarang memiliki indeks pencarian yang dapat dikueri dengan Penjelajah pencarian. Penjelajah pencarian mengirimkan panggilan REST yang sesuai dengan SEARCH POST REST API. Alat ini mendukung sintaks kueri sederhana dan sintaks kueri Lucene penuh.

  1. Pada tab Penjelajah pencarian , masukkan teks untuk dicari.

    Cuplikan layar yang memperlihatkan cara memasukkan dan menjalankan kueri di alat Penjelajah Pencarian.

  2. Gunakan Peta mini untuk melompat dengan cepat ke area output yang tidak terlihat.

    Cuplikan layar yang memperlihatkan hasil panjang untuk kueri di alat Search Explorer dan peta mini.

  3. Untuk menentukan sintaksis, beralihlah ke tampilan JSON.

    Cuplikan layar pemilih tampilan JSON.

Contoh kueri untuk indeks sampel hotel

Contoh berikut mengasumsikan tampilan JSON dan versi REST API pratinjau 2024-05-01.

Tip

Tampilan JSON sekarang mendukung intellisense untuk penyelesaian nama parameter. Letakkan kursor di dalam tampilan JSON dan ketik karakter spasi untuk memperlihatkan daftar semua parameter kueri, atau ketik satu huruf seperti "s" untuk memperlihatkan hanya parameter kueri yang dimulai dengan "s". Intellisense tidak mengecualikan parameter yang tidak valid, jadi gunakan penilaian terbaik Anda.

Contoh filter

Parkir, tag, tanggal renovasi, peringkat, dan lokasi dapat difilter.

{
    "search": "beach OR spa",
    "select": "HotelId, HotelName, Description, Rating",
    "count": true,
    "top": 10,
    "filter": "Rating gt 4"
}

Filter Boolean mengasumsikan "true" secara default.

{
    "search": "beach OR spa",
    "select": "HotelId, HotelName, Description, Rating",
    "count": true,
    "top": 10,
    "filter": "ParkingIncluded"
}

Pencarian geospasial berbasis filter. Fungsi memfilter geo.distance semua hasil untuk data posisi berdasarkan koordinat dan geography'POINT yang ditentukanLocation. Kueri mencari hotel yang berada dalam jarak 5 kilometer dari koordinat -122.12 47.67bujur lintang , yaitu "Redmond, Washington, AS." Kueri menampilkan jumlah total kecocokan &$count=true dengan nama hotel dan lokasi alamat.

{
    "search": "*",
    "select": "HotelName, Address/City, Address/StateProvince",
    "count": true,
    "top": 10,
    "filter": "geo.distance(Location, geography'POINT(-122.12 47.67)') le 5"
}

Contoh sintaks Lucene Penuh

Sintaks default adalah sintaksis sederhana, tetapi jika Anda ingin pencarian fuzzy atau peningkatan istilah atau ekspresi reguler, tentukan sintaks lengkapnya.

{
    "queryType": "full",
    "search": "seatle~",
    "select": "HotelId, HotelName,Address/City, Address/StateProvince",
    "count": true
}

Secara default, istilah kueri yang salah eja seperti seatle Seattle gagal mengembalikan kecocokan dalam pencarian umum. Parameter queryType=full memanggil pengurai kueri Lucene lengkap, yang mendukung operand tilde ~ . Saat parameter ini ada, kueri melakukan pencarian fuzzy untuk kata kunci yang ditentukan. Kueri mencari hasil yang cocok bersama dengan hasil yang mirip dengan tetapi tidak sama persis dengan kata kunci.

Luangkan waktu semenit untuk mencoba beberapa contoh kueri ini untuk indeks Anda. Untuk mempelajari selengkapnya tentang kueri, lihat Mengkueri di Pencarian Azure AI.

Membersihkan sumber daya

Saat Anda bekerja dalam langganan Anda sendiri, ada baiknya di akhir proyek untuk mengidentifikasi apakah Anda masih memerlukan sumber daya yang Anda buat. Sumber daya yang dibiarkan berjalan dapat menghabiskan uang Anda. Anda dapat menghapus sumber daya satu per satu atau menghapus grup sumber daya untuk menghapus seluruh rangkaian sumber daya.

Anda dapat menemukan dan mengelola sumber daya untuk layanan Anda di portal Azure di bawah Semua sumber daya atau Grup sumber daya di panel kiri.

Jika Anda menggunakan layanan gratis, ingatlah bahwa batasnya adalah tiga indeks, pengindeks, dan sumber data. Anda dapat menghapus item individual di portal Azure agar tetap di bawah batas.

Langkah berikutnya

Coba wizard portal Azure untuk menghasilkan aplikasi web siap pakai yang berjalan di browser. Gunakan wizard ini pada indeks kecil yang Anda buat dalam mulai cepat ini, atau gunakan salah satu himpunan data sampel bawaan untuk pengalaman pencarian yang lebih kaya.