Bagikan melalui


Apa itu Azure AI Search?

Azure AI Search (sebelumnya dikenal sebagai "Azure Cognitive Search") menyediakan pengambilan informasi yang aman dalam skala besar dibandingkan konten milik pengguna dalam aplikasi pencarian AI tradisional dan generatif.

Pengambilan informasi bersifat dasar untuk aplikasi apa pun yang menampilkan teks dan vektor. Skenario umum termasuk pencarian katalog atau dokumen, eksplorasi data, dan aplikasi yang semakin bergaya obrolan melalui data grounding berpemilik. Saat membuat layanan pencarian, Anda bekerja dengan kemampuan berikut:

  • Mesin pencari untuk pencarian vektor dan teks lengkap dan pencarian hibrid melalui indeks pencarian
  • Pengindeksan kaya dengan potongan dan vektorisasi data terintegrasi (pratinjau), analisis leksikal untuk teks, dan AI opsional yang diterapkan untuk ekstraksi dan transformasi konten
  • Sintaks kueri yang kaya untuk kueri vektor, pencarian teks, kueri hibrid, pencarian fuzzy, lengkapi otomatis, pencarian geografis, dan lainnya
  • Skala, keamanan, dan jangkauan Azure
  • Integrasi Azure di lapisan data, lapisan pembelajaran mesin, layanan Azure AI, dan Azure OpenAI

Secara arsitektur, layanan pencarian berada di antara penyimpanan data eksternal yang berisi data anda yang tidak diindeks, dan aplikasi klien Anda yang mengirim permintaan kueri ke indeks pencarian dan menangani respons.

Arsitektur Azure AI Search

Di aplikasi klien Anda, pengalaman pencarian ditentukan menggunakan API dari Azure AI Search, dan dapat mencakup penyetelan relevansi, peringkat semantik, lengkapi otomatis, pencocokan sinonim, pencocokan fuzzy, pencocokan pola, filter, dan pengurutan.

Di seluruh platform Azure, Azure AI Search dapat diintegrasikan dengan layanan Azure lainnya dalam bentuk pengindeks yang mengotomatiskan penyerapan/pengambilan data dari sumber data Azure, dan set keterampilan yang menggabungkan AI yang dapat dikonsumsi dari layanan Azure AI, seperti pemrosesan gambar dan bahasa alami, atau AI kustom yang Anda buat di Azure Pembelajaran Mesin atau dibungkus di dalam Azure Functions.

Di dalam layanan pencarian

Pada layanan pencarian itu sendiri, dua beban kerja utama adalah pengindeksan dan kueri.

  • Pengindeksan adalah proses asupan yang memuat konten ke dalam layanan pencarian Anda dan membuatnya dapat dicari. Secara internal, teks masuk diproses menjadi token dan disimpan dalam indeks terbalik, dan vektor masuk disimpan dalam indeks vektor. Format dokumen yang dapat diindeks oleh Azure AI Search adalah JSON. Anda dapat mengunggah dokumen JSON yang telah Anda rakit, atau menggunakan pengindeks untuk mengambil dan menserialisasikan data Anda ke JSON.

    AI yang diterapkan melalui set keterampilan memperluas pengindeksan dengan model gambar dan bahasa. Jika Anda memiliki gambar atau teks besar yang tidak terstruktur dalam dokumen sumber, Anda dapat melampirkan keterampilan yang melakukan OCR, menjelaskan gambar, menyimpulkan struktur, menerjemahkan teks, dan banyak lagi. Anda juga dapat melampirkan keterampilan yang melakukan pemotongan dan vektorisasi data.

  • Kueri dapat terjadi setelah indeks diisi dengan konten yang dapat dicari, saat aplikasi klien Anda mengirim permintaan kueri ke layanan pencarian dan menangani respons. Semua eksekusi kueri melalui indeks pencarian yang Anda kontrol.

    Peringkat semantik adalah ekstensi eksekusi kueri. Ini menambahkan peringkat sekunder, menggunakan pemahaman bahasa untuk menevalut set hasil, mempromosikan hasil yang paling relevan secara semantik ke bagian atas.

Azure AI Search sangat cocok untuk skenario aplikasi berikut:

  • Gunakan untuk pencarian teks lengkap tradisional dan pencarian kesamaan vektor generasi berikutnya. Kembalikan aplikasi AI generatif Anda dengan pengambilan informasi yang memanfaatkan kekuatan kata kunci dan pencarian kesamaan. Gunakan kedua modalitas untuk mengambil hasil yang paling relevan.

  • Mengonsolidasikan konten heterogen ke dalam indeks pencarian yang ditentukan pengguna dan diisi yang terdiri dari vektor dan teks. Anda mempertahankan kepemilikan dan kontrol atas apa yang dapat dicari.

  • Integrasikan pemotongan dan vektorisasi data untuk aplikasi AI dan RAG generatif.

  • Terapkan kontrol akses terperinci di tingkat dokumen.

  • Pengindeksan offload dan beban kerja kueri ke layanan pencarian khusus.

  • Menerapkan fitur terkait pencarian dengan mudah: penyetelan relevansi, navigasi tersaring, filter (termasuk pencarian geo-spasial), pemetaan sinonim, dan lengkapi otomatis.

  • Ubah file teks atau gambar besar yang tidak dibedakan, atau file aplikasi yang disimpan di Azure Blob Storage atau Azure Cosmos DB, menjadi gugus yang dapat dicari. Ini dicapai selama pengindeksan melalui keterampilan kognitif yang menambahkan pemrosesan eksternal dari Azure AI.

  • Menambahkan analisis teks linguistik atau kustom. Jika Anda memiliki konten non-bahasa Inggris, Azure AI Search mendukung penganalisis Lucene dan prosesor bahasa alami Microsoft. Anda juga dapat mengonfigurasi penganalisis untuk mencapai pemrosesan khusus konten mentah, seperti memfilter diakritik, atau mengenali dan mempertahankan pola dalam untai (karakter).

Untuk informasi selengkapnya tentang fungsionalitas tertentu, lihat Fitur Pencarian Azure AI

Cara memulai

Fungsionalitas diekspos melalui portal Azure, REST API sederhana, atau Azure SDK seperti Azure SDK untuk .NET. portal Azure mendukung administrasi layanan dan manajemen konten, dengan alat untuk membuat prototipe dan mengkueri indeks dan set keterampilan Anda.

Eksplorasi menyeluruh fitur pencarian inti dapat dicapai dalam empat langkah:

  1. Tentukan tingkat dan wilayah. Satu layanan pencarian gratis diizinkan per langganan. Semua mulai cepat dapat diselesaikan pada tingkat gratis. Untuk kapasitas dan kemampuan yang lebih banyak, Anda memerlukan tingkat yang dapat ditagih.

  2. Buat layanan pencarian di portal Azure.

  3. Mulai dengan wizard Impor data. Pilih sampel bawaan atau sumber data yang didukung untuk membuat, memuat, dan mengkueri indeks dalam hitung menit.

  4. Selesaikan dengan Search Explorer, menggunakan klien portal untuk mengkueri indeks pencarian yang baru saja Anda buat.

Atau, Anda dapat membuat, memuat, dan mengkueri indeks pencarian dalam langkah-langkah atom:

  1. Buat indeks pencarian menggunakan portal, REST API, .NET SDK, atau SDK lain. Skema indeks mendefinisikan struktur konten yang dapat dicari.

  2. Unggah konten menggunakan model "dorong" untuk mendorong dokumen JSON dari sumber apa pun, atau gunakan model "tarik" (pengindeks) jika data sumber Anda memiliki jenis yang didukung.

  3. Kueri indeks menggunakan Penjelajah pencarian di portal, REST API, .NET SDK, atau SDK lain.

Tip

Untuk bantuan terkait solusi kompleks atau kustom, hubungi mitra dengan keahlian mendalam dalam teknologi Azure AI Search.

Membandingkan opsi pencarian

Pelanggan sering bertanya bagaimana Azure AI Search dibandingkan dengan solusi terkait pencarian lainnya. Tabel berikut ini meringkas perbedaan utama.

Dibandingkan dengan Perbedaan utama
Microsoft Search Microsoft Search diperuntukkan bagi pengguna terautentikasi Microsoft 365 yang perlu meminta konten di SharePoint. Pencarian Azure AI menarik konten di seluruh Azure dan himpunan data JSON apa pun.
Bing API Bing mengkueri indeks pada Bing.com untuk istilah yang cocok. Pencarian Azure AI mencari indeks yang diisi dengan konten Anda. Anda mengontrol penyerapan data dan skema.
Pencarian database Azure SQL memiliki pencarian teks lengkap dan pencarian vektor. Azure Cosmos DB juga memiliki pencarian teks dan pencarian vektor. Azure AI Search menjadi alternatif yang menarik saat Anda memerlukan fitur seperti penyetelan relevansi, atau konten dari sumber heterogen. Pemanfaatan sumber daya adalah titik infleksi lain. Pengindeksan dan kueri secara komputasi intensif. Membongkar pencarian dari DBMS mempertahankan sumber daya sistem untuk pemrosesan transaksi.
Solusi pencarian khusus Dengan asumsi Anda telah memutuskan pencarian khusus dengan fungsionalitas spektrum penuh, perbandingan kategoris akhir adalah antara teknologi pencarian. Di antara penyedia cloud, Azure AI Search paling kuat untuk beban kerja vektor, kata kunci, dan hibrid melalui konten di Azure, untuk aplikasi yang terutama mengandalkan pencarian pengambilan informasi dan navigasi konten.

Kekuatan utama meliputi:

  • Dukungan untuk pengindeksan dan kueri vektor dan nonvektor (teks). Dengan pencarian kesamaan vektor, Anda dapat menemukan informasi yang secara semantik mirip dengan kueri pencarian, bahkan jika istilah pencarian tidak sama persis. Gunakan pencarian hibrid untuk kata kunci dan pencarian vektor terbaik.
  • Penyetelan peringkat dan relevansi melalui peringkat semantik dan profil penilaian. Sintaks kueri mendukung peningkatan istilah dan prioritas bidang.
  • Integrasi data Azure (perayap) di lapisan pengindeksan.
  • Integrasi Azure AI untuk transformasi yang membuat teks konten dan vektor dapat dicari.
  • Keamanan Microsoft Entra untuk koneksi tepercaya, dan Azure Private Link untuk koneksi privat dalam skenario tanpa internet.
  • Pengalaman pencarian penuh: Analisis teks linguistik dan kustom dalam 56 bahasa. Faset, lengkapi otomatis kueri dan hasil yang disarankan, dan sinonim.
  • Skala Azure, keandalan, dan jangkauan global.