Bagikan melalui


Apa yang baru dalam Azure AI Search

Azure Cognitive Search sekarang menjadi Azure AI Search. Pelajari tentang pembaruan terbaru untuk fungsionalitas, dokumen, dan sampel Azure AI Search.

Catatan

Fitur pratinjau diumumkan di sini, tetapi kami juga mempertahankan daftar fitur pratinjau sehingga Anda dapat menemukannya di satu tempat.

Juni 2024

Benda Tipe Deskripsi
Pencarian gambar di portal Azure Fitur Penjelajah pencarian sekarang mendukung pencarian gambar. Dalam indeks vektor yang memiliki konten gambar vektorisasi, Anda bisa meletakkan gambar ke Search Explorer untuk mengkueri kecocokan.

Mei 2024

Benda Tipe Deskripsi
Kapasitas yang lebih tinggi dan lebih banyak kuota vektor di setiap tingkatan (tingkat penagihan yang sama) Infrastruktur Ukuran partisi sekarang bahkan lebih besar untuk Standard 2 (S2), Standard 3 (S3), dan Standard 3 High Density (S3 HD) untuk semua layanan yang dibuat setelah 3 April 2024. Jika Anda membuat layanan baru sekarang, Anda mendapatkan partisi yang lebih besar. Jika Anda membuat layanan baru antara 3 April dan 17 Mei, Anda mendapatkan partisi yang lebih besar secara otomatis.

Tingkat Penyimpanan yang Dioptimalkan (L1 dan L2) juga memiliki kapasitas lebih. Pelanggan L1 dan L2 harus membuat layanan baru untuk mendapatkan manfaat dari kapasitas yang lebih tinggi. Saat ini tidak ada peningkatan di tempat.

Kapasitas ekstra sekarang tersedia di lebih banyak wilayah: Jerman Utara, Jerman Barat Tengah, Afrika Selatan Utara, Swiss Barat, dan Azure Government (Texas, Arizona, dan Virginia).
Integrasi OneLake (pratinjau) Fitur Pengindeks baru untuk file OneLake dan pintasan OneLake. Jika Anda menggunakan Microsoft Fabric dan OneLake untuk akses data ke sumber data Amazon Web Services (AWS) dan Google, gunakan pengindeks ini untuk mengimpor data eksternal ke dalam indeks pencarian. Pengindeks ini tersedia melalui portal Azure, REST API pratinjau 2024-05-01, dan paket beta Azure SDK.
Relevansi vektor
relevansi kueri hibrid
Fitur Empat peningkatan meningkatkan relevansi pencarian vektor dan hibrid.

Pertama, Anda sekarang dapat mengatur ambang batas pada hasil pencarian vektor untuk mengecualikan hasil penilaian rendah.

Kedua, perubahan dalam arsitektur kueri menerapkan profil penilaian di akhir alur kueri untuk setiap jenis kueri. Peningkatan dokumen adalah profil penilaian umum, dan sekarang berfungsi seperti yang diharapkan pada kueri vektor dan hibrid.

Ketiga, Anda dapat mengatur MaxTextRecallSize dan countAndFacetMode dalam kueri hibrid untuk mengontrol kuantitas hasil pencarian berperingkat BM25 yang mengalir ke model peringkat hibrid.

Keempat, untuk pencarian vektor dan hibrid, Anda dapat menimbang kueri vektor untuk meningkatkan atau mengurangi kepentingannya dalam permintaan multikueri.
Dukungan vektor biner Fitur Collection(Edm.Byte) adalah jenis data baru yang didukung. Jenis data ini membuka integrasi dengan model penyematan biner Cohere v3 dan kuantisasi biner kustom. Jenis data yang sempit menurunkan biaya himpunan data vektor besar. Lihat Mengindeks data biner untuk pencarian vektor untuk informasi selengkapnya.
Keterampilan penyematan multimodal Azure AI Vision (pratinjau) Keterampilan Keterampilan baru yang terikat ke API penyematan multimodal Azure AI Vision. Anda dapat menghasilkan penyematan untuk teks atau gambar selama pengindeksan. Keterampilan ini tersedia melalui portal Azure dan REST API pratinjau 2024-05-01.
Vektorizer Azure AI Vision (pratinjau) Vektorizer Vektorizer baru tersambung ke sumber daya Azure AI Vision menggunakan API penyematan multimodal untuk menghasilkan penyematan pada waktu kueri. Vektorizer ini tersedia melalui portal Azure dan REST API pratinjau 2024-05-01.
Vektorizer katalog model Azure AI Studio (pratinjau) Vektorizer Vektorizer baru terhubung ke model penyematan yang disebarkan dari katalog model Azure AI Studio. Vektorizer ini tersedia melalui portal Azure dan REST API pratinjau 2024-05-01.

Cara menerapkan vektorisasi terintegrasi menggunakan model dari Azure AI Studio.
Keterampilan AzureOpenAIEmbedding (pratinjau) mendukung lebih banyak model di Azure OpenAI Keterampilan Sekarang mendukung text-embedding-3-large dan text-embedding-3-small, bersama dengan text-embedding-ada-002 dari pembaruan sebelumnya. Properti dan modelName baru dimensions memungkinkan untuk menentukan berbagai model penyematan di Azure OpenAI. Sebelumnya, batas dimensi diperbaiki pada 1.536 dimensi, hanya berlaku untuk penyematan teks-ada-002. Keterampilan yang diperbarui tersedia melalui portal Azure dan REST API pratinjau 2024-05-01.
Pembaruan portal Azure Portal Wizard impor dan vektorisasi data sekarang mendukung pengindeks OneLake sebagai sumber data. Untuk penyematan, ini juga mendukung koneksi ke multimodal Azure AI Vision, katalog model Azure AI Studio, dan model yang lebih menyematkan di Azure OpenAI.

Saat menambahkan bidang ke indeks, Anda bisa memilih jenis data biner.

Penjelajah pencarian sekarang default ke pratinjau 2024-05-01 dan mendukung fitur pratinjau baru untuk kueri vektor dan hibrid.
Pratinjau 05-01 2024 API Versi pratinjau baru DARI REST API Pencarian menyediakan keterampilan dan vektorizer baru, jenis data biner baru, pengindeks file OneLake, dan parameter kueri baru untuk hasil yang lebih relevan. Lihat Meningkatkan REST API jika Anda memiliki kode yang ada yang ditulis terhadap pratinjau 2023-07-01 dan perlu bermigrasi ke versi ini.
Paket beta Azure SDK API Tinjau changelog paket beta Azure SDK berikut untuk dukungan fitur baru: Azure SDK untuk Python, Azure SDK untuk .NET, Azure SDK untuk Java
Sampel kode Python Sampel Sampel end-to-end baru menunjukkan integrasi dengan Cohere Embed v3, integrasi dengan OneLake dan platform data cloud di Google dan AWS, dan integrasi dengan API multimodal Azure AI Vision.

April 2024

Benda Tipe Deskripsi
Pembaruan keamanan mengatasi pengungkapan informasi API Respons GET tidak lagi mengembalikan string koneksi atau kunci. Berlaku untuk GET Skillset, GET Index, dan GET Indexer. Perubahan ini membantu melindungi aset Azure Anda yang terintegrasi dengan Pencarian AI dari akses yang tidak sah.
Lebih banyak penyimpanan pada tingkat Dasar dan Standar Infrastruktur Dasar sekarang mendukung hingga tiga partisi dan tiga replika. Tingkat Dasar dan Standar (S1, S2, S3) memiliki lebih banyak penyimpanan per partisi secara signifikan, pada tingkat penagihan per partisi yang sama. Kapasitas tambahan tergantung pada ketersediaan regional dan berlaku untuk layanan pencarian baru yang dibuat setelah 3 April 2024. Saat ini, tidak ada peningkatan di tempat, jadi Anda harus membuat layanan pencarian baru untuk mendapatkan penyimpanan tambahan.
Lebih banyak kuota untuk vektor Infrastruktur Kuota vektor juga lebih tinggi pada layanan baru yang dibuat setelah 3 April 2024 di wilayah yang dipilih.
Kuantisasi vektor, jenis data vektor sempit, dan properti baru stored (pratinjau) Fitur Secara kolektif, ketiga fitur ini menambahkan kompresi vektor dan opsi penyimpanan yang lebih cerdas. Pertama, kuantisasi skalar mengurangi ukuran indeks vektor dalam memori dan pada disk. Kedua, jenis data sempit mengurangi penyimpanan per bidang dengan menyimpan nilai yang lebih kecil. Ketiga, Anda dapat menggunakan stored untuk menolak penyimpanan salinan tambahan vektor yang hanya digunakan untuk hasil pencarian. Jika Anda tidak memerlukan vektor dalam respons kueri, Anda bisa mengatur stored ke false untuk menghemat ruang.
2024-03-01-preview Cari REST API API Versi pratinjau baru rest API Pencarian untuk jenis data baru, properti kompresi vektor, dan opsi penyimpanan vektor.
2024-03-01-preview Management REST API API Versi pratinjau baru API REST Manajemen untuk operasi sarana kontrol.
Pengumuman penghentian pratinjau 2023-07-01 API Penghentian diumumkan pada 8 April 2024. Ini menjadi tidak didukung pada 8 Juli 2024. Ini adalah REST API pertama yang menawarkan dukungan pencarian vektor. Versi API yang lebih baru memiliki konfigurasi vektor yang berbeda. Anda harus bermigrasi ke versi yang lebih baru sesegera mungkin.

Februari 2024

Benda Tipe Deskripsi
Batas dimensi baru Fitur Untuk bidang vektor, batas dimensi maksimum sekarang 3072, naik dari 2048.

Pengumuman 2023

Month Jenis Pengumuman
November Fitur Pencarian vektor, umumnya tersedia. Pembatasan sebelumnya pada kunci yang dikelola pelanggan (CMK) sekarang dicabut. Algoritma tetangga K terdekat yang lengkap dan lengkap juga sekarang tersedia secara umum.
November Fitur Peringkat semantik, umumnya tersedia
November Fitur Vektorisasi terintegrasi (pratinjau) menambahkan penggugusan data dan konversi teks ke vektor selama pengindeksan, dan juga menambahkan konversi teks ke vektor pada waktu kueri.
November Fitur Impor dan vektorisasi wizard data (pratinjau) mengotomatiskan pemotongan dan vektorisasi data. Ini menargetkan REST API Pratinjau 2023-10-01.
November Fitur Proyeksi indeks (pratinjau) menentukan bentuk indeks sekunder, yang digunakan untuk pola indeks satu-ke-banyak, di mana konten dari alur pengayaan dapat menargetkan beberapa indeks.
November API 2023-11-01 Search REST API adalah versi stabil dari Search REST API untuk pencarian vektor dan peringkat semantik. Lihat Meningkatkan REST API untuk langkah-langkah migrasi ke fitur yang tersedia secara umum.
November API 2023-11-01 Management REST API menambahkan API yang mengaktifkan atau menonaktifkan peringkat semantik.
November Keterampilan Keterampilan Penyematan Azure OpenAI (pratinjau) terhubung ke model penyematan yang disebarkan pada sumber daya Azure OpenAI Anda untuk menghasilkan penyematan selama eksekusi set keterampilan.
November Keterampilan Keterampilan Pemisahan Teks (pratinjau) diperbarui dalam Pratinjau 2023-10-01 untuk mendukung potongan data asli.
November Video Bagaimana pencarian vektor dan peringkat semantik meningkatkan perintah GPT Anda menjelaskan bagaimana pengambilan hibrid memberi Anda data grounding yang optimal untuk menghasilkan respons AI yang berguna dan memungkinkan pencarian atas konsep dan kata kunci.
November Sampel Kontrol akses berbasis peran dalam aplikasi AI Generatif menjelaskan cara menggunakan MICROSOFT Entra ID dan Microsoft Graph API untuk meluncurkan izin pengguna terperinci pada konten yang dipotong dalam indeks Anda.
Oktober Sampel Akselerator solusi "Mengobrol dengan data Anda". Pola RAG end-to-end yang menggunakan Azure AI Search sebagai retriever. Ini menyediakan pengindeksan, potongan data, dan orkestrasi.
Oktober Fitur Algoritma penilaian K-Nearest Neighbors (KNN) lengkap untuk pencarian kesamaan di ruang vektor. Hanya tersedia di REST API Pratinjau 2023-10-01.
Oktober Fitur Prafilter dalam pencarian vektor mengevaluasi kriteria filter sebelum eksekusi kueri, mengurangi jumlah konten yang perlu dicari. Hanya tersedia di REST API Pratinjau 10-10-2023, melalui properti baru vectorFilterMode pada kueri yang dapat diatur ke preFilter (default) atau postFilter, tergantung pada kebutuhan Anda.
Oktober API 2023-10-01-Preview Cari REST API, melanggar perubahan definisi untuk bidang vektor dan kueri vektor.
Agustus Fitur Peningkatan peringkat semantik. Model yang ditingkatkan diluncurkan untuk reranking semantik, dan ketersediaan diperluas ke lebih banyak wilayah. Jumlah token unik maksimum dua kali lipat dari 128 menjadi 256.
Juli Sampel Demo vektor (Azure SDK untuk JavaScript). Menggunakan Node.js dan pustaka @azure/search-documents 12.0.0-beta.2 untuk menghasilkan penyematan, membuat dan memuat indeks, dan menjalankan beberapa kueri vektor.
Juli Sampel Demo vektor (Azure SDK untuk .NET). Menggunakan pustaka Azure.Search.Documents 11.5.0-beta.3 untuk menghasilkan penyematan, membuat dan memuat indeks, dan menjalankan beberapa kueri vektor. Anda juga dapat mencoba sampel ini dari tim Azure SDK.
Juli Sampel Demo vektor (Azure SDK for Python) Menggunakan rilis beta terbaru dari azure.search.documents untuk menghasilkan penyematan, membuat dan memuat indeks, dan menjalankan beberapa kueri vektor. Kunjungi repositori azure-search-vector-samples/demo-python untuk demo pencarian vektor lainnya.
Juni Fitur Pratinjau publik pencarian vektor.
Juni Fitur Ketersediaan pencarian semantik, tersedia di tingkat Dasar.
Juni API 2023-07-01-Pratinjau Pencarian REST API. Dukungan untuk pencarian vektor.
Mei Fitur Azure RBAC (kontrol akses berbasis peran, umumnya tersedia).
Mei API 2022-09-01 Management REST API, dengan dukungan untuk mengonfigurasi pencarian untuk menggunakan peran Azure. Modul Az.Search modul pencarian Azure PowerShell dan Az dari Azure CLI diperbarui untuk mendukung opsi autentikasi layanan pencarian. Anda juga dapat menggunakan penyedia Terraform untuk mengonfigurasi opsi autentikasi (lihat mulai cepat Terraform ini untuk detailnya).
April Sampel Penyebaran multi-wilayah Azure AI Search untuk kelangsungan bisnis dan pemulihan bencana. Skrip penyebaran yang sepenuhnya mengonfigurasi solusi multi-regional untuk Azure AI Search, dengan opsi untuk menyinkronkan konten dan meminta pengalihan jika titik akhir gagal.
Maret Sampel Data ChatGPT + Enterprise dengan Azure OpenAI dan Azure AI Search (GitHub). Kode Python dan templat untuk menggabungkan Azure AI Search dengan model bahasa besar di OpenAI. Untuk latar belakang, lihat posting blog Komunitas Teknologi ini: Merevolusi Data Perusahaan Anda dengan ChatGPT.

Poin-poin penting:

Gunakan Azure AI Search untuk mengonsolidasikan dan mengindeks konten yang dapat dicari.

Kueri indeks untuk hasil pencarian awal.

Kumpulkan permintaan dari hasil tersebut dan kirim ke model gpt-35-turbo (pratinjau) di Azure OpenAI.

Kembalikan jawaban lintas dokumen dan berikan kutipan dan transparansi di aplikasi yang menghadap pelanggan Anda sehingga pengguna dapat menilai respons.

Pengumuman tahun sebelumnya

Rebrand layanan

Layanan ini telah memiliki beberapa nama selama bertahun-tahun. Di sini mereka berada dalam urutan kronologis terbalik:

  • Azure AI Search (November 2023) Diganti namanya agar selaras dengan layanan Azure AI dan harapan pelanggan.
  • Azure Cognitive Search (Oktober 2019) Diganti namanya untuk mencerminkan penggunaan keterampilan kognitif dan pemrosesan AI yang diperluas (namun opsional) dalam operasi layanan.
  • Azure Search (Maret 2015) Nama aslinya.

Pembaruan layanan

Pengumuman pembaruan layanan untuk Pencarian Azure AI dapat ditemukan di situs web Azure.

Penggantian nama fitur

Pencarian semantik diganti namanya menjadi peringkat semantik pada November 2023 untuk menggambarkan fitur dengan lebih baik, yang memberikan peringkat L2 dari kumpulan hasil yang ada.