Novinky ve službě Azure AI Search

Článek
10/16/2024

Azure Cognitive Search je teď Azure AI Search. Přečtěte si o nejnovějších aktualizacích funkcí služby Azure AI Search, dokumentaci a ukázkách.

Poznámka:

Funkce ve verzi Preview jsou zde oznámeny, ale udržujeme také seznam funkcí ve verzi Preview, abyste je našli na jednom místě.

Října 2024

Položka	Typ	Popis
Snížení požadavků na dimenzi pro modely vkládání textu na trénování MRL v Azure OpenAI	Funkce	Text-embedding-3-small and Text-embedding-3-large jsou trénovány pomocí Matryoshka Representation Learning (MRL). To vám umožní zkrátit vložené vektory na méně dimenzí a upravit rovnováhu mezi použitím velikosti vektorového indexu a kvalitou načítání. Novinka `truncationDimension` ve verzi 2024-09-01-preview umožňuje přístup ke kompresi MRL v modelech vkládání textu. To lze nakonfigurovat pouze pro nová vektorová pole.
Rozbalení `@search.score` pro zobrazení dílčích jader ve výsledcích hybridního hledání	Funkce	Výsledky seřazené pomocí reciproční Rank Fusion (RRF) můžete prozkoumat zobrazením jednotlivých dílčích jader dotazu konečného sloučeného výsledku a skóre. Nová `debug` vlastnost rozbalí skóre hledání. `QueryResultDocumentSubscores`a `QueryResultDocumentRerankerInputQueryResultDocumentSemanticField` uveďte další podrobnosti. Tyto definice jsou k dispozici ve verzi 2024-09-01-preview.
Cílení filtrů v hybridním vyhledávání pouze na vektorové dotazy	Funkce	Filtr hybridního dotazu zahrnuje všechny poddotazy v požadavku bez ohledu na typ. Globální filtr můžete přepsat tak, aby byl filtr vymezen na konkrétní poddotaz. Nový `filterOverride` parametr je k dispozici pro hybridní dotazy pomocí verze 2024-09-01-preview.
Dovednost Rozdělení textu (bloky tokenů)	Použitá AI (dovednosti)	Tato dovednost má nové parametry, které zlepšují vytváření bloků dat pro vložené modely. Nový `unit` parametr umožňuje zadat bloky tokenů. Teď můžete vytvořit blok podle délky tokenu a nastavit délku na hodnotu, která dává smysl pro model vkládání. Můžete také zadat tokenizátor a všechny tokeny, které by se neměly rozdělit během vytváření bloků dat. Nové `unit` definice parametrů a dílčích jader dotazu najdete ve verzi 2024-09-01-preview.
2024-09-01-preview	rozhraní API	Verze Preview rozhraní REST API pro zkrácené dimenze v modelech pro vkládání textu-3, cílené filtrování vektorů pro hybridní dotazy, podrobnosti dílčích jader RRF pro ladění a blokování tokenů pro dovednosti Rozdělení textu.
Podpora portálu pro šifrování klíčů spravovaných zákazníkem (CMK)	Funkce	Když vytváříte nové objekty na webu Azure Portal, můžete teď zadat šifrování CMK a vybrat azure Key Vault, který klíč poskytne.

Srpen 2024

Položka	Typ	Popis
Vylepšení relace ladění	funkce	Existují dvě důležitá vylepšení. Nejprve můžete ladit integrované vektorizace a úlohy vytváření bloků dat. Za druhé, ladicí relace jsou přepracované pro efektivnější prezentaci dovedností a mapování. Můžete vybrat objekt v toku a zobrazit nebo upravit jeho podrobnosti na bočním panelu. Předchozí rozložení s kartami je plně nahrazeno dalšími kontextovými citlivými informacemi na stránce.
2024-07-01	rozhraní API	Stabilní verze rozhraní REST API pro obecně dostupné datové typy vektorů, kompresi vektorů a integrovanou vektorizaci během indexování a dotazů.
Integrovaná vektorizace	Funkce	Oznamujeme obecnou dostupnost. Vytváření a vkládání dat řízených dovednostmi během indexování
Vektorizátory	Funkce	Oznamujeme obecnou dostupnost. Převod textu na vektor během provádění dotazu Vektorizátor Azure OpenAI i vlastní vektorizátor webového rozhraní API jsou obecně dostupné.
Dovednost AzureOpenAIEmbedding	Funkce	Oznamujeme obecnou dostupnost. Typ dovednosti, který volá model vkládání Azure OpenAI, který generuje vkládání během indexování.
Projekce indexů	Funkce	Oznamujeme obecnou dostupnost. Součást definice sady dovedností, která definuje tvar sekundárního indexu, který podporuje vzor indexu 1:N, kde obsah z kanálu rozšiřování může cílit na více indexů.
Binární a skalární kvantování	Funkce	Oznamujeme obecnou dostupnost. Komprimujte velikost vektorového indexu v paměti a na disku pomocí integrovaného kvantování.
Úzké datové typy	Funkce	Oznamujeme obecnou dostupnost. Přiřazení menšího datového typu u vektorových polí za předpokladu, že příchozí data jsou z tohoto datového typu.
Průvodce importem a vektorizací dat	portál Azure	Oznamujeme obecnou dostupnost. Průvodce, který vytvoří úplný indexovací kanál, který obsahuje bloky dat a vektorizaci. Průvodce vytvoří všechny potřebné objekty a konfigurace. Tato verze přidává podporu průvodce pro Azure Data Lake ve službě Azure Storage.
uložená vlastnost	Funkce	Oznamujeme obecnou dostupnost. Logická hodnota, která snižuje ukládání vektorových indexů tím , že neuloží načístelné vektory.
vectorQueries.Weight – vlastnost	Funkce	Oznamujeme obecnou dostupnost. Zadejte relativní váhu každého vektorového dotazu v operaci hledání.

Červenec 2024

Položka	Typ	Popis
Chatování s daty	Akcelerátor	Akcelerátor řešení pro model RAG běžící v Azure s využitím služby Azure AI Search pro načítání a velké jazykové modely Azure OpenAI pro vytváření konverzačních vyhledávacích prostředí Kód s ukázkovými daty je k dispozici pro scénáře použití, jako je finanční poradce a kontrola smluv a shrnutí.
Konverzační dolování znalostí	Akcelerátor	Akcelerátor řešení založený na službách Azure AI Search, Azure Speech a Azure OpenAI, které zákazníkům umožňují extrahovat užitečné přehledy z konverzací po kontaktním centru.
Vytvoření vlastního copilotu	Akcelerátor	Vytvořte vlastní řešení copilotu, které klientovi Advisor umožňuje využívat výkon generující umělé inteligence napříč strukturovanými i nestrukturovanými daty. Pomozte našim zákazníkům optimalizovat každodenní úkoly a podporovat lepší interakce s více klienty.

Červen 2024

Položka	Typ	Popis
Hledání obrázků na webu Azure Portal	Funkce	Průzkumník služby Search teď podporuje vyhledávání obrázků. V vektorovém indexu, který obsahuje vektorizovaný obsah obrázku, můžete obrázky umístit do Průzkumníka služby Search a dotazovat se na shodu.

Květen 2024

Položka	Typ	Popis
Vyšší kapacita a větší kvóta vektorů na každé úrovni (stejná fakturační sazba)	Infrastruktura	U většiny oblastí jsou teď velikosti oddílů ještě větší pro služby vytvořené po 3. dubnu 2, Standard 3 (S3) a Standard 3 High Density (S3 HD) pro služby vytvořené po 3. dubnu 2024. Pokud chcete získat větší oddíly, vytvořte novou službu v oblasti, která poskytuje novější infrastrukturu. Úrovně optimalizované pro úložiště (L1 a L2) mají také větší kapacitu. Zákazníci L1 a L2 musí vytvořit novou službu, která bude těžit z vyšší kapacity. V tuto chvíli neexistuje žádný místní upgrade. Další kapacita je teď dostupná ve více oblastech: Německo – sever, Německo – středozápad, Jihoafrická republika – sever, Švýcarsko – západ a Azure Government (Texas, Arizona a Virginia).
Integrace OneLake (Preview)	Funkce	Nový indexer pro soubory OneLake a klávesové zkratky OneLake Pokud pro přístup k datům ke zdrojům dat Amazon Web Services (AWS) a Google používáte Microsoft Fabric a OneLake, použijte tento indexer k importu externích dat do indexu vyhledávání. Tento indexer je k dispozici prostřednictvím webu Azure Portal, 2024-05-01-preview rozhraní REST API a beta balíčků sady Azure SDK.
Relevance vektoru relevance hybridních dotazů	Funkce	Čtyři vylepšení zlepšují význam vektoru a hybridního vyhledávání. Nejprve můžete nastavit prahové hodnoty u výsledků hledání vektorů, abyste vyloučili výsledky s nízkým skóre. Za druhé, změny v architektuře dotazů používají profily bodování na konci kanálu dotazu pro každý typ dotazu. Posílení dokumentu je běžný profil bodování a teď funguje podle očekávání u vektorových a hybridních dotazů. Za třetí můžete nastavit `MaxTextRecallSize` a `countAndFacetMode` v hybridních dotazech řídit množství výsledků hledání seřazených podle BM25, které proudí do modelu hybridního řazení. Začtvrté, pro vektorové a hybridní vyhledávání můžete vytážit vektorový dotaz, aby se zvýšila nebo snížila jeho důležitost v požadavku na vícequery.
Podpora binárních vektorů	Funkce	`Collection(Edm.Byte)` je nový podporovaný datový typ. Tento datový typ otevře integraci s binárními vloženými modely Cohere v3 a vlastní binární kvantací. Úzké datové typy snižují náklady na velké vektorové datové sady. Další informace najdete v tématu Index binární data pro hledání vektorů.
Dovednosti s vícemodálními vkládáními ve službě Azure AI Vision (Preview)	Dovednost	Nová dovednost, která je svázaná s rozhraním API multimodálních vkládání služby Azure AI Vision. Během indexování můžete vygenerovat vkládání textu nebo obrázků. Tato dovednost je dostupná prostřednictvím webu Azure Portal a rozhraní REST API verze 2024-05-01-preview.
Vektorizátor Azure AI Vision (Preview)	Vektorizátor	Nový vektorizátor se připojí k prostředku Azure AI Vision pomocí multimodálního rozhraní API pro vkládání k vygenerování vkládání v době dotazu. Tento vektorizátor je k dispozici prostřednictvím webu Azure Portal a rozhraní REST API verze 2024-05-01-preview.
Vektorizátor katalogu modelů Azure AI Studio (Preview)	Vektorizátor	Nový vektorizátor se připojí k modelu vložení nasazeného z katalogu modelů Azure AI Studio. Tento vektorizátor je k dispozici prostřednictvím webu Azure Portal a rozhraní REST API verze 2024-05-01-preview. Implementace integrované vektorizace pomocí modelů z Azure AI Studia
Dovednost AzureOpenAIEmbedding (Preview) podporuje více modelů v Azure OpenAI	Dovednost	Teď podporuje vkládání textu -3-large a text-embedding-3-small, spolu s text-embedding-ada-002 z předchozí aktualizace. Nové `dimensions` a `modelName` vlastnosti umožňují zadat různé modely vkládání v Azure OpenAI. Dříve byly limity dimenzí pevně nastaveny na 1 536 dimenzí, které platí pouze pro vkládání textu ada-002. Aktualizovaná dovednost je dostupná prostřednictvím webu Azure Portal a rozhraní REST API verze 2024-05-01-preview.
Aktualizace webu Azure Portal	Portál	Průvodce importem a vektorizací dat teď podporuje indexery OneLake jako zdroj dat. Pro vkládání podporuje také připojení k multimodálnímu modelu Azure AI Vision, katalogu modelů Azure AI Studio a dalším modelům vkládání v Azure OpenAI. Při přidávání pole do indexu můžete zvolit binární datový typ. Průzkumník služby Search teď ve výchozím nastavení nastaví verzi 2024-05-01-preview a podporuje nové funkce ve verzi Preview pro vektorové a hybridní dotazy.
2024-05-01-preview	rozhraní API	Nová verze Preview rozhraní REST API služby Search poskytuje nové dovednosti a vektorizátory, nový binární datový typ, indexer souborů OneLake a nové parametry dotazu pro relevantnější výsledky. Pokud máte existující kód napsaný ve verzi 2023-07-01-Preview a potřebujete migrovat na tuto verzi, přečtěte si téma Upgrade rozhraní REST API .
Beta balíčky sady Azure SDK	rozhraní API	Projděte si protokoly změn v následujících beta balíčcích sady Azure SDK pro novou podporu funkcí: Azure SDK pro Python, Azure SDK pro .NET, Azure SDK pro Javu.
Ukázky kódu Pythonu	Ukázky	Nové ucelené ukázky ukazují integraci s Cohere Embed v3, integraci s OneLake a cloudovými datovými platformami na Google a AWS a integraci s multimodálními rozhraními API služby Azure AI Vision.

Duben 2024

Položka	Typ	Popis
Zpřístupnění informací adresování aktualizací zabezpečení	rozhraní API	Odpovědi GET už nevrací připojovací řetězec ani klíče. Platí pro get Skillset, GET Index a GET Indexer. Tato změna pomáhá chránit vaše prostředky Azure integrované se službou AI Search před neoprávněným přístupem.
Další úložiště na úrovních Basic a Standard	Infrastruktura	Basic teď podporuje až tři oddíly a tři repliky. Úrovně Basic a Standard (S1, S2, S3) mají výrazně více úložiště na oddíl ve stejné fakturační sazbě pro jednotlivé oddíly. Kapacita navíc podléhá regionální dostupnosti a vztahuje se na nové vyhledávací služby vytvořené po 3. dubnu 2024. V současné době není k dispozici žádný místní upgrade, takže pro získání dodatečného úložiště musíte vytvořit novou vyhledávací službu.
Další kvóta pro vektory	Infrastruktura	Kvóty vektorů jsou také vyšší u nových služeb vytvořených po 3. dubnu 2024 ve vybraných oblastech.
Vektorové kvantování, datové typy úzkých vektorů a nová `stored` vlastnost (Preview)	Funkce	Společně tyto tři funkce přidávají kompresi vektorů a inteligentnější možnosti úložiště. Za prvé skalární kvantování snižuje velikost vektorových indexů v paměti a na disku. Za druhé, úzké datové typy snižují úložiště podle polí uložením menších hodnot. Za třetí můžete použít `stored` možnost odhlášení od uložení dodatečné kopie vektoru, která se používá jenom pro výsledky hledání. Pokud v odpovědi dotazu nepotřebujete vektory, můžete nastavit `stored` hodnotu False, abyste ušetřili místo.
2024-03-01-preview Search REST API	rozhraní API	Nová verze Preview rozhraní REST API služby Search pro nové datové typy, vlastnosti komprese vektorů a možnosti úložiště vektorů
2024-03-01-preview Management REST API	rozhraní API	Nová verze Preview rozhraní REST API správy pro operace řídicí roviny
Oznámení o vyřazení verze Preview z 7. 7. 2023	rozhraní API	Vyřazení oznámilo 8. dubna 2024. 8. července 2024 se stane nepodporovaným. Toto bylo první rozhraní REST API, které nabízelo podporu vektorového vyhledávání. Novější verze rozhraní API mají jinou konfiguraci vektoru. Co nejdříve byste měli migrovat na novější verzi .

Únor 2024

Položka	Typ	Popis
Nové limity dimenzí	Funkce	U vektorových polí jsou nyní `3072`maximální limity dimenzí v rozmezí od `2048`.

Oznámení z roku 2023

Month	Typ	Oznámení
Listopad	Funkce	Obecně dostupné vektorové vyhledávání. Předchozí omezení klíčů spravovaných zákazníkem (CMK) je nyní zrušeno. Předfiltrování a vyčerpávající algoritmus K-nejbližšího souseda jsou nyní také obecně dostupné.
Listopad	Funkce	Sémantický ranker, obecně dostupný
Listopad	Funkce	Integrovaná vektorizace (Preview) přidává převody bloků dat a převodů textu na vektor během indexování a také přidává převody textu na vektory v době dotazu.
Listopad	Funkce	Průvodce importem a vektorizací dat (Preview) automatizuje vytváření bloků a vektorizaci dat. Cílí na rozhraní REST API verze 2023-10-10-01-Preview .
Listopad	Funkce	Projekce indexů (Preview) definují tvar sekundárního indexu, který se používá pro vzor indexu 1:N, kde obsah z kanálu rozšiřování může cílit na více indexů.
Listopad	rozhraní API	Rozhraní REST API služby Search 2023-11-01 je stabilní verze rozhraní REST API služby Search pro vektorové vyhledávání a sémantické řazení. Postup migrace na obecně dostupné funkce najdete v tématu Upgrade rozhraní REST API .
Listopad	rozhraní API	Rozhraní REST API služby 2023-11-01 Management přidává rozhraní API, která povolují nebo zakazují sémantický ranker.
Listopad	Dovednost	Dovednosti vkládání Azure OpenAI (Preview) se připojí k nasazeného modelu vkládání na prostředek Azure OpenAI, který generuje vkládání během provádění sady dovedností.
Listopad	Dovednost	Dovednost Rozdělení textu (Preview) byla aktualizována v 10. 10. 2023 ve verzi Preview , aby podporovala nativní bloky dat.
Listopad	Video	Způsob, jakým vektorové vyhledávání a sémantické řazení vylepšují výzvy GPT, vysvětluje, jak hybridní načítání poskytuje optimální základní data pro generování užitečných odpovědí AI a umožňuje vyhledávat jak koncepty, tak klíčová slova.
Listopad	Vzorek	Řízení přístupu na základě role v aplikacích Generative AI vysvětluje, jak pomocí Rozhraní Microsoft Entra ID a rozhraní Microsoft Graph API zavést podrobná uživatelská oprávnění pro blokovaný obsah v indexu.
Říjen	Vzorek	Akcelerátor řešení "Chat s daty". Kompletní model RAG, který jako načítač používá Azure AI Search. Poskytuje indexování, vytváření bloků dat a orchestraci.
Říjen	Funkce	Vyčerpávající algoritmus bodování K-Nearest Neighbors (KNN) pro vyhledávání podobnosti ve vektorovém prostoru K dispozici pouze v rozhraní REST API verze 2023-10-10-01 Preview.
Říjen	Funkce	Předfiltry ve vektorovém hledání vyhodnocují kritéria filtru před spuštěním dotazu, což snižuje množství obsahu, který je potřeba prohledávat. K dispozici pouze v rozhraní REST API verze 2023-10-01-Preview prostřednictvím nové `vectorFilterMode` vlastnosti dotazu, která se dá nastavit na `preFilter` (výchozí) nebo `postFilter`v závislosti na vašich požadavcích.
Říjen	rozhraní API	2023-10-01-Preview Search REST API, způsobující chybu definici vektorových polí a vektorových dotazů.
Srpen	Funkce	Vylepšené sémantické hodnocení. Upgradované modely se zavádějí pro sémantické řazení a dostupnost se rozšiřuje do dalších oblastí. Maximální počet jedinečných tokenů se zdvojnásobil z 128 na 256.
Červenec	Vzorek	Vector demo (Azure SDK pro JavaScript) Používá Node.js a knihovnu @azure/search-documents 12.0.0-beta.2 ke generování vkládání, vytvoření a načtení indexu a spuštění několika vektorových dotazů.
Červenec	Vzorek	Vector demo (Azure SDK pro .NET) Používá knihovnu Azure.Search.Documents 11.5.0-beta.3 ke generování vkládání, vytvoření a načtení indexu a spuštění několika vektorových dotazů. Tuto ukázku můžete vyzkoušet také od týmu sady Azure SDK.
Červenec	Vzorek	Vector demo (Azure SDK pro Python) používá nejnovější beta verzi azure.search.documents ke generování vkládání, vytvoření a načtení indexu a spuštění několika vektorových dotazů. Další ukázky vektorového vyhledávání najdete v úložišti azure-search-vector-samples/demo-python .
Červen	Funkce	Vektorové vyhledávání ve veřejné verzi Preview
Červen	Funkce	Dostupnost sémantického vyhledávání dostupná na úrovni Basic.
Červen	rozhraní API	2023-07-01-Preview Search REST API. Podpora pro vektorové vyhledávání
Květen	Funkce	Azure RBAC (řízení přístupu na základě role, obecně dostupné)
Květen	rozhraní API	2022-09-01 Management REST API s podporou konfigurace vyhledávání pro použití rolí Azure. Modul Az.Search modulu Azure PowerShell a Az search v Azure CLI se aktualizuje, aby podporoval možnosti ověřování vyhledávací služby. K konfiguraci možností ověřování můžete použít také zprostředkovatele Terraformu (podrobnosti najdete v tomto rychlém startu Terraformu).
Duben	Vzorek	Nasazení Azure AI Search do více oblastí pro zajištění kontinuity podnikových procesů a zotavení po havárii Skripty nasazení, které plně nakonfigurují víceregionální řešení pro Azure AI Search, s možnostmi synchronizace obsahu a přesměrování požadavků v případě selhání koncového bodu.
Březen	Vzorek	Data ChatGPT + Enterprise pomocí Azure OpenAI a Azure AI Search (GitHub) Kód Pythonu a šablona pro kombinování služby Azure AI Search s velkými jazykovými modely v OpenAI Pozadí najdete v tomto blogovém příspěvku technické komunity: Revoluce podnikových dat pomocí ChatGPT. Klíčové body: Pomocí služby Azure AI Search můžete konsolidovat a indexovat prohledávatelný obsah. Zadejte dotaz na index pro počáteční výsledky hledání. Sestaví výzvy z těchto výsledků a odešle do modelu gpt-35-turbo (Preview) v Azure OpenAI. Vraťte odpověď mezi dokumenty a v aplikaci pro zákazníky zadejte citace a transparentnost, aby uživatelé mohli odpověď vyhodnotit.

Oznámení z předchozího roku

Service rebrand

Tato služba měla v průběhu let více názvů. Tady jsou v obráceném chronologickém pořadí:

Azure AI Search (listopad 2023) Přejmenováno tak, aby odpovídalo službám Azure AI a očekáváním zákazníků.
Služba Azure Cognitive Search (říjen 2019) byla přejmenována tak, aby odrážela rozšířené (ještě volitelné) využití kognitivních dovedností a zpracování umělé inteligence v operacích služeb.
Původní název služby Azure Search (březen 2015)

Aktualizace služby

Oznámení o aktualizacích služeb pro Azure AI Search najdete na webu Azure.

Přejmenování funkce

Sémantické vyhledávání bylo přejmenováno na sémantické ranker v listopadu 2023, aby se lépe popsala funkce, která poskytuje pořadí L2 existující sady výsledků.

Sdílet prostřednictvím