Novinky ve službě Azure AI Search
Azure Cognitive Search je teď Azure AI Search. Přečtěte si o nejnovějších aktualizacích funkcí služby Azure AI Search, dokumentaci a ukázkách.
Poznámka:
Funkce ve verzi Preview jsou zde oznámeny, ale udržujeme také seznam funkcí ve verzi Preview, abyste je našli na jednom místě.
Října 2024
Položka | Typ | Popis |
---|---|---|
Snížení požadavků na dimenzi pro modely vkládání textu na trénování MRL v Azure OpenAI | Funkce | Text-embedding-3-small and Text-embedding-3-large jsou trénovány pomocí Matryoshka Representation Learning (MRL). To vám umožní zkrátit vložené vektory na méně dimenzí a upravit rovnováhu mezi použitím velikosti vektorového indexu a kvalitou načítání. Novinka truncationDimension ve verzi 2024-09-01-preview umožňuje přístup ke kompresi MRL v modelech vkládání textu. To lze nakonfigurovat pouze pro nová vektorová pole. |
Rozbalení @search.score pro zobrazení dílčích jader ve výsledcích hybridního hledání |
Funkce | Výsledky seřazené pomocí reciproční Rank Fusion (RRF) můžete prozkoumat zobrazením jednotlivých dílčích jader dotazu konečného sloučeného výsledku a skóre. Nová debug vlastnost rozbalí skóre hledání. QueryResultDocumentSubscores a QueryResultDocumentRerankerInput QueryResultDocumentSemanticField uveďte další podrobnosti. Tyto definice jsou k dispozici ve verzi 2024-09-01-preview. |
Cílení filtrů v hybridním vyhledávání pouze na vektorové dotazy | Funkce | Filtr hybridního dotazu zahrnuje všechny poddotazy v požadavku bez ohledu na typ. Globální filtr můžete přepsat tak, aby byl filtr vymezen na konkrétní poddotaz. Nový filterOverride parametr je k dispozici pro hybridní dotazy pomocí verze 2024-09-01-preview. |
Dovednost Rozdělení textu (bloky tokenů) | Použitá AI (dovednosti) | Tato dovednost má nové parametry, které zlepšují vytváření bloků dat pro vložené modely. Nový unit parametr umožňuje zadat bloky tokenů. Teď můžete vytvořit blok podle délky tokenu a nastavit délku na hodnotu, která dává smysl pro model vkládání. Můžete také zadat tokenizátor a všechny tokeny, které by se neměly rozdělit během vytváření bloků dat. Nové unit definice parametrů a dílčích jader dotazu najdete ve verzi 2024-09-01-preview. |
2024-09-01-preview | rozhraní API | Verze Preview rozhraní REST API pro zkrácené dimenze v modelech pro vkládání textu-3, cílené filtrování vektorů pro hybridní dotazy, podrobnosti dílčích jader RRF pro ladění a blokování tokenů pro dovednosti Rozdělení textu. |
Podpora portálu pro šifrování klíčů spravovaných zákazníkem (CMK) | Funkce | Když vytváříte nové objekty na webu Azure Portal, můžete teď zadat šifrování CMK a vybrat azure Key Vault, který klíč poskytne. |
Srpen 2024
Položka | Typ | Popis |
---|---|---|
Vylepšení relace ladění | funkce | Existují dvě důležitá vylepšení. Nejprve můžete ladit integrované vektorizace a úlohy vytváření bloků dat. Za druhé, ladicí relace jsou přepracované pro efektivnější prezentaci dovedností a mapování. Můžete vybrat objekt v toku a zobrazit nebo upravit jeho podrobnosti na bočním panelu. Předchozí rozložení s kartami je plně nahrazeno dalšími kontextovými citlivými informacemi na stránce. |
2024-07-01 | rozhraní API | Stabilní verze rozhraní REST API pro obecně dostupné datové typy vektorů, kompresi vektorů a integrovanou vektorizaci během indexování a dotazů. |
Integrovaná vektorizace | Funkce | Oznamujeme obecnou dostupnost. Vytváření a vkládání dat řízených dovednostmi během indexování |
Vektorizátory | Funkce | Oznamujeme obecnou dostupnost. Převod textu na vektor během provádění dotazu Vektorizátor Azure OpenAI i vlastní vektorizátor webového rozhraní API jsou obecně dostupné. |
Dovednost AzureOpenAIEmbedding | Funkce | Oznamujeme obecnou dostupnost. Typ dovednosti, který volá model vkládání Azure OpenAI, který generuje vkládání během indexování. |
Projekce indexů | Funkce | Oznamujeme obecnou dostupnost. Součást definice sady dovedností, která definuje tvar sekundárního indexu, který podporuje vzor indexu 1:N, kde obsah z kanálu rozšiřování může cílit na více indexů. |
Binární a skalární kvantování | Funkce | Oznamujeme obecnou dostupnost. Komprimujte velikost vektorového indexu v paměti a na disku pomocí integrovaného kvantování. |
Úzké datové typy | Funkce | Oznamujeme obecnou dostupnost. Přiřazení menšího datového typu u vektorových polí za předpokladu, že příchozí data jsou z tohoto datového typu. |
Průvodce importem a vektorizací dat | portál Azure | Oznamujeme obecnou dostupnost. Průvodce, který vytvoří úplný indexovací kanál, který obsahuje bloky dat a vektorizaci. Průvodce vytvoří všechny potřebné objekty a konfigurace. Tato verze přidává podporu průvodce pro Azure Data Lake ve službě Azure Storage. |
uložená vlastnost | Funkce | Oznamujeme obecnou dostupnost. Logická hodnota, která snižuje ukládání vektorových indexů tím , že neuloží načístelné vektory. |
vectorQueries.Weight – vlastnost | Funkce | Oznamujeme obecnou dostupnost. Zadejte relativní váhu každého vektorového dotazu v operaci hledání. |
Červenec 2024
Položka | Typ | Popis |
---|---|---|
Chatování s daty | Akcelerátor | Akcelerátor řešení pro model RAG běžící v Azure s využitím služby Azure AI Search pro načítání a velké jazykové modely Azure OpenAI pro vytváření konverzačních vyhledávacích prostředí Kód s ukázkovými daty je k dispozici pro scénáře použití, jako je finanční poradce a kontrola smluv a shrnutí. |
Konverzační dolování znalostí | Akcelerátor | Akcelerátor řešení založený na službách Azure AI Search, Azure Speech a Azure OpenAI, které zákazníkům umožňují extrahovat užitečné přehledy z konverzací po kontaktním centru. |
Vytvoření vlastního copilotu | Akcelerátor | Vytvořte vlastní řešení copilotu, které klientovi Advisor umožňuje využívat výkon generující umělé inteligence napříč strukturovanými i nestrukturovanými daty. Pomozte našim zákazníkům optimalizovat každodenní úkoly a podporovat lepší interakce s více klienty. |
Červen 2024
Položka | Typ | Popis |
---|---|---|
Hledání obrázků na webu Azure Portal | Funkce | Průzkumník služby Search teď podporuje vyhledávání obrázků. V vektorovém indexu, který obsahuje vektorizovaný obsah obrázku, můžete obrázky umístit do Průzkumníka služby Search a dotazovat se na shodu. |
Květen 2024
Položka | Typ | Popis |
---|---|---|
Vyšší kapacita a větší kvóta vektorů na každé úrovni (stejná fakturační sazba) | Infrastruktura | U většiny oblastí jsou teď velikosti oddílů ještě větší pro služby vytvořené po 3. dubnu 2, Standard 3 (S3) a Standard 3 High Density (S3 HD) pro služby vytvořené po 3. dubnu 2024. Pokud chcete získat větší oddíly, vytvořte novou službu v oblasti, která poskytuje novější infrastrukturu. Úrovně optimalizované pro úložiště (L1 a L2) mají také větší kapacitu. Zákazníci L1 a L2 musí vytvořit novou službu, která bude těžit z vyšší kapacity. V tuto chvíli neexistuje žádný místní upgrade. Další kapacita je teď dostupná ve více oblastech: Německo – sever, Německo – středozápad, Jihoafrická republika – sever, Švýcarsko – západ a Azure Government (Texas, Arizona a Virginia). |
Integrace OneLake (Preview) | Funkce | Nový indexer pro soubory OneLake a klávesové zkratky OneLake Pokud pro přístup k datům ke zdrojům dat Amazon Web Services (AWS) a Google používáte Microsoft Fabric a OneLake, použijte tento indexer k importu externích dat do indexu vyhledávání. Tento indexer je k dispozici prostřednictvím webu Azure Portal, 2024-05-01-preview rozhraní REST API a beta balíčků sady Azure SDK. |
Relevance vektoru relevance hybridních dotazů |
Funkce | Čtyři vylepšení zlepšují význam vektoru a hybridního vyhledávání. Nejprve můžete nastavit prahové hodnoty u výsledků hledání vektorů, abyste vyloučili výsledky s nízkým skóre. Za druhé, změny v architektuře dotazů používají profily bodování na konci kanálu dotazu pro každý typ dotazu. Posílení dokumentu je běžný profil bodování a teď funguje podle očekávání u vektorových a hybridních dotazů. Za třetí můžete nastavit MaxTextRecallSize a countAndFacetMode v hybridních dotazech řídit množství výsledků hledání seřazených podle BM25, které proudí do modelu hybridního řazení. Začtvrté, pro vektorové a hybridní vyhledávání můžete vytážit vektorový dotaz, aby se zvýšila nebo snížila jeho důležitost v požadavku na vícequery. |
Podpora binárních vektorů | Funkce | Collection(Edm.Byte) je nový podporovaný datový typ. Tento datový typ otevře integraci s binárními vloženými modely Cohere v3 a vlastní binární kvantací. Úzké datové typy snižují náklady na velké vektorové datové sady. Další informace najdete v tématu Index binární data pro hledání vektorů. |
Dovednosti s vícemodálními vkládáními ve službě Azure AI Vision (Preview) | Dovednost | Nová dovednost, která je svázaná s rozhraním API multimodálních vkládání služby Azure AI Vision. Během indexování můžete vygenerovat vkládání textu nebo obrázků. Tato dovednost je dostupná prostřednictvím webu Azure Portal a rozhraní REST API verze 2024-05-01-preview. |
Vektorizátor Azure AI Vision (Preview) | Vektorizátor | Nový vektorizátor se připojí k prostředku Azure AI Vision pomocí multimodálního rozhraní API pro vkládání k vygenerování vkládání v době dotazu. Tento vektorizátor je k dispozici prostřednictvím webu Azure Portal a rozhraní REST API verze 2024-05-01-preview. |
Vektorizátor katalogu modelů Azure AI Studio (Preview) | Vektorizátor | Nový vektorizátor se připojí k modelu vložení nasazeného z katalogu modelů Azure AI Studio. Tento vektorizátor je k dispozici prostřednictvím webu Azure Portal a rozhraní REST API verze 2024-05-01-preview. Implementace integrované vektorizace pomocí modelů z Azure AI Studia |
Dovednost AzureOpenAIEmbedding (Preview) podporuje více modelů v Azure OpenAI | Dovednost | Teď podporuje vkládání textu -3-large a text-embedding-3-small, spolu s text-embedding-ada-002 z předchozí aktualizace. Nové dimensions a modelName vlastnosti umožňují zadat různé modely vkládání v Azure OpenAI. Dříve byly limity dimenzí pevně nastaveny na 1 536 dimenzí, které platí pouze pro vkládání textu ada-002. Aktualizovaná dovednost je dostupná prostřednictvím webu Azure Portal a rozhraní REST API verze 2024-05-01-preview. |
Aktualizace webu Azure Portal | Portál | Průvodce importem a vektorizací dat teď podporuje indexery OneLake jako zdroj dat. Pro vkládání podporuje také připojení k multimodálnímu modelu Azure AI Vision, katalogu modelů Azure AI Studio a dalším modelům vkládání v Azure OpenAI. Při přidávání pole do indexu můžete zvolit binární datový typ. Průzkumník služby Search teď ve výchozím nastavení nastaví verzi 2024-05-01-preview a podporuje nové funkce ve verzi Preview pro vektorové a hybridní dotazy. |
2024-05-01-preview | rozhraní API | Nová verze Preview rozhraní REST API služby Search poskytuje nové dovednosti a vektorizátory, nový binární datový typ, indexer souborů OneLake a nové parametry dotazu pro relevantnější výsledky. Pokud máte existující kód napsaný ve verzi 2023-07-01-Preview a potřebujete migrovat na tuto verzi, přečtěte si téma Upgrade rozhraní REST API . |
Beta balíčky sady Azure SDK | rozhraní API | Projděte si protokoly změn v následujících beta balíčcích sady Azure SDK pro novou podporu funkcí: Azure SDK pro Python, Azure SDK pro .NET, Azure SDK pro Javu. |
Ukázky kódu Pythonu | Ukázky | Nové ucelené ukázky ukazují integraci s Cohere Embed v3, integraci s OneLake a cloudovými datovými platformami na Google a AWS a integraci s multimodálními rozhraními API služby Azure AI Vision. |
Duben 2024
Položka | Typ | Popis |
---|---|---|
Zpřístupnění informací adresování aktualizací zabezpečení | rozhraní API | Odpovědi GET už nevrací připojovací řetězec ani klíče. Platí pro get Skillset, GET Index a GET Indexer. Tato změna pomáhá chránit vaše prostředky Azure integrované se službou AI Search před neoprávněným přístupem. |
Další úložiště na úrovních Basic a Standard | Infrastruktura | Basic teď podporuje až tři oddíly a tři repliky. Úrovně Basic a Standard (S1, S2, S3) mají výrazně více úložiště na oddíl ve stejné fakturační sazbě pro jednotlivé oddíly. Kapacita navíc podléhá regionální dostupnosti a vztahuje se na nové vyhledávací služby vytvořené po 3. dubnu 2024. V současné době není k dispozici žádný místní upgrade, takže pro získání dodatečného úložiště musíte vytvořit novou vyhledávací službu. |
Další kvóta pro vektory | Infrastruktura | Kvóty vektorů jsou také vyšší u nových služeb vytvořených po 3. dubnu 2024 ve vybraných oblastech. |
Vektorové kvantování, datové typy úzkých vektorů a nová stored vlastnost (Preview) |
Funkce | Společně tyto tři funkce přidávají kompresi vektorů a inteligentnější možnosti úložiště. Za prvé skalární kvantování snižuje velikost vektorových indexů v paměti a na disku. Za druhé, úzké datové typy snižují úložiště podle polí uložením menších hodnot. Za třetí můžete použít stored možnost odhlášení od uložení dodatečné kopie vektoru, která se používá jenom pro výsledky hledání. Pokud v odpovědi dotazu nepotřebujete vektory, můžete nastavit stored hodnotu False, abyste ušetřili místo. |
2024-03-01-preview Search REST API | rozhraní API | Nová verze Preview rozhraní REST API služby Search pro nové datové typy, vlastnosti komprese vektorů a možnosti úložiště vektorů |
2024-03-01-preview Management REST API | rozhraní API | Nová verze Preview rozhraní REST API správy pro operace řídicí roviny |
Oznámení o vyřazení verze Preview z 7. 7. 2023 | rozhraní API | Vyřazení oznámilo 8. dubna 2024. 8. července 2024 se stane nepodporovaným. Toto bylo první rozhraní REST API, které nabízelo podporu vektorového vyhledávání. Novější verze rozhraní API mají jinou konfiguraci vektoru. Co nejdříve byste měli migrovat na novější verzi . |
Únor 2024
Položka | Typ | Popis |
---|---|---|
Nové limity dimenzí | Funkce | U vektorových polí jsou nyní 3072 maximální limity dimenzí v rozmezí od 2048 . |
Oznámení z roku 2023
Month | Typ | Oznámení |
---|---|---|
Listopad | Funkce | Obecně dostupné vektorové vyhledávání. Předchozí omezení klíčů spravovaných zákazníkem (CMK) je nyní zrušeno. Předfiltrování a vyčerpávající algoritmus K-nejbližšího souseda jsou nyní také obecně dostupné. |
Listopad | Funkce | Sémantický ranker, obecně dostupný |
Listopad | Funkce | Integrovaná vektorizace (Preview) přidává převody bloků dat a převodů textu na vektor během indexování a také přidává převody textu na vektory v době dotazu. |
Listopad | Funkce | Průvodce importem a vektorizací dat (Preview) automatizuje vytváření bloků a vektorizaci dat. Cílí na rozhraní REST API verze 2023-10-10-01-Preview . |
Listopad | Funkce | Projekce indexů (Preview) definují tvar sekundárního indexu, který se používá pro vzor indexu 1:N, kde obsah z kanálu rozšiřování může cílit na více indexů. |
Listopad | rozhraní API | Rozhraní REST API služby Search 2023-11-01 je stabilní verze rozhraní REST API služby Search pro vektorové vyhledávání a sémantické řazení. Postup migrace na obecně dostupné funkce najdete v tématu Upgrade rozhraní REST API . |
Listopad | rozhraní API | Rozhraní REST API služby 2023-11-01 Management přidává rozhraní API, která povolují nebo zakazují sémantický ranker. |
Listopad | Dovednost | Dovednosti vkládání Azure OpenAI (Preview) se připojí k nasazeného modelu vkládání na prostředek Azure OpenAI, který generuje vkládání během provádění sady dovedností. |
Listopad | Dovednost | Dovednost Rozdělení textu (Preview) byla aktualizována v 10. 10. 2023 ve verzi Preview , aby podporovala nativní bloky dat. |
Listopad | Video | Způsob, jakým vektorové vyhledávání a sémantické řazení vylepšují výzvy GPT, vysvětluje, jak hybridní načítání poskytuje optimální základní data pro generování užitečných odpovědí AI a umožňuje vyhledávat jak koncepty, tak klíčová slova. |
Listopad | Vzorek | Řízení přístupu na základě role v aplikacích Generative AI vysvětluje, jak pomocí Rozhraní Microsoft Entra ID a rozhraní Microsoft Graph API zavést podrobná uživatelská oprávnění pro blokovaný obsah v indexu. |
Říjen | Vzorek | Akcelerátor řešení "Chat s daty". Kompletní model RAG, který jako načítač používá Azure AI Search. Poskytuje indexování, vytváření bloků dat a orchestraci. |
Říjen | Funkce | Vyčerpávající algoritmus bodování K-Nearest Neighbors (KNN) pro vyhledávání podobnosti ve vektorovém prostoru K dispozici pouze v rozhraní REST API verze 2023-10-10-01 Preview. |
Říjen | Funkce | Předfiltry ve vektorovém hledání vyhodnocují kritéria filtru před spuštěním dotazu, což snižuje množství obsahu, který je potřeba prohledávat. K dispozici pouze v rozhraní REST API verze 2023-10-01-Preview prostřednictvím nové vectorFilterMode vlastnosti dotazu, která se dá nastavit na preFilter (výchozí) nebo postFilter v závislosti na vašich požadavcích. |
Říjen | rozhraní API | 2023-10-01-Preview Search REST API, způsobující chybu definici vektorových polí a vektorových dotazů. |
Srpen | Funkce | Vylepšené sémantické hodnocení. Upgradované modely se zavádějí pro sémantické řazení a dostupnost se rozšiřuje do dalších oblastí. Maximální počet jedinečných tokenů se zdvojnásobil z 128 na 256. |
Červenec | Vzorek | Vector demo (Azure SDK pro JavaScript) Používá Node.js a knihovnu @azure/search-documents 12.0.0-beta.2 ke generování vkládání, vytvoření a načtení indexu a spuštění několika vektorových dotazů. |
Červenec | Vzorek | Vector demo (Azure SDK pro .NET) Používá knihovnu Azure.Search.Documents 11.5.0-beta.3 ke generování vkládání, vytvoření a načtení indexu a spuštění několika vektorových dotazů. Tuto ukázku můžete vyzkoušet také od týmu sady Azure SDK. |
Červenec | Vzorek | Vector demo (Azure SDK pro Python) používá nejnovější beta verzi azure.search.documents ke generování vkládání, vytvoření a načtení indexu a spuštění několika vektorových dotazů. Další ukázky vektorového vyhledávání najdete v úložišti azure-search-vector-samples/demo-python . |
Červen | Funkce | Vektorové vyhledávání ve veřejné verzi Preview |
Červen | Funkce | Dostupnost sémantického vyhledávání dostupná na úrovni Basic. |
Červen | rozhraní API | 2023-07-01-Preview Search REST API. Podpora pro vektorové vyhledávání |
Květen | Funkce | Azure RBAC (řízení přístupu na základě role, obecně dostupné) |
Květen | rozhraní API | 2022-09-01 Management REST API s podporou konfigurace vyhledávání pro použití rolí Azure. Modul Az.Search modulu Azure PowerShell a Az search v Azure CLI se aktualizuje, aby podporoval možnosti ověřování vyhledávací služby. K konfiguraci možností ověřování můžete použít také zprostředkovatele Terraformu (podrobnosti najdete v tomto rychlém startu Terraformu). |
Duben | Vzorek | Nasazení Azure AI Search do více oblastí pro zajištění kontinuity podnikových procesů a zotavení po havárii Skripty nasazení, které plně nakonfigurují víceregionální řešení pro Azure AI Search, s možnostmi synchronizace obsahu a přesměrování požadavků v případě selhání koncového bodu. |
Březen | Vzorek | Data ChatGPT + Enterprise pomocí Azure OpenAI a Azure AI Search (GitHub) Kód Pythonu a šablona pro kombinování služby Azure AI Search s velkými jazykovými modely v OpenAI Pozadí najdete v tomto blogovém příspěvku technické komunity: Revoluce podnikových dat pomocí ChatGPT. Klíčové body: Pomocí služby Azure AI Search můžete konsolidovat a indexovat prohledávatelný obsah. Zadejte dotaz na index pro počáteční výsledky hledání. Sestaví výzvy z těchto výsledků a odešle do modelu gpt-35-turbo (Preview) v Azure OpenAI. Vraťte odpověď mezi dokumenty a v aplikaci pro zákazníky zadejte citace a transparentnost, aby uživatelé mohli odpověď vyhodnotit. |
Oznámení z předchozího roku
Service rebrand
Tato služba měla v průběhu let více názvů. Tady jsou v obráceném chronologickém pořadí:
- Azure AI Search (listopad 2023) Přejmenováno tak, aby odpovídalo službám Azure AI a očekáváním zákazníků.
- Služba Azure Cognitive Search (říjen 2019) byla přejmenována tak, aby odrážela rozšířené (ještě volitelné) využití kognitivních dovedností a zpracování umělé inteligence v operacích služeb.
- Původní název služby Azure Search (březen 2015)
Aktualizace služby
Oznámení o aktualizacích služeb pro Azure AI Search najdete na webu Azure.
Přejmenování funkce
Sémantické vyhledávání bylo přejmenováno na sémantické ranker v listopadu 2023, aby se lépe popsala funkce, která poskytuje pořadí L2 existující sady výsledků.