Poznámka
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Ve službě Azure AI Search je kapacita založená na replikách a oddílech, které je možné škálovat na vaši úlohu. Repliky jsou kopie vyhledávače. Oddíly jsou jednotky úložiště. Každá nová vyhledávací služba začíná jednou, ale repliky a oddíly můžete přidávat nebo odebírat nezávisle tak, aby vyhovovaly proměnlivým úlohám. Přidání kapacity zvyšuje náklady na provoz vyhledávací služby.
Fyzické charakteristiky replik a oddílů, jako je rychlost zpracování a vstupně-výstupní operace disku, se liší podle cenové úrovně. Ve standardní vyhledávací službě jsou repliky a oddíly rychlejší a větší než ty u základní služby.
Změna kapacity není okamžitá. Uvedení do provozu nebo vyřazení oddílů může trvat až hodinu, zejména u služeb s velkým množstvím dat.
Při škálování vyhledávací služby si můžete vybrat z následujících nástrojů a přístupů:
Poznámka:
Pokud byla vaše služba vytvořena před dubnem nebo květnem 2024, může být jednorázový upgrade na vyšší limity úložiště k dispozici bez dalších poplatků. Další informace najdete v Vylepšete svou vyhledávací službu.
Koncepty: jednotky vyhledávání, repliky, oddíly
Kapacita se vyjadřuje ve vyhledávacích jednotkách , které je možné přidělit kombinací oddílů a replik.
Koncepce | Definice |
---|---|
Jednotka vyhledávání | Jeden přírůstek celkové dostupné kapacity (36 jednotek). Ke spuštění služby se vyžaduje minimálně jedna jednotka. První replika a pár oddílů je první vyhledávací jednotka. Každá další instance repliky nebo oddílu ale využívá další vyhledávací jednotku. Například začnete s jednou replikou a oddílem (jedna jednotka vyhledávání), přidáte druhou repliku, teď používáte dvě jednotky hledání. Jednotka vyhledávání je také fakturační jednotkou pro službu Azure AI Vyhledávání. |
Replika | Instance vyhledávací služby, které se používají především k vyrovnávání zatížení operací dotazů. Každá replika hostuje jednu kopii indexu. Pokud přidělíte tři repliky, máte k dispozici tři kopie indexu pro obsluhu dotazových požadavků. |
Oddíl | Fyzické úložiště a vstupně-výstupní operace pro operace čtení a zápisu (například při opětovném sestavení nebo aktualizaci indexu) Každý oddíl má část celkového indexu. Pokud přidělíte tři oddíly, index se rozdělí na třetiny. |
V tabulce oddílů a replik najdete možné kombinace, které zůstanou pod limitem 36 jednotek.
Kdy přidat kapacitu
Na začátku je služba přidělena na minimální úroveň prostředků, která se skládá z jednoho oddílu a jedné repliky. Zvolená úroveň určuje velikost a rychlost oddílu a každá vrstva se optimalizuje kolem sady charakteristik, které odpovídají různým scénářům. Pokud zvolíte vyšší úroveň, možná budete potřebovat méně oddílů , než kdybyste zvolili S1. Jednou z otázek, na které je potřeba odpovědět prostřednictvím samostatně řízeného testování, je to, zda větší a dražší partice přináší lepší výkon než dvě levnější partice ve službě nastavené na nižší úrovni.
Jedna služba musí mít dostatek prostředků pro zpracování všech úloh (indexování a dotazů). Ani jedna pracovní zátěž neběží na pozadí. Indexování můžete naplánovat pro časy, kdy jsou požadavky na dotazy přirozeně méně časté, ale služba jinak nezpřednostňuje jeden úkol před druhým. Kromě toho určité množství redundance vyhladí výkon dotazů při interní aktualizaci služeb či uzlů.
Pokyny pro určení, zda se má přidat kapacita, zahrnují:
- Splnění kritérií vysoké dostupnosti pro smlouvu o úrovni služeb
- Četnost chyb HTTP 503 (Služba není k dispozici) se zvyšuje.
- Frekvence chyb HTTP 429 (Příliš mnoho požadavků) se zvyšuje, což značí nedostatek úložiště.
- Očekává se velké objemy dotazů.
- Jednorázový upgrade na novější infrastrukturu a větší oddíly nestačí.
- Aktuální počet oddílů není vhodný pro indexování úloh.
Obecně platí, že vyhledávací aplikace obvykle potřebují více replik než partice, zejména když jsou operace služby přikloněné k úlohám dotazů. ** Každá replika je kopie vašeho indexu, která službě umožňuje vyrovnávat zátěž požadavků na více kopií. Azure AI Search spravuje veškeré vyrovnávání zatížení a replikaci indexu a počet replik přidělených vaší službě můžete kdykoli změnit. Ve standardní vyhledávací službě můžete přidělit až 12 replik a 3 repliky ve vyhledávací službě Basic. Přidělení repliky je možné provést buď z webu Azure Portal , nebo z některé z programových možností.
Další oddíly jsou užitečné pro náročné úlohy indexování. Další oddíly rozdělují operace čtení a zápisu na více zdrojů výpočetního výkonu.
Dotazování větších indexů trvá déle. Můžete například zjistit, že každé postupné zvýšení počtu oddílů vyžaduje menší, ale úměrné zvýšení replik. Složitost vašich dotazů a objem dotazů má vliv na to, jak rychle se dotazy provádějí.
Poznámka:
Přidání dalších replik nebo partice zvyšuje náklady na provoz služby a může představovat mírné změny v pořadí výsledků. Nezapomeňte zkontrolovat cenovou kalkulačku, abyste pochopili důsledky fakturace při přidávání dalších uzlů. Následující graf vám může pomoct prověřit počet požadovaných jednotek hledání pro konkrétní konfiguraci. Další informace o tom, jak další repliky ovlivňují zpracování dotazů, najdete v tématu Řazení výsledků.
Postup upgradu kapacity
Některé funkce Azure AI Search jsou dostupné jenom pro nové služby. Jednou z těchto možností je vyšší kapacita úložiště, která se vztahuje na služby vytvořené po dubnu 2024. Pokud jste však službu vytvořili před dubnem 2024, můžete získat vyšší kapacitu bez opětovného vytvoření služby provedením jednorázového upgradu. Další informace najdete v Vylepšete svou vyhledávací službu.
Jak změnit kapacitu
Pokud chcete zvýšit nebo snížit kapacitu služby, máte dvě možnosti:
Přidání nebo odebrání oddílů a replik
Přihlaste se do Azure portálu a vyberte svou vyhledávací službu.
V levém podokně vyberte Nastavení>Škála.
Následující snímek obrazovky zobrazuje standardní službu, která je zřízená s jednou replikou a jedním oddílem. Vzorec v dolní části označuje, kolik jednotek hledání se používá (1). Pokud by jednotková cena byla 100 USD (nikoli reálná cena), měsíční náklady na provoz této služby by byly v průměru 100 USD.
Pomocí posuvníku zvýšíte nebo snížíte počet oddílů. Zvolte Uložit.
Tento příklad přidá druhou repliku a oddíl. Všimněte si počtu jednotek vyhledávání; teď je čtyři, protože fakturační vzorec je repliky vynásobené oddíly (2 x 2). Zdvojnásobení kapacity více než zdvojnásobí náklady na provoz služby. Pokud by náklady na jednotku vyhledávání byly 100 USD, nová měsíční faktura by teď byla 400 USD.
Aktuální náklady na jednotku jednotlivých úrovní najdete na stránce s cenami.
Zkontrolujte své oznámení, abyste potvrdili, že operace byla zahájena.
Dokončení této operace může trvat několik hodin. Po spuštění není možné proces zrušit a neexistuje žádné monitorování přizpůsobení replik a oddílů v reálném čase. Během probíhajících změn se ale zobrazí následující zpráva.
Změna cenové úrovně
Poznámka:
Verze 2025-02-01-Preview podporuje změny mezi úrovněmi Basic a Standard (S1, S2 a S3). V současné době můžete přejít pouze z nižší úrovně na vyšší úroveň, například přejít z úrovně Basic na S1. Vaše oblast také nemůže mít omezení kapacity na vyšší úrovni.
Vaše cenová úroveň určuje maximální úložiště vyhledávací služby. Pokud potřebujete větší kapacitu, můžete přejít na jinou cenovou úroveň, která vyhovuje vašim potřebám úložiště.
Kromě kapacity má změna cenové úrovně vliv na zatížení a maximální limity vaší služby. Než budete pokračovat, porovnejte limity služby aktuální úrovně a požadované úrovně. Patří mezi ně omezení pro:
- Úložiště oddílů
- Rejstříky
- Vektory
- Indexátory
- Sdílené prostředky privátního propojení
- Synonyma
- Aliasy indexů
- Řízení sémantického rankeru
Obecně platí, že přechod na vyšší úroveň zvyšuje limit úložiště a limit vektorů, zvyšuje propustnost požadavků a snižuje latenci.
Chcete-li změnit cenovou úroveň:
Přihlaste se do Azure portálu a vyberte svou vyhledávací službu.
V levém podokně vyberte Nastavení>Škála.
Pod aktuální úrovní vyberte Změnit cenovou úroveň.
Na stránce Vybrat cenovou úroveň zvolte v seznamu vyšší úroveň. V současné době se můžete pohybovat pouze mezi úrovněmi Basic, S1, S2 a S3. Jiné cenové úrovně nejsou k dispozici a zobrazují se šedě.
Pokud chcete přepnout na vyšší úroveň, vyberte Vybrat.
Dokončení této operace může trvat několik hodin. Po spuštění nemůžete proces zrušit a neexistuje žádné monitorování změn vrstev v reálném čase. Na stránce Přehled ale stav Provisioning indikuje, že operace pro vaši službu probíhá.
Jak se zpracovávají žádosti o škálování
Po přijetí žádosti o škálování vyhledávací služba:
- Zkontroluje, jestli je požadavek platný.
- Spustí zálohování dat a systémových informací.
- Zkontroluje, jestli je služba již v nasazování (přidává aktuálně nebo eliminuje repliky nebo oddíly).
- Zahajuje nastavení.
Škálování služby může trvat až 15 minut nebo déle než hodinu v závislosti na velikosti služby a rozsahu požadavku. Zálohování může trvat několik minut v závislosti na množství dat a počtu oddílů a replik.
Výše uvedené kroky nejsou zcela po sobě jdoucí. Systém například spustí zřizování, když to může bezpečně provést, což může být v době, kdy se zálohování chýlí ke konci.
Chyby při škálování
Chybová zpráva Operace aktualizace služby nejsou v tuto chvíli povoleny, protože zpracováváme předchozí požadavek, je způsobená opakováním žádosti o vertikální snížení nebo navýšení kapacity, když služba už zpracovává předchozí požadavek.
Vyřešte tuto chybu tak, že zkontrolujete stav služby a ověříte stav zřizování:
- K získání stavu služby použijte rozhraní REST API pro správu, Azure PowerShell nebo Azure CLI.
- Zavolejte příkaz Get Service (REST) nebo jeho ekvivalent pro PowerShell nebo příkazový řádek.
- Zkontrolujte odpověď na "provisioningState": "provisioning"
Pokud je stav „Zřizování“, počkejte na dokončení požadavku. Než se pokusíte o další požadavek, stav by měl být Úspěšný nebo Neúspěšný. Neexistuje žádný stav pro zálohování. Zálohování je interní operace a není pravděpodobné, že by mohlo způsobit přerušení škálovacího cvičení.
Pokud se zdá, že je vaše vyhledávací služba ve stavu zřizování zastavená, zkontrolujte opuštěné indexy, které jsou nepoužitelné, mají nulové objemy dotazů a bez aktualizací indexu. Nepoužitelný index může blokovat změny kapacity služby. Hledejte zejména indexy, které jsou zašifrované pomocí klíče CMK, jejichž klíče už nejsou platné. Index byste měli odstranit nebo obnovit klíče, aby se index vrátil do režimu online a odblokuje se operace škálování.
Kombinace oddílů a replik
Následující graf platí pro úroveň Standard a vyšší. Zobrazuje všechny možné kombinace oddílů a replik, které podléhají maximálnímu počtu 36 jednotek vyhledávání na službu.
1 oddíl | 2 oddíly | 3 oddíly | 4 oddíly | 6 oddílů | 12 oddílů | |
---|---|---|---|---|---|---|
1 replika | 1 SU | 2 SU | 3 SU | 4 SU | 6 SU | 12 SU |
2 kopie | 2 SU | 4 SU | 6 SU | 8 SU | 12 SU | 24 SU |
3 repliky | 3 SU | 6 SU | 9 SU | 12 SU | 18 SU | 36 SU |
4 repliky | 4 SU | 8 SU | 12 SU | 16 SU | 24 SU | neuplatňuje se |
5 kopií | 5 SU | 10 SU | 15 SU | 20 SU | 30 SU | neuplatňuje se |
6 replik | 6 SU | 12 SU | 18 SU | 24 SU | 36 SU | neuplatňuje se |
12 replik | 12 SU | 24 SU | 36 SU | neuplatňuje se | neuplatňuje se | neuplatňuje se |
Základní vyhledávací služby mají nižší počet jednotek vyhledávání.
Ve vyhledávacích službách vytvořených před 3. dubnem 2024 mohou základní služby mít přesně jeden oddíl a až tři repliky, přičemž maximální limit je tři SU. Jediným nastavitelným prostředkem jsou repliky. Možná ale budete moct zvýšit počet oddílů upgradem služby.
Ve vyhledávacích službách vytvořených po 3. dubnu 2024 v podporovaných oblastech můžou mít základní služby až tři oddíly a tři repliky. Maximální limit SU je devět, aby podporoval úplnou sadu oddílů a replik.
Pro vyhledávací služby na libovolné fakturovatelné úrovni bez ohledu na datum vytvoření potřebujete minimálně dvě repliky pro zajištění vysoké dostupnosti dotazů.
Informace o fakturačních sazbách na úrovni a měně najdete na stránce s cenami služby Azure AI Search.
Odhad kapacity s využitím fakturovatelné úrovně
Velikost indexů, které očekáváte k sestavení, určuje potřeby úložiště. Neexistují žádné pevné heuristické ani generality, které pomáhají s odhady. Jediný způsob, jak určit velikost indexu, je jeden vytvořit. Jeho velikost je založená na tokenizaci a vkládání a jestli povolíte sugestory, filtrování a řazení, nebo můžete využít kompresi vektorů.
Doporučujeme odhadnout fakturovatelnou úroveň Basic nebo vyšší. Úroveň Free běží na fyzických prostředcích sdílených více zákazníky a podléhá faktorům nad rámec vaší kontroly. Pouze vyhrazené prostředky fakturovatelné vyhledávací služby mohou pojmout delší doby vzorkování a zpracování pro realističtější odhady množství indexu, velikosti a objemů dotazů během vývoje.
Zkontrolujte limity služeb na jednotlivých úrovních a zjistěte, jestli nižší úrovně můžou podporovat požadovaný počet indexů. Zvažte, jestli potřebujete více kopií indexu pro aktivní vývoj, testování a produkci.
Vyhledávací služba podléhá omezením objektů (maximální počet indexů, indexerů, sad dovedností atd.) a limitů úložiště. Kterýkoli limit je dosažen jako první, je považován za platný limit.
Vytvořte službu na fakturovatelné úrovni. Úrovně jsou optimalizované pro určité úlohy. Například úroveň Optimalizováno pro úložiště má limit 10 indexů, protože je navržená tak, aby podporovala nízký počet velkých indexů.
Pokud si nejste jistí ohledně projektovaného zatížení, začněte na nízké úrovni, jako je Basic nebo S1.
Pokud testování zahrnuje rozsáhlé indexování a načítání dotazů, začněte vysoko na úrovni S2 nebo dokonce S3.
Pokud indexujete velké množství dat a zatížení dotazů je relativně nízké, začněte s optimalizací úložiště v L1 nebo L2, stejně jako u interní obchodní aplikace.
Vytvořte počáteční index , abyste zjistili, jak se zdrojová data překládají na index. Toto je jediný způsob, jak odhadnout velikost indexu. Atributy definic polí ovlivňují požadavky fyzického úložiště:
Při hledání podle klíčových slov se index zvětšuje, pokud jsou pole označena jako filtrovatelná a řaditelná.
Pro vektorové vyhledávání můžete nastavit parametry pro zmenšení velikosti vektoru.
Monitorujte úložiště, limity služeb, objem dotazů a latenci na webu Azure Portal. V Azure portalu se zobrazuje počet dotazů za sekundu, dotazy limitované kvůli přetížení a latence vyhledávání. Všechny tyto hodnoty vám můžou pomoct rozhodnout, jestli jste vybrali správnou úroveň.
Přidejte repliky pro zajištění vysoké dostupnosti nebo ke zmírnění pomalého výkonu dotazů.
Neexistují žádné pokyny k tomu, kolik replik je potřeba k přizpůsobení zatížení dotazů. Výkon dotazů závisí na složitosti dotazu a konkurenčních úlohách. I když přidávání replik jasně vede k lepšímu výkonu, výsledek není striktně lineární: přidání tří replik nezaručuje trojitou propustnost. Pokyny k odhadu QPS pro vaše řešení najdete v tématu Analýza výkonua monitorování dotazů.
U invertovaného indexu se velikost a složitost určují obsahem, ne nutně množstvím dat, která do něj vytáčíte. Velký zdroj dat s vysokou redundancí může mít za následek menší index než menší datovou sadu, která obsahuje vysoce proměnlivý obsah. Proto je zřídka možné odvodit velikost indexu na základě velikosti původní datové sady.
Požadavky na úložiště se dají nafouknout, pokud zahrnete data, která se nikdy nebudou prohledávat. V ideálním případě dokumenty obsahují jenom data, která potřebujete pro vyhledávání.
Důležité informace o smlouvě o úrovni služeb
Funkce úrovně Free a Preview se nevztahují na smlouvy o úrovni služeb (SLA). U všech fakturovatelných úrovní se smlouvy SLA projeví při zřizování dostatečné redundance pro vaši službu.
Dvě nebo více replik splňují SLA požadavky pro dotazy (čtení).
Tři nebo více replik splňuje SLA pro dotazy a indexování (čtení a zápis).
Počet oddílů nemá vliv na úrovně SLA.