Szolgáltatási korlátok az Azure AI Searchben

A tárterületre, a számítási feladatokra és az indexek és egyéb objektumok mennyiségére vonatkozó maximális korlátok attól függenek, hogy az Azure AI Search ingyenes, alapszintű, standard vagy tárolási optimalizált tarifacsomagokban van-e kiépítve.

  • Az ingyenes egy több-bérlős megosztott szolgáltatás, amely az Azure-előfizetéséhez tartozik.

  • Az Alapszintű dedikált számítási erőforrásokat biztosít az éles számítási feladatokhoz kisebb méretekben, de bizonyos hálózati infrastruktúrát más bérlőkkel is megoszt.

  • A standard dedikált gépeken fut, és minden szinten több tárolási és feldolgozási kapacitással rendelkezik. A Standard négy szintből áll: S1, S2, S3 és S3 HD. Az S3 nagy sűrűségű (S3 HD) több-bérlős és nagy mennyiségű kis indexhez (szolgáltatásonként háromezer index) készült. Az S3 HD nem biztosítja az indexelő szolgáltatást , és az adatbetöltésnek olyan API-kat kell használnia, amelyek adatokat küldnek le a forrásból az indexbe.

  • A Storage Optimized dedikált gépeken fut, a Standardnál nagyobb teljes tárterülettel, tárterület-sávszélességgel és memóriával. Ez a szint nagy, lassan változó indexeket céloz meg. A Tárolásoptimalizált két szinten érhető el: L1 és L2.

Előfizetés korlátai

Több számlázható keresési szolgáltatást (alapszintű és magasabb) hozhat létre, az egyes szinteken engedélyezett szolgáltatások maximális számával. Létrehozhat például legfeljebb 16 szolgáltatást az Alapszintű szinten, és egy előfizetésen belül további 16 szolgáltatást az S1 szinten. A szintekről további információt az Azure AI Search csomagjának (vagy termékváltozatának) kiválasztása című témakörben talál.

A maximális szolgáltatási korlátok kérés esetén emelhetők. Ha több szolgáltatásra van szüksége ugyanabban az előfizetésben, küldjön támogatási kérelmet.

Erőforrás Ingyenes 1 Alap S1 S2 S3 S3 HD L1 L2
Szolgáltatások maximális száma 0 16 16 8 6 6 6 6
Keresési egységek maximális száma (SU)2 n/a 3 SU 36 SU 36 SU 36 SU 36 SU 36 SU 36 SU

1 Azure-előfizetésenként egy ingyenes keresési szolgáltatással rendelkezhet. Az ingyenes szint a más ügyfelekkel megosztott infrastruktúrán alapul. Mivel a hardver nem dedikált, a vertikális felskálázás nem támogatott, a tárolás pedig 50 MB-ra korlátozódik.

2 A keresési egységek (SU) számlázási egységek, replikaként vagy partícióként vannak lefoglalva. Mindkettőre szükség van. Az SU-kombinációkkal kapcsolatos további információkért tekintse meg a keresési szolgáltatás kapacitásának becslését és kezelését ismertető témakört.

Szolgáltatáskorlátok

A keresési szolgáltatásra maximális tárterületkorlát vonatkozik (a partíciók méretének megszorozva a partíciók számával), vagy az indexek vagy indexelők maximális számának korlátja, amelyik előbb következik be.

Erőforrás Ingyenes 1 Alapszintű 1 S1 S2 S3 S3 HD L1 L2
Szolgáltatásiszint-szerződés (SLA) 2 Nem Igen Igen Igen Igen Igen Igen Igen
Tárolás (partícióméret) 50 MB 3 2 GB 25 GB 100 GB 200 GB 200 GB 1 TB 2 TB
Partíciók n/a 0 12 12 12 3 12 12
Replikák n/a 3 12 12 12 12 12 12

1 Alapszintű egy rögzített partícióval rendelkezik. Legfeljebb 3 további keresési egységet adhat hozzá replikák hozzáadásához a nagyobb lekérdezési kötetekhez és a magas rendelkezésre álláshoz.

2 A szolgáltatásiszint-szerződések a dedikált erőforrásokkal rendelkező számlázható szolgáltatásokra vonatkoznak. Az ingyenes szolgáltatások és az előzetes verziójú funkciók nem rendelkeznek SLA-val. A számlázható szolgáltatások esetében az SLA-k akkor lépnek érvénybe, amikor elegendő redundanciát épít ki a szolgáltatáshoz. Két vagy több replika szükséges a lekérdezési (olvasási) SLA-khoz. A lekérdezési és indexelési (olvasási-írási) SLA-khoz három vagy több replikára van szükség. A partíciók száma nem SLA-szempont. A replikákkal és a magas rendelkezésre állással kapcsolatos további információkért tekintse meg az Azure AI Search megbízhatóságát.

3 Az ingyenes szolgáltatások nem rendelkeznek dedikált partícióval. Az 50 MB-os tárterületkorlát a más ügyfelekkel megosztott infrastruktúrán lévő ingyenes keresési szolgáltatás számára lefoglalt maximális tárhelyre vonatkozik.

Indexkorlátok

Erőforrás Ingyenes Alapszintű 1 S1 S2 S3 S3 HD L1 L2
Indexek maximális száma 3 5 vagy 15 50 200 200 1000 partíciónként vagy 3000 szolgáltatásonként 10 10
Egyszerű mezők maximális száma indexenként 2 1000 100 1000 1000 1000 1000 1000 1000
Vektormezőnkénti dimenziók maximális száma 3072 3072 3072 3072 3072 3072 3072 3072
Összetett gyűjtemények maximális száma indexenként 40 40 40 40 40 40 40 40
Az összes összetett gyűjtemény maximális elemei dokumentumonként 3 3000 3000 3000 3000 3000 3000 3000 3000
Összetett mezők maximális mélysége 10 10 10 10 10 10 10 10
Javaslattevők maximális száma indexenként 0 0 0 0 0 0 0 0
Indexenkénti pontozási profilok maximális száma 100 100 100 100 100 100 100 100
Profilonkénti függvények maximális száma 8 8 8 8 8 8 8 8

1 A 2017 decembere előtt létrehozott alapszolgáltatások alacsonyabb korlátokkal rendelkeznek (15 helyett 5) az indexeken. Az alapszint az egyetlen termékváltozat, amelynek alsó korlátja indexenként 100 mező.

2 A mezők felső korlátja magában foglalja az első szintű mezőket és a beágyazott almezőket egy összetett gyűjteményben. Ha például egy index 15 mezőt tartalmaz, és két összetett gyűjteményt tartalmaz öt almezővel, az index mezőszáma 25. A nagyon nagy mezőgyűjteményt tartalmazó indexek lassúak lehetnek. Csak a szükséges mezőkre és attribútumokra korlátozza a mezőket és attribútumokat , és futtassa az indexelési és lekérdezési tesztet annak érdekében, hogy a teljesítmény elfogadható legyen.

3 Az elemek felső korlátja azért létezik, mert nagy számú elem jelentősen növeli az indexhez szükséges tárterületet. Az összetett gyűjtemény egy eleme a gyűjtemény tagjaként van definiálva. Tegyük fel például, hogy egy Hotel dokumentum egy Összetett szobák gyűjteménysel rendelkezik, a Szobák gyűjtemény minden egyes helyisége elemnek minősül. Az indexelés során az indexelő motor legfeljebb 3000 elemet képes biztonságosan feldolgozni a dokumentum egészében. Ez a korlát csak összetett gyűjteményekben lett bevezetve api-version=2019-05-06 , és csak az összetett gyűjteményekre vonatkozik, sztringgyűjteményekre és összetett mezőkre nem.

Előfordulhat, hogy a maximális korlátok eltérését tapasztalja, ha a szolgáltatás egy hatékonyabb fürtön van kiépítve. Az itt szereplő korlátok a közös nevezőt jelölik. A fenti specifikációkra épülő indexek bármely régió egyenértékű szolgáltatási szintjei között hordozhatók.

Dokumentumkorlátok

Indexenként körülbelül 24 milliárd dokumentumot használhat alapszintű, S1, S2, S3, L1 és L2 keresési szolgáltatásokon. S3 HD esetén a korlát indexenként 2 milliárd dokumentum. Az összetett gyűjtemények minden példánya külön dokumentumnak számít ezen korlátok tekintetében.

Dokumentumméretkorlátok API-hívásonként

Az Index API meghívásakor a maximális dokumentumméret körülbelül 16 megabájt.

A dokumentumméret valójában az Index API kérelemtörzsének méretkorlátja. Mivel egyszerre több dokumentumot is átadhat az Index API-nak, a méretkorlát reálisan attól függ, hogy hány dokumentum található a kötegben. Egyetlen dokumentummal rendelkező köteg esetén a maximális dokumentumméret 16 MB JSON.

A dokumentum méretének becslésekor ne feledje, hogy csak azokat a mezőket vegye figyelembe, amelyeket a keresési szolgáltatás felhasználhat. A forrásdokumentumokban lévő bináris vagy képadatokat ki kell hagyni a számításokból.

Vektorindex méretkorlátjai

Ha vektormezőkkel indexeli a dokumentumokat, az Azure AI Search a megadott algoritmusparaméterek használatával belső vektorindexeket hoz létre. Ezeknek a vektorindexeknek a méretét a szolgáltatás szintjének (vagy termékváltozatának) vektorkereséséhez fenntartott memória korlátozza.

A szolgáltatás a keresési szolgáltatás minden partíciójához kikényszeríti a vektorindex-méretkvótát. Minden további partíció növeli az elérhető vektorindex-méretkvótát. Ez a kvóta egy kemény korlát, amely biztosítja, hogy a szolgáltatás kifogástalan állapotban maradjon, ami azt jelenti, hogy a korlát túllépése után a további indexelési kísérletek sikertelenséget eredményeznek. Az indexelést akkor folytathatja, ha felszabadítja a rendelkezésre álló kvótát egyes vektordokumentumok törlésével vagy partíciókban való skálázással.

A táblázat a vektorindexek partíciónkénti méretét ismerteti a szolgáltatási szintek (vagy termékváltozatok) között. A környezethez a következők tartoznak:

  • Az egyes szintek partíciós tárolási korlátai , itt ismétlődve a környezethez.
  • A vektorindexekhez elérhető (GB-ban) partíciók mennyisége (amely akkor jön létre, amikor vektormezőket ad hozzá egy indexhez).
  • A beágyazások hozzávetőleges száma (lebegőpontos értékek) partíciónként.

A Get Service Statistics API (GET /servicestats) használatával kérje le a vektorindex méretkvótát. További részletekért tekintse meg a vektorindex méretéről szóló dokumentációnkat.

2023. július 1. előtt létrehozott szolgáltatások

Szint Tárolási kvóta (GB) Vektorkvóta partíciónként (GB) Partíciónként kb. lebegőpontos (15%-os többletterhelést feltételezve)
Alap 2 0,5 115 millió
S1 25 0 235 millió
S2 100 6 1400 millió
S3 200 12 2800 millió
L1 1000 12 2800 millió
L2 2000 36 8400 millió

A támogatott régiókban 2023. július 1. után létrehozott szolgáltatások

Az Azure AI Search világszerte növeli a vektorindexek méretkorlátját az új keresési szolgáltatások esetében, de a csapat bizonyos régiókban infrastruktúra-kapacitást épít ki. A meglévő szolgáltatások sajnos nem migrálhatók az új korlátokba.

A következő régiók nem támogatják a megnövekedett korlátokat:

  • Középnyugat-Németország
  • Nyugat-India
  • Közép-Katar
Szint Tárolási kvóta (GB) Vektorkvóta partíciónként (GB) Partíciónként kb. lebegőpontos (15%-os többletterhelést feltételezve)
Alap 2 0 235 millió
S1 25 3 700 millió
S2 100 12 2800 millió
S3 200 36 8400 millió
L1 1000 12 2800 millió
L2 2000 36 8400 millió

Indexelőkorlátok

A maximális futási idők a szolgáltatás egészének egyensúlyát és stabilitását biztosítják, a nagyobb adathalmazok azonban a megengedett maximumnál több indexelési időt igényelhetnek. Ha egy indexelési feladat nem fejeződhet be az engedélyezett maximális időn belül, próbálja meg ütemezés szerint futtatni. Az ütemező nyomon követi az indexelés állapotát. Ha egy ütemezett indexelési feladat bármilyen okból megszakad, az indexelő a következő ütemezett futtatáskor ott folytathatja, ahol utoljára abbahagyta.

Erőforrás Ingyenes 1 Alapszintű 2 S1 S2 S3 S3 HD 3 L1 L2
Indexelők maximális száma 3 5 vagy 15 50 200 200 n/a 10 10
Adatforrások maximális száma 3 5 vagy 15 50 200 200 n/a 10 10
Maximális képességkészletek 4 3 5 vagy 15 50 200 200 n/a 10 10
Meghívásonkénti indexelési terhelés maximális száma 10 000 dokumentum Csak a dokumentumok maximális száma korlátozza Csak a dokumentumok maximális száma korlátozza Csak a dokumentumok maximális száma korlátozza Csak a dokumentumok maximális száma korlátozza n/a Korlátlan Korlátlan
Minimális ütemezés 5 perc 5 perc 5 perc 5 perc 5 perc 5 perc 5 perc 5 perc
Maximális futási idő 5 1-3 perc 2 vagy 24 óra 2 vagy 24 óra 2 vagy 24 óra 2 vagy 24 óra n/a 2 vagy 24 óra 2 vagy 24 óra
A 6. képességkészlettel rendelkező indexelők maximális futási ideje 3-10 perc 2 óra 2 óra 2 óra 2 óra n/a 2 óra 2 óra
Blobindexer: maximális blobméret, MB 16 16 128 256 256 n/a 256 256
Blobindexelő: a blobból kinyert tartalom maximális karakterei 32,000 64,000 4 millió 8 millió 16 millió n/a 4 millió 4 millió

1 Az ingyenes szolgáltatások indexelői maximális végrehajtási ideje blobforrások esetén 3 perc, az összes többi adatforrás esetében pedig 1 perc. Az indexelő meghívása 180 másodpercenként egyszer történik. Az Azure AI-szolgáltatásokba betárcsázó AI-indexelés esetén az ingyenes szolgáltatások indexelőnként napi 20 ingyenes tranzakcióra korlátozódnak, ahol a tranzakció olyan dokumentumként van definiálva, amely sikeresen áthalad a bővítési folyamaton (tipp: az indexelők alaphelyzetbe állításával visszaállíthatja a számát).

2 A 2017 decembere előtt létrehozott alapszolgáltatások alacsonyabb korlátokkal rendelkeznek (15 helyett 5) az indexelőkre, az adatforrásokra és a készségkészletekre.

A 3 S3 HD-szolgáltatás nem tartalmazza az indexelők támogatását.

4 Képességcsoportonként legfeljebb 30 képesség.

5 Ami az indexelők 2 vagy 24 órás maximális időtartamát illeti: a 2 órás maximum a leggyakoribb, és erre kell terveznie. A 24 órás korlát egy régebbi indexelő implementációból származik. Ha nem ütemezett indexelői 24 órán keresztül folyamatosan futnak, az azért van, mert ezek az indexelők nem telepíthetők át az újabb infrastruktúrába. Általános szabályként az olyan indexelési feladatok esetében, amelyek nem fejeződhetnek be két órán belül, az indexelőt 2 órás ütemezésre kell állítani. Amikor az első 2 órás időköz befejeződött, az indexelő a következő 2 órás időköz indításakor ott veszi fel, ahol abbahagyta.

6 A képességkészletek végrehajtása és különösen a képelemzés számításigényes, és aránytalanul nagy mennyiségű rendelkezésre álló feldolgozási teljesítményt használnak fel. Ezeknek a számítási feladatoknak a futási ideje le lett rövidítve, hogy a várólistán lévő többi feladat több lehetőséget kapjon a futtatásra.

Feljegyzés

Az indexelők az indexelők az összes összetett gyűjteményre vonatkozó 3000 elem felső korlátját is kikényszeríteni fogják dokumentumonként, kezdve a legújabb GA API-verzióval, amely támogatja az összetett típusok (2019-05-06) használatát. Ez azt jelenti, hogy ha az indexelőt egy korábbi API-verzióval hozta létre, akkor erre a korlátra nem vonatkozik. A maximális kompatibilitás megőrzése érdekében a korábbi API-verzióval létrehozott, majd API-verzióval vagy újabb verzióval 2019-05-06 frissített indexelő továbbra is ki lesz zárva a korlátokból. Az ügyfeleknek tisztában kell lenniük a nagyon nagy összetett gyűjtemények kedvezőtlen hatásával (a korábban leírtak szerint), és erősen javasoljuk, hogy hozzon létre új indexelőket a legújabb GA API-verzióval.

Az indexelők a megosztott privát kapcsolati erőforrás API-val felügyelt privát végpontokon keresztül férhetnek hozzá más Azure-erőforrásokhoz. Ez a szakasz a képességhez kapcsolódó korlátokat ismerteti.

Erőforrás Ingyenes Alap S1 S2 S3 S3 HD L1 L2
Privát végpont indexelő támogatása Nem Igen Igen Igen Igen Nem Igen Igen
Privát végpont támogatása az 1. képességkészlettelrendelkező indexelők számára Nem Nem Nem Igen Igen Nem Igen Igen
Privát végpontok maximális száma n/a 10 vagy 30 100 400 400 n/a 20 20
Eltérő erőforrástípusokmaximális száma 2 n/a 4 7 15 15 n/a 4 4

1 A mi-bővítés és a képelemzés számítási szempontból intenzív, és aránytalan mennyiségű rendelkezésre álló feldolgozási teljesítményt használ fel. Emiatt a privát kapcsolatok le vannak tiltva alacsonyabb szinteken, hogy biztosítsa magának a keresési szolgáltatásnak a teljesítményét és stabilitását.

2 Az eltérő erőforrástípusok száma az adott keresési szolgáltatás összes megosztott privát kapcsolati erőforrásában használt egyedi groupId értékek számaként lesz kiszámítva, függetlenül az erőforrás állapotától.

Szinonimák korlátai

A szinonimatérképek maximális száma rétegenként változik. Minden szabály legfeljebb 20 bővítéssel rendelkezhet, ahol a bővítés egyenértékű kifejezés. Például a "macska", a "cica", a "macska" és a "felis" (macskák nemzetsége) társítása 3 bővítésnek számít.

Erőforrás Ingyenes Alap S1 S2 S3 S3-HD L1 L2
Szinonimatérképek maximális száma 3 3 5 10 20 20 10 10
A szabályok maximális száma térképenként 5000 20000 20000 20000 20000 20000 20000 20000

Index aliaskorlátai

Az index-aliasok maximális száma rétegenként változik. Minden szinten az aliasok maximális száma az engedélyezett indexek maximális számának kétszerese.

Erőforrás Ingyenes Alap S1 S2 S3 S3-HD L1 L2
Maximális aliasok 6 10 vagy 30 100 400 400 2000 partíciónként vagy szolgáltatásonként 6000 20 20

Adatkorlátok (AI-bővítés)

Az olyan AI-bővítési folyamat, amely meghív egy Azure AI Language-erőforrást az entitások felismeréséhez, az entitások összekapcsolásához, a kulcskifejezések kinyeréséhez, a hangulatelemzéshez, a nyelvfelismeréshez és a személyes információk észleléséhez, az adatkorlátokra vonatkozik. A rekord maximális méretének 50 000 karakternek kell lennie a mért érték szerint String.Length. Ha fel kell szakítania az adatokat, mielőtt elküldené azokat a hangulatelemzőnek, használja a Szöveg felosztása képességet.

Szabályozási korlátok

Az API-kérések szabályozása a rendszer csúcskapacitásának közeledtével zajlik. A szabályozás eltérően viselkedik a különböző API-k esetében. Az API-k lekérdezése (keresés/javaslat/automatikus kiegészítés) és az API-k indexelése dinamikusan, a szolgáltatás terhelése alapján. Az index API-k és a szolgáltatásműveleti API-k statikus kérési sebességkorlátokkal rendelkeznek.

Az indexhez kapcsolódó műveletek statikus sebességkérési korlátai:

  • Listaindexek (GET/indexek): 3 másodpercenként egy keresési egységben
  • Index lekérése (GET /indexek/myindex): 10 másodpercenként egy keresési egységben
  • Index létrehozása (POST/indexek): 12 percenkénti keresési egységenként
  • Index létrehozása vagy frissítése (PUT /indexek/myindex): keresési egységenként másodpercenként 6
  • Index törlése (DELETE /indexek/myindex): 12 percenkénti keresési egység

A szolgáltatáshoz kapcsolódó műveletek statikus sebességkérési korlátai:

  • Szolgáltatásstatisztika (GET /servicestats): 4 másodpercenként egy keresési egységben

API-kérések korlátai

  • Kérelemenként legfeljebb 16 MB 1
  • Legfeljebb 8 KB URL-címhossz
  • Indexfeltöltések, -egyesítések vagy -törlések kötegenként legfeljebb 1000 dokumentum
  • Legfeljebb 32 mező $orderby záradékban
  • Legfeljebb 100 000 karakter egy keresési záradékban
  • A záradékok search maximális száma (az AND vagy OR által elválasztott kifejezésekben) 1024
  • A keresési kifejezés maximális mérete 32 766 bájt (32 KB mínusz 2 bájt) UTF-8 kódolt szövegből
  • A keresési kifejezés maximális mérete 1000 karakter az előtagok kereséséhez és a regex kereséshez
  • A helyettesítő karakterek ésa reguláris kifejezések keresése legfeljebb 1000 állapotra korlátozódik, ha Lucene feldolgozta.

1 Az Azure AI Searchben a kérések törzsére 16 MB-os felső korlát vonatkozik, amely gyakorlati korlátot szab az elméleti korlátok által egyébként nem korlátozott egyes mezők vagy gyűjtemények tartalmára (a mezőösszetételről és a korlátozásokról további információt a támogatott adattípusokban talál).

A lekérdezések méretére és összetételére vonatkozó korlátozások azért léteznek, mert a kötetlen lekérdezések destabilizálhatják a keresési szolgáltatást. Az ilyen lekérdezések általában programozott módon jönnek létre. Ha az alkalmazás programozott módon hoz létre keresési lekérdezéseket, javasoljuk, hogy úgy tervezzen meg, hogy ne hozzon létre kötetlen méretű lekérdezéseket.

API-válaszkorlátok

  • A keresési eredmények oldalanként legfeljebb 1000 dokumentumot ad vissza
  • A Javaslat API-kérésenként visszaadott javaslatok száma legfeljebb 100

API-kulcskorlátok

Az API-kulcsok a szolgáltatáshitelesítéshez használatosak. Két típusukat különböztetjük meg. Rendszergazda kulcsok a kérelem fejlécében vannak megadva, és teljes olvasási-írási hozzáférést biztosítanak a szolgáltatáshoz. A lekérdezési kulcsok írásvédettek, az URL-címen vannak megadva, és általában az ügyfélalkalmazások között vannak elosztva.

  • Szolgáltatásonként legfeljebb 2 rendszergazdai kulcs
  • Szolgáltatásonként legfeljebb 50 lekérdezési kulcs