Megosztás a következőn keresztül:


Az AI-szolgáltatások automatikus méretezési korlátai

Ez a cikk útmutatást nyújt ahhoz, hogy az ügyfelek hogyan férhetnek hozzá az Azure AI-szolgáltatási erőforrásaik magasabb díjkorlátjaihoz.

Áttekintés

Minden Azure AI-szolgáltatási erőforrás rendelkezik egy előre konfigurált statikus hívási sebességgel (másodpercenkénti tranzakciókkal), amely korlátozza az ügyfelek által a háttérszolgáltatásba egy adott időkeretben indítható egyidejű hívások számát. Az automatikus skálázási funkció automatikusan növeli/csökkenti az ügyfél erőforrásának sebességkorlátjait a közel valós idejű erőforrás-használati metrikák és a háttérszolgáltatás kapacitásmetrikái alapján.

Az automatikus skálázási funkció használatának első lépései

Ez a funkció alapértelmezés szerint le van tiltva minden új erőforrás esetében. Az engedélyezéshez kövesse az alábbi utasításokat.

Lépjen az erőforrás lapjára az Azure Portalon, és válassza a bal oldali panel Áttekintés lapját. Az Alapvető beállítások szakaszban keresse meg az Automatikus skálázás sort, és válassza a hivatkozást az Automatikus méretezés beállításai panel megtekintéséhez és a funkció engedélyezéséhez.

Képernyőkép az Azure Portalról az automatikus skálázási panel jobb oldalán.

Gyakori kérdések

Az automatikus skálázási funkció engedélyezése azt jelenti, hogy az erőforrásom soha többé nem lesz szabályozva?

Nem, előfordulhat, hogy továbbra is hibaüzenet jelenik meg 429 a sebességkorlát túllépéséért. Ha az alkalmazás kiugró értéket aktivál, és az erőforrás válaszról 429 számol be, az automatikus skálázás ellenőrzi a rendelkezésre álló kapacitásvetítési szakaszt, hogy az aktuális kapacitás képes-e befogadni a sebességkorlát-növekedést, és öt percen belül válaszol.

Ha a rendelkezésre álló kapacitás elegendő a növekedéshez, az automatikus skálázás fokozatosan növeli az erőforrás sebességkorlát-korlátját. Ha továbbra is magas sebességgel hívja meg az erőforrást, amely nagyobb 429 szabályozást eredményez, a TPS-ráta idővel tovább nő. Ha a művelet egy vagy több órán át folytatódik, akkor el kell érnie az adott erőforráshoz jelenleg elérhető maximális sebességet (legfeljebb 1000 TPS).

Ha a rendelkezésre álló kapacitás nem elegendő a növekedéshez, az automatikus skálázási funkció öt percet vár, és újra ellenőrzi.

Mi a teendő, ha magasabb alapértelmezett sebességkorlátra van szükségem?

Alapértelmezés szerint az Azure AI-szolgáltatások erőforrásainak alapértelmezett sebességkorlátja 10 TPS. Ha magasabb alapértelmezett TPS-re van szüksége, küldjön egy jegyet az erőforrás oldalán található Új támogatási kérelem hivatkozásra kattintva az Azure Portalon. Ne felejtsen el üzleti indoklást mellékelni a kérelembe.

Növeli ez a funkció az Azure-ra fordított kiadást?

Az Azure AI-szolgáltatások díjszabása nem változott, és itt érhető el. Csak az Azure AI-szolgáltatások API-kkal indított sikeres hívásokért számlázunk. A megnövekedett hívási sebességkorlátok azonban további tranzakciókat jelentenek, és magasabb számlát kaphat.

Ügyeljen a lehetséges hibákra és azok következményeire. Ha az ügyfélalkalmazás hibája miatt másodpercenként több százszor hívja meg a szolgáltatást, az valószínűleg sokkal magasabb számlát eredményezne, míg a költség sokkal korlátozottabb lenne egy rögzített díjkorlát alatt. Az ilyen jellegű hibák az Ön felelőssége. Javasoljuk, hogy az automatikus skálázási funkció használata előtt végezzen fejlesztési és ügyfélfrissítési teszteket egy rögzített sebességkorláttal rendelkező erőforráson.

Letilthatom ezt a funkciót, ha inkább korlátoznám az arányt, mint a kiszámíthatatlan kiadásokat?

Igen, letilthatja az automatikus skálázási funkciót az Azure Portalon vagy a parancssori felületen, és visszatérhet az alapértelmezett hívássebesség-korláthoz. Ha az erőforrást korábban jóváhagyták egy magasabb alapértelmezett TPS-hez, az visszamegy erre az arányra. A módosítások érvénybe lépése akár öt percet is igénybe vehet.

Mely szolgáltatások támogatják az automatikus skálázási funkciót?

Az automatikus skálázási funkció a következő szolgáltatásokhoz érhető el:

Tesztelhetem ezt a funkciót ingyenes előfizetéssel?

Nem, az automatikus skálázási funkció nem érhető el az ingyenes szintű előfizetésekhez.

Következő lépések