Limity i przydziały dotyczące usługi

Artykuł
07/10/2024

Ta zawartość dotyczy: wersja 4.0 (wersja zapoznawcza) | Poprzednie wersje: v3.1 (GA) v3.0 (GA)

Ta zawartość dotyczy: wersja 2.1 | Najnowsza wersja: wersja 4.0 (wersja zapoznawcza)

Ten artykuł zawiera zarówno krótki opis, jak i szczegółowy opis przydziałów i limitów usługi Analizy dokumentów usługi Azure AI dla wszystkich warstw cenowych. Zawiera również pewne najlepsze rozwiązania, aby uniknąć ograniczania żądań.

Użycie modelu

Obsługiwane typy dokumentów	Przeczytaj	Układ	Wstępnie utworzone modele	Modele niestandardowe	Możliwości dodatków
PDF	✔️	✔️	✔️	✔️	✔️
Obrazy: `JPEG/JPG`, , `BMPPNG`, , `TIFFHEIF`	✔️	✔️	✔️	✔️	✔️
Microsoft Office: `DOCX`, , `PPTXXLS`	✔️	✔️	✖️	✖️	✖️

✔️ = obsługiwane = nieobsługiwane ✖️

Obsługiwane typy dokumentów	Przeczytaj	Układ	Wstępnie utworzone modele	Modele niestandardowe
PDF	✔️	✔️	✔️	✔️
Obrazy: `JPEG/JPG`, , `BMPPNG`, , `TIFFHEIF`	✔️	✔️	✔️	✔️
Microsoft Office: `DOCX`, , `PPTXXLS`	✔️	✖️	✖️	✖️

✔️ = obsługiwane = nieobsługiwane ✖️

Rozliczenia

Rozliczenia analizy dokumentów są obliczane co miesiąc na podstawie typu modelu i liczby analizowanych stron. Metryki użycia można znaleźć na pulpicie nawigacyjnym metryk w witrynie Azure Portal. Na pulpicie nawigacyjnym jest wyświetlana liczba stron, które przetwarza analiza dokumentów usługi Azure AI. Szacowany koszt wydatków na zasób można sprawdzić przy użyciu kalkulatora cen platformy Azure. Aby uzyskać szczegółowe instrukcje, zobacz Sprawdzanie użycia i szacowania kosztów. Oto kilka szczegółów:

Po przesłaniu dokumentu do analizy usługa analizuje wszystkie strony, chyba że określisz zakres stron przy użyciu parametru pages w żądaniu. Gdy usługa analizuje dokumenty programu Microsoft Excel i PowerPoint za pośrednictwem modelu odczytu, OCR lub układu, zlicza każdy arkusz programu Excel i slajd programu PowerPoint jako jedną stronę.
Gdy usługa analizuje pliki PDF i TIFF, zlicza każdą stronę w pliku PDF lub każdy obraz w pliku TIFF jako jedną stronę bez maksymalnych limitów znaków.
Gdy usługa analizuje pliki Microsoft Word i HTML obsługiwane przez modele odczytu i układu, zlicza strony w blokach o 3000 znaków. Jeśli na przykład dokument zawiera 7000 znaków, dwie strony z 3000 znakami każda i jedna strona z 1000 znakami sumuje się do łącznej liczby trzech stron.
Modele odczytu i układu nie obsługują analizy osadzonych ani połączonych obrazów w plikach Microsoft Word, Excel, PowerPoint i HTML. W związku z tym usługa nie zlicza ich jako dodanych obrazów.
Trenowanie modelu niestandardowego jest zawsze bezpłatne za pomocą analizy dokumentów. Opłaty są naliczane tylko wtedy, gdy usługa używa modelu do analizowania dokumentu.
Cennik kontenera jest taki sam jak cennik usługi w chmurze.
Analiza dokumentów oferuje warstwę bezpłatną (F0), w której można przetestować wszystkie funkcje analizy dokumentów.
Analiza dokumentów ma model cen oparty na zobowiązaniach dla dużych obciążeń.
Model układu jest wymagany do generowania etykiet dla zestawu danych na potrzeby trenowania niestandardowego. Jeśli zestaw danych używany na potrzeby trenowania niestandardowego nie ma dostępnych plików etykiet, usługa generuje je dla Ciebie i rozliczenie za użycie modelu układu.

Norma sprzedaży	Bezpłatna (F0)¹	Standardowa (S0)
Limit transakcji na sekundę	1	15 (wartość domyślna)
Możliwość dopasowania	Nie.	Tak ²
Maksymalny rozmiar dokumentu	4 MB	500 MB
Możliwość dopasowania	Nie	Nie.
Maksymalna liczba stron (analiza)	2	2000
Możliwość dopasowania	Nie	Nie.
Maksymalny rozmiar pliku etykiet	10 MB	10 MB
Możliwość dopasowania	Nie	Nie.
Maksymalny rozmiar odpowiedzi OCR json	500 MB	500 MB
Możliwość dopasowania	Nie	Nie.
Maksymalna liczba modeli szablonów	500	5000
Możliwość dopasowania	Nie	Nie.
Maksymalna liczba modeli neuronowych	100	500
Możliwość dopasowania	Nie	Nie.

Użycie modelu niestandardowego

Norma sprzedaży	Bezpłatna (F0) ¹	Standardowa (S0)
Limit modelu redagowania	5	200 (wartość domyślna)
Możliwość dopasowania	Nie	Nie.
*Rozmiar zestawu danych trenowania neuronowy**	1 GB ³	1 GB (wartość domyślna)
Możliwość dopasowania	Nie	Nie.
*Rozmiar zestawu danych trenowania Szablon**	50 MB ⁴	50 MB (wartość domyślna)
Możliwość dopasowania	Nie	Nie.
*Maksymalna liczba stron (trenowanie) szablon**	500	500 (wartość domyślna)
Możliwość dopasowania	Nie	Nie.
*Maksymalna liczba stron (trenowanie) neuronowe**	50,000	50 000 (wartość domyślna)
Możliwość dopasowania	Nie	Nie.
Niestandardowy trenowanie modelu neuronowego	10 miesięcznie	20 miesięcznie
Możliwość dopasowania	Nie.	Tak ³
*Maksymalna liczba stron (trenowanie) Klasyfikator**	10,000	10 000 (wartość domyślna)
Możliwość dopasowania	Nie	Nie.
*Maksymalna liczba typów dokumentów (klas) Klasyfikator**	500	500 (wartość domyślna)
Możliwość dopasowania	Nie	Nie.
*Rozmiar zestawu danych trenowania Klasyfikator**	1 GB	1 GB (wartość domyślna)
Możliwość dopasowania	Nie	Nie.
*Minimalna liczba próbek na klasę Klasyfikator**	5	5 (wartość domyślna)
Możliwość dopasowania	Nie	Nie.

Limity modelu niestandardowego

Norma sprzedaży	Bezpłatna (F0) ¹	Standardowa (S0)
Limit modelu redagowania	5	200 (wartość domyślna)
Możliwość dopasowania	Nie	Nie.
Rozmiar zestawu danych trenowania	50 MB	50 MB (wartość domyślna)
Możliwość dopasowania	Nie	Nie.
Maksymalna liczba stron (trenowanie)	500	500 (wartość domyślna)
Możliwość dopasowania	Nie	Nie.

¹ W przypadku warstwy cenowej Bezpłatna (F0) zobacz również miesięczne dodatki na stronie cennika.
² Zobacz najlepsze rozwiązania i [instrukcje korekty(#create-and-submit-support-request).
3 Liczba trenowania modeli neuronowych jest resetowany co miesiąc kalendarzowy. Otwórz wniosek o pomoc techniczną, aby zwiększyć miesięczny limit trenowania.

⁴ Ten limit dotyczy wszystkich dokumentów znajdujących się w folderze zestawu danych trenowania przed wszelkimi aktualizacjami powiązanymi z etykietami.

Szczegółowy opis, korekta limitu przydziału i najlepsze rozwiązania

Przed zażądaniem zwiększenia limitu przydziału (jeśli ma to zastosowanie), upewnij się, że jest to konieczne. Usługa analizy dokumentów używa skalowania automatycznego, aby zapewnić wymagane zasoby on-demandobliczeniowe, utrzymać niskie koszty klienta i anulować aprowizowanie nieużywanych zasobów, nie utrzymując nadmiernej ilości pojemności sprzętowej.

Jeśli aplikacja zwraca kod odpowiedzi 429 (zbyt wiele żądań), a obciążenie mieści się w zdefiniowanych limitach: najprawdopodobniej usługa jest skalowana w górę do zapotrzebowania, ale nie osiągnęła jeszcze wymaganej skali. W związku z tym usługa nie ma natychmiast wystarczającej ilości zasobów, aby obsłużyć żądanie. Ten stan jest przejściowy i nie powinien trwać długo.

Ogólne najlepsze rozwiązania dotyczące ograniczania przepustowości podczas skalowania automatycznego

Aby zminimalizować problemy związane z ograniczaniem przepustowości (kod odpowiedzi 429), zalecamy użycie następujących technik:

Implementowanie logiki ponawiania prób w aplikacji
Unikaj gwałtownych zmian w obciążeniu. Stopniowe zwiększanie obciążenia
Przykład. Aplikacja korzysta z analizy dokumentów, a bieżące obciążenie to 10 TPS (transakcje na sekundę). Kolejna sekunda zwiększa obciążenie do 40 TPS (czyli cztery razy więcej). Usługa natychmiast rozpoczyna skalowanie w górę w celu spełnienia nowego obciążenia, ale prawdopodobnie nie może wykonać go w ciągu sekundy, więc niektóre żądania otrzymają kod odpowiedzi 429.

W następnych sekcjach opisano konkretne przypadki dostosowywania limitów przydziału. Przechodzenie do analizy dokumentów: zwiększanie limitu żądań współbieżnych

Zwiększanie liczby transakcji na sekundę limitu żądań

Domyślnie liczba transakcji na sekundę jest ograniczona do 15 transakcji na sekundę dla zasobu analizy dokumentów. W przypadku warstwy cenowej Standardowa tę liczbę można zwiększyć. Przed przesłaniem żądania upewnij się, że znasz materiał w tej sekcji i zapoznasz się z tymi najlepszymi rozwiązaniami.

Zwiększenie limitu żądań współbieżnych nie ma bezpośredniego wpływu na koszty. Usługa Analizy dokumentów używa modelu "Płatność tylko za to, czego używasz". Limit określa, jak wysoko usługa może skalować przed rozpoczęciem ograniczania żądań.

Istniejąca wartość parametru limitu żądań współbieżnych nie jest widoczna za pośrednictwem witryny Azure Portal, narzędzi wiersza polecenia ani żądań interfejsu API. Aby sprawdzić aktualną wartość, utwórz wniosek o pomoc techniczną platformy Azure.

Jeśli chcesz zwiększyć liczbę transakcji na sekundę, możesz włączyć automatyczne skalowanie zasobu. Postępuj zgodnie z tym dokumentem, aby włączyć automatyczne skalowanie zasobu * włączanie automatycznego skalowania. Możesz również przesłać wniosek o pomoc techniczną modułu TPS.

Przygotuj wymagane informacje

Identyfikator zasobu analizy dokumentów
Region (Region)
Podstawowe informacje o modelu:
- Zaloguj się do witryny Azure Portal.
- Wybierz zasób analizy dokumentów, dla którego chcesz zwiększyć limit transakcji
- Wybierz pozycję -Properties- (-Resource Management- group)
- Skopiuj i zapisz wartości następujących pól:
  - Identyfikator zasobu
  - Lokalizacja (region punktu końcowego)

Tworzenie i przesyłanie wniosku o pomoc techniczną

Zainicjuj zwiększenie limitu transakcji na sekundę (TPS) dla zasobu, przesyłając wniosek o pomoc techniczną:

Upewnij się, że masz wymagane informacje
Zaloguj się do witryny Azure Portal.
Wybierz zasób analizy dokumentów, dla którego chcesz zwiększyć limit TPS
Wybierz pozycję -New support request- (-Support + troubleshooting- group) (Nowa prośba o pomoc techniczną — grupa rozwiązywania problemów). Zostanie wyświetlone nowe okno z automatycznie wypełnionymi informacjami o subskrypcji platformy Azure i zasobie platformy Azure
Wprowadź -Summary - (na przykład "Zwiększ limit tpS analizy dokumentów")
W polu Typ problemu wybierz pozycję "Weryfikacja przydziału lub użycia".
Wybierz pozycję -Next: Solutions- (Dalej: rozwiązania)
Kontynuuj tworzenie żądania
Wprowadź następujące informacje w polu -Description- na karcie Szczegóły:
- zwróć uwagę, że żądanie dotyczy limitu przydziału analizy dokumentów.
- Podaj oczekiwania tpS, które chcesz skalować, aby spełnić.
- Zebrane informacje o zasobach platformy Azure.
- Wypełnij wprowadzanie wymaganych informacji i wybierz przycisk -Create- (Utwórz) na karcie -Review + create- (Przeglądanie i tworzenie)
- Zanotuj numer wniosku o pomoc techniczną w powiadomieniach z witryny Azure Portal. Poszukaj pomocy technicznej, aby wkrótce skontaktować się z Tobą w celu dalszego przetwarzania.

Przykład najlepszych rozwiązań dotyczących wzorca obciążenia

W tym przykładzie przedstawiono podejście, które zalecamy, aby zminimalizować możliwe ograniczanie żądań z powodu trwającego skalowania automatycznego. Nie jest to dokładny przepis, ale tylko szablon, który zachęcamy do naśladowania i dostosowywania w razie potrzeby.

Załóżmy, że zasób analizy dokumentów ma ustawiony domyślny limit. Uruchom obciążenie, aby przesłać żądania analizy. Jeśli okaże się, że występuje częste ograniczanie przepustowości z kodem odpowiedzi 429, zacznij od zaimplementowania wykładniczego wycofywania w żądaniu analizy GET. Używając stopniowo dłuższego czasu oczekiwania między kolejnymi próbami odpowiedzi na błędy, na przykład wzorzec 2-5-13-34 opóźnień między żądaniami. Ogólnie rzecz biorąc, zalecamy, aby nie wywoływać odpowiedzi get analyze więcej niż raz co 2 sekundy dla odpowiedniego żądania POST.

Jeśli okaże się, że ograniczasz liczbę przesłanych żądań POST dla przesłanych dokumentów, rozważ dodanie opóźnienia między żądaniami. Jeśli obciążenie wymaga wyższego stopnia przetwarzania współbieżnego, należy utworzyć wniosek o pomoc techniczną, aby zwiększyć limity usług dla transakcji na sekundę.

Ogólnie rzecz biorąc, zalecamy przetestowanie obciążenia i wzorców obciążenia przed przejściem do środowiska produkcyjnego.

Następne kroki

Dowiedz się więcej o kodach błędów i rozwiązywaniu problemów

Udostępnij za pośrednictwem