Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Uwaga / Notatka
Ten artykuł dotyczy portalu Microsoft Foundry (klasycznego).
🔄 Przejdź do dokumentacji Microsoft Foundry (nowej), jeśli korzystasz z nowego portalu.
Uwaga / Notatka
Ten artykuł dotyczy portalu Microsoft Foundry (nowy).
Skorzystaj z tego artykułu, aby dowiedzieć się więcej o kosztach związanych z aprowizowaną jednostką przepływności (PTU). Aby zapoznać się z omówieniem oferty aprowizowanej przepływności, zobacz Co to jest aprowizowana przepływność?. Gdy wszystko będzie gotowe do zarejestrowania się w ramach oferty aprowizowanej przepływności, zobacz przewodnik wprowadzenie.
Uwaga / Notatka
W przypadku wywoływania funkcji i użycia agenta użycie tokenu może być zmienne. Zanim zdecydujesz się na migrację obciążeń do PTU, powinieneś dokładnie zrozumieć oczekiwane zużycie tokenów na minutę (TPM).
Przydzielone jednostki przepustowości
Jednostki przepustowości (PTU) to uniwersalne jednostki wydajności przetwarzania modelu, które można wykorzystać do dopasowania przepustowości wdrożeń, aby uzyskać wymaganą wydajność w przetwarzaniu zapytań i generowaniu wyników. Jednostki przepustowości są przyznawane subskrypcji jako limit. Każdy przydział jest specyficzny dla regionu i definiuje maksymalną liczbę jednostek PTU, które można przypisać do wdrożeń w tej subskrypcji i regionie.
Rozliczanie według zagwarantowanej przepustowości
Przepływność aprowizowana regionalna firmy Microsoft Foundry, aprowizowana przepływność strefy danych i globalna aprowizowana przepływność są rozliczane godzinowo na podstawie liczby wdrożonych jednostek PTU, a znaczne rabaty terminowe są dostępne za pośrednictwem zakupu rezerwacji platformy Azure.
Model rozliczeń godzinowych jest przydatny w przypadku krótkoterminowych potrzeb związanych z wdrażaniem, takich jak weryfikowanie nowych modeli lub uzyskiwanie zasobów na hackathon. Jednak znaczące rabaty udzielane w ramach rezerwacji platformy Azure dla opcji Foundry Regional Provisioning, Data Zone Provisioning i Global Provisioning sprawiają, że większość klientów korzystających ze stałych długoterminowych zasobów uzna model rezerwacji za lepszą propozycję wartości.
Rezerwacje platformy Azure to konstrukcja rabatu finansowego stosowana do mierników rozliczeniowych, a nie interakcji z usługą (na przykład wdrożenia). Rezerwacje i wdrożenia są luźno powiązane, aby zapewnić elastyczność. Wdrożenia i rezerwacje można tworzyć lub usuwać niezależnie. Takie podejście umożliwia zmianę zasobów, subskrypcji lub wdrożeń bez zmiany konstrukcji rozliczeń.
Zalecana kolejność operacji, aby uniknąć niechcianych opłat:
- Użyj narzędzia Foundry, aby wdrożyć model w regionie z dostępnym limitem przydziału. Ten krok potwierdza, że pojemność istnieje, ponieważ limit przydziału nie jest równy pojemności.
- Po wdrożeniu udostępnij szczegóły wdrożenia, w tym typ wdrożenia (aprowizacja globalna, aprowizacja strefy danych lub aprowizacja regionalna), region i subskrypcję swojemu administratorowi.
- Administrator używa tych szczegółów, aby kupić nową rezerwację zgodną ze szczegółami wdrożenia lub sprawdzić, czy istniejąca rezerwacja jest zgodna, aby otrzymać obniżoną stawkę.
Uwaga / Notatka
Firma Foundry aprowizowała klientów wdrożonych przed sierpniową aktualizacją samoobsługową, używała modelu zakupu o nazwie model zobowiązania. Ci klienci mogą nadal używać tego starszego modelu zakupu równocześnie z modelem zakupu na podstawie godzin lub rezerwacji. Model zobowiązania nie jest dostępny dla nowych klientów lub niektórych nowych modeli wprowadzonych po sierpniu 2024 r. Aby uzyskać szczegółowe informacje na temat modelu zakupu zobowiązania i opcji współistnienia i migracji, zobacz aktualizację rozwiązania Foundry Provisioned August.
Niezależny od modelu limit przydziału
W przeciwieństwie do kwoty tokenów na minutę (TPM) używanych przez inne oferty Foundry, jednostki PTU są niezależne od modelu. Jednostki PTU mogą służyć do wdrażania wszystkich obsługiwanych modeli hostowanych i sprzedawanych bezpośrednio przez firmę Microsoft w regionie.
Limit dla aprowizowanych wdrożeń jest wyświetlany w Foundry jako następujące typy wdrożeń: aprowizowane globalnie, aprowizowane w strefie danych oraz aprowizowane regionalnie.
Uwaga / Notatka
Limit przydziału nie gwarantuje pojemności. Wdróż model w Foundry przed zakupem zgodnej rezerwacji w Azure Portal.
| typ wdrożenia | Nazwa limitu przydziału |
|---|---|
| Regionalne Ustawienia | Regionalna aprowizowana jednostka przepustowości |
| Globalna konfiguracja | Globalna zagwarantowana jednostka przepustowości |
| Przydzielona strefa danych | Jednostka aprowizowanej przepustowości strefy danych |
Szczegółowe informacje o limitach przydziału dla wdrożeń aprowizowanych można znaleźć na stronie portalu Foundrycentrum zarządzania>Limit przydziału.
Szczegóły dotyczące limitów przydziału dla wdrożeń aprowizowanych można znaleźć w sekcji Operacje w portalu Microsoft Foundry, w okienku >.
Użycie godzinowe
Regionalne wdrożenia aprowizowane, wdrożenia aprowizowane dla stref danych oraz wdrożenia globalne aprowizowane są obciążane opłatami na podstawie stawki godzinowej (dolarów amerykańskich za godzinę na PTU) w zależności od liczby wdrożonych jednostek PTU. Na przykład, za wdrożenie 300 PTU zostanie naliczona opłata godzinowa pomnożona przez 300. Wszystkie ceny modelu rozwiązania Foundry są dostępne w kalkulatorze cen platformy Azure.
Jeśli wdrożenie istnieje przez część godziny, zostanie naliczona proporcjonalna opłata na podstawie liczby minut, przez które wdrożenie trwało w ciągu godziny. Na przykład wdrożenie, które trwa 15 minut w ciągu godziny, zostanie obciążone 1/4 opłaty godzinowej.
Jeśli rozmiar wdrożenia zostanie zmieniony, koszty wdrożenia zostaną dostosowane do nowej liczby jednostek PTU.
Płacenie za wdrożenia zaprogramowane regionalnie, w strefie danych i globalnie na zasadzie godzinowej jest idealne w przypadku krótkoterminowych scenariuszy wdrażania. Na przykład: Testowanie porównawcze jakości i wydajności nowych modeli lub tymczasowe zwiększenie wydajności PTU w celu obsługi wydarzenia, takiego jak hackathon.
Klienci, którzy potrzebują długoterminowego korzystania z usług w zakresie aprowizacji regionalnej, aprowizacji stref danych oraz globalnych wdrożeń, mogą płacić znacznie mniej miesięcznie, kupując zniżkę terminową poprzez Rezerwacje platformy Azure, jak omówiono później w artykule.
Ważne
Nie zaleca się skalowania wdrożeń produkcyjnych zgodnie z ruchem przychodzącym i płacenia za nie wyłącznie co godzinę. Istnieją dwa powody tego:
- Oszczędności kosztów uzyskane przez zakup rezerwacji platformy Azure na zarezerwowaną przepustowość Foundry, zarezerwowaną strefę danych i globalne zasoby zarezerwowane są znaczące. W wielu przypadkach tańsze jest utrzymanie wdrożenia dostosowanego do pełnego wolumenu produkcyjnego i opłaconego poprzez rezerwację, niż zwiększanie wdrożenia w odpowiedzi na ruch przychodzący.
- Nieużywany zarezerwowany limit (PTU) nie gwarantuje, że pojemność będzie dostępna do obsługi zwiększenia rozmiaru wdrożenia, jeśli zajdzie potrzeba. Kwota ogranicza maksymalną liczbę jednostek PTU, które można wdrożyć, ale nie jest gwarancją pojemności. Aprowizowana pojemność dla każdego regionu i modelu dynamicznie zmienia się w ciągu dnia i może być niedostępna w razie potrzeby. W związku z tym zaleca się utrzymanie stałego wdrożenia w celu pokrycia potrzeb związanych z ruchem (opłacanych poprzez rezerwację).
Usuń wdrożenia PTU
Ważne
Opłaty za wdrożenia w usuniętym zasobie będą kontynuowane do momentu przeczyszczania zasobu. Aby uniknąć niepotrzebnych opłat, usuń wdrożenie zasobu przed jego usunięciem. Jeśli jednak zasób został już usunięty, możesz go odzyskać lub przeczyścić. Aby uzyskać więcej informacji, zobacz Odzyskiwanie lub przeczyszczanie usuniętych zasobów usługi Azure OpenAI.
Usunięcie wdrożenia nie powoduje anulowania ani zmiany żadnej rezerwacji PTU. Rezerwacje nie obsługują usuwania. Możesz użyć witryny Azure Portal do ręcznego anulowania lub wymiany rezerwacji, a te opcje mogą spowodować naliczanie dodatkowych opłat.
Aby uniknąć niepożądanych opłat, wykonaj następujące kroki, aby usunąć aprowizowane wdrożenie.
- Usuń wdrożenie w portalu Foundry.
- Jeśli planujesz usunąć zasób usługi Azure AI, najpierw usuń wdrożenia, a następnie usuń zasób. Przeczyść zasób, aby zatrzymać opłaty.
- Przejdź do strony Rezerwacje w witrynie Azure Portal, aby zarządzać rezerwacjami. W witrynie Azure Portal możesz zakupić, anulować lub wymienić rezerwacje, aby dopasować je do bieżących wdrożeń.
- Usuń wdrożenie w portalu Microsoft Foundry .
- Jeśli planujesz usunąć zasób usługi Azure AI, najpierw usuń wdrożenia, a następnie usuń zasób. Przeczyść zasób, aby zatrzymać opłaty.
- Przejdź do strony Rezerwacje w witrynie Azure Portal, aby zarządzać rezerwacjami. W witrynie Azure Portal możesz zakupić, anulować lub wymienić rezerwacje, aby dopasować je do bieżących wdrożeń.
Ile przepływności na jednostkę PTU otrzymujesz dla każdego modelu
Ilość przepływności (mierzona w tokenach na minutę lub TPM), która przypada na wdrożenie na każdy PTU, jest funkcją tokenów wejściowych i wyjściowych w danej minucie. Generowanie tokenów wyjściowych wymaga więcej przetwarzania niż tokeny wejściowe. Począwszy od modeli GPT 4.1 i nowszych, system zazwyczaj pasuje do globalnego standardowego współczynnika cen między tokenami wejściowymi i wyjściowymi, z wyjątkami dla niektórych modeli. W przypadku wszystkich wdrożeń buforowane tokeny są odejmowane w 100% od wykorzystania.
Na przykład w przypadku gpt-5 jeden token wyjściowy liczy się jako osiem tokenów wejściowych do osiągnięcia limitu wykorzystania, który jest zgodny z ceną. W przypadku innych modeli, takich jak gpt-4.1, jeden token wyjściowy liczy się jako cztery tokeny wejściowe. Starsze modele używają innego współczynnika.
Aby lepiej zrozumieć, jak różne proporcje tokenów wejściowych i wyjściowych wpływają na przepustowość potrzeb obciążenia, zobacz kalkulator przydziału jednostek PTU rozwiązania Foundry.
Wyjątki od współczynnika przepływności danych wejściowych i wyjściowych
System umożliwia wyjątki od standardowego współczynnika tokenów wejściowych do danych wyjściowych dla niektórych modeli. Na przykład w przypadku llama-3.3-70B-Instruct jeden token wyjściowy liczy się jako cztery tokeny wejściowe w kierunku limitu wykorzystania. Ten współczynnik różni się od globalnego standardowego współczynnika cen między tokenami wejściowymi i wyjściowymi. Aby wyświetlić cennik danych wejściowych i wyjściowych dla modelu, zobacz cennik modeli Llama.
Najnowsze modele usługi Azure OpenAI
Uwaga / Notatka
gpt-4.1, gpt-4.1-mini i gpt-4.1-nano nie obsługują długiego kontekstu (żądania szacowane na większe niż 128 tys. tokenów monitów).
| Temat | gpt-5.2 | gpt-5.2-codex | gpt-5.1 | gpt-5.1-codex | gpt-5 | gpt-5-mini | gpt-4.1 | gpt-4.1-mini | gpt-4.1-nano | o3 | o4-mini |
|---|---|---|---|---|---|---|---|---|---|---|---|
| Minimalne wdrożenie w aprowizowanej strefie globalnej i strefie danych | 15 | 15 | 15 | 15 | 15 | 15 | 15 | 15 | 15 | 15 | 15 |
| Inkrementacja skali aprowizacji globalnej i strefy danych | 5 | 5 | 5 | 5 | 5 | 5 | 5 | 5 | 5 | 5 | 5 |
| Minimalne wdrożenie z przydziałem regionalnym | 50 | 50 | 50 | 50 | 50 | 25 | 50 | 25 | 25 | 50 | 25 |
| Regionalne zapewnione zwiększenie skali | 50 | 50 | 50 | 50 | 50 | 25 | 50 | 25 | 25 | 50 | 25 |
| Wejściowy moduł TPM na jednostkę PTU | 3,400 | 3,400 | 4,750 | 4,750 | 4,750 | 23 750 | 3000 | 14,900 | 59 400 | 3000 | 5,400 |
| Wartość docelowa opóźnienia | 99% > 50 tokenów na sekundę* | 99% > 50 tokenów na sekundę* | 99% > 50 tokenów na sekundę* | 99% > 50 tokenów na sekundę* | 99% > 50 tokenów na sekundę* | 99% > 80 tokenów na sekundę* | 99% > 80 tokenów na sekundę* | 99% > 90 tokenów na sekundę* | 99% > 100 tokenów na sekundę* | 99% > 80 tokenów na sekundę* | 99% > 90 tokenów na sekundę* |
* Obliczone jako latencja żądania p50 co 5 minut.
Poprzednie modele usługi Azure OpenAI
| Temat | gpt-4o | gpt-4o-mini | o3-mini | o1 |
|---|---|---|---|---|
| Minimalne wdrożenie w aprowizowanej strefie globalnej i strefie danych | 15 | 15 | 15 | 15 |
| Inkrementacja skali aprowizacji globalnej i strefy danych | 5 | 5 | 5 | 5 |
| Minimalne wdrożenie z przydziałem regionalnym | 50 | 25 | 25 | 25 |
| Regionalne zapewnione zwiększenie skali | 50 | 25 | 25 | 50 |
| Wejściowy moduł TPM na jednostkę PTU | 2500 | 37,000 | 2500 | 230 |
| Wartość docelowa opóźnienia | 99% > 25 tokenów na sekundę* | 99% > 33 tokeny na sekundę* | 99% > 66 tokenów na sekundę* | 99% > 25 tokenów na sekundę* |
* Obliczone jako średnie opóźnienie żądań na minutę w ciągu miesiąca.
Bezpośrednie z modeli platformy Azure
| Temat | Llama-3.3-70B-Instruct | DeepSeek-R1 | DeepSeek-V3-0324 | DeepSeek-R1-0528 |
|---|---|---|---|---|
| Minimalne wdrożenie w aprowizowanej strefie globalnej i strefie danych | 100 | 100 | 100 | 100 |
| Inkrementacja skali aprowizacji globalnej i strefy danych | 100 | 100 | 100 | 100 |
| Minimalne wdrożenie z przydziałem regionalnym | NIE | NIE | NIE | NIE |
| Regionalne zapewnione zwiększenie skali | NIE | NIE | NIE | NIE |
| Wejściowy moduł TPM na jednostkę PTU | 84501 | 4000 | 4000 | 4000 |
| Wartość docelowa opóźnienia | 99% > 50 tokenów na sekundę* | 99% > 50 tokenów na sekundę* | 99% > 50 tokenów na sekundę* | 99% > 50 tokenów na sekundę* |
* Obliczone jako średnie opóźnienie żądań na minutę w ciągu miesiąca.
1 W przypadku Llama-3.3-70B-Instruct jeden token wyjściowy liczy się jako cztery tokeny wejściowe w kierunku limitu wykorzystania. Ten współczynnik różni się od globalnego standardowego współczynnika cen między tokenami wejściowymi i wyjściowymi. Aby uzyskać więcej informacji, zobacz Wyjątki dotyczące współczynnika przepływności wejściowej i wyjściowej.
Aby uzyskać pełną listę, zobacz kalkulator odlewni.
Określanie zapotrzebowania na jednostki PTU dla obciążenia
Określenie odpowiedniej liczby aprowizowanych jednostek przepływności (PTU) dla obciążenia jest istotnym krokiem w zakresie optymalizacji wydajności i kosztów.
Jednostki PTU reprezentują pojemność przetwarzania modelu. Podobnie jak w przypadku komputerów lub baz danych, różne obciążenia lub żądania do modelu będą zużywać różne ilości bazowej pojemności przetwarzania. Konwersja wymagań dotyczących przepływności do jednostek PTU może być oszacowana przy użyciu historycznych danych o użyciu tokenów lub na podstawie szacowania kształtu wywołań (tokeny wejściowe, tokeny wyjściowe i liczba żądań na minutę), jak opisano w dokumentacji wydajności i opóźnień.
Aby uprościć ten proces, możesz użyć Foundry calculator do określenia rozmiaru konkretnych kształtów obciążenia.
Kilka zagadnień wysokiego poziomu:
- Generacje mają większe wymogi pojemności niż polecenia
- W przypadku modeli GPT-4o i nowszych moduł TPM na jednostkę PTU jest ustawiany oddzielnie dla tokenów wejściowych i wyjściowych. W przypadku starszych modeli większe wywołania są stopniowo kosztowniejsze w obliczeniach. Na przykład, 100 wywołań z zestawem wstępnym o rozmiarze 1000 tokenów wymaga mniej pojemności niż jedno wywołanie z zestawem wstępnym zawierającym 100 000 tokenów. Warstwowanie określa znaczenie rozkładu tych kształtów wywołań w ogólnej przepływności. Wzorce ruchu z szeroką dystrybucją, która obejmuje niektóre duże wywołania, mogą mieć niższą przepustowość na jednostkę PTU niż węższa dystrybucja z tą samą średnią wielkością żądań i tokenów końcowych.
Uzyskiwanie limitu PTU
Klienci muszą złożyć wniosek o przydział za pośrednictwem linku do zgłoszenia przydziału.
Jeśli wymagane są więcej przydziałów, musisz również zażądać limitu przydziału za pośrednictwem linku w centrum przydziałów w centrum zarządzania rozwiązania Foundry. Formularz umożliwia klientowi zażądanie zwiększenia określonego limitu przydziału jednostek PTU dla danego regionu. Klient otrzymuje wiadomość e-mail na dołączonym adresie po zatwierdzeniu żądania, zazwyczaj w ciągu dwóch dni roboczych.
Jeśli wymaganych jest więcej przydziałów, musisz również zażądać przydziału za pośrednictwem linku w sekcji Microsoft FoundryOperacje w okienku >Przydział. Formularz umożliwia klientowi zażądanie zwiększenia określonego limitu przydziału jednostek PTU dla danego regionu. Klient otrzymuje wiadomość e-mail na dołączonym adresie po zatwierdzeniu żądania, zazwyczaj w ciągu dwóch dni roboczych.
Per-Model minimalne jednostki PTU
Minimalne rozmieszczenie jednostek PTU, przyrosty i pojemność przetwarzania związana z każdą jednostką różnią się w zależności od typu i wersji modelu. Więcej informacji można znaleźć w powyższej tabeli .
Szacowanie aprowizowanych jednostek przepływności i kosztów
Aby uzyskać szybkie oszacowanie obciążenia przy użyciu danych wejściowych i wyjściowych TPM, skorzystaj z wbudowanego planisty pojemności w sekcji szczegółów wdrożenia na ekranie dialogowym wdrożenia. Wbudowane narzędzie do planowania pojemności jest częścią procesu wdrożeniowego, który pomaga usprawnić rozmiarowanie i przydzielanie zasobów do wdrożenia PTU dla określonego obciążenia roboczego. Aby uzyskać więcej informacji na temat identyfikowania i szacowania danych modułu TPM, zapoznaj się z zaleceniami w dokumentacji dotyczącej wydajności i opóźnień.
Aby użyć planisty pojemności, przejdź do portalu Foundry i wybierz przycisk Wdrożenia . Następnie wybierz pozycję Wdróż model.
Wybierz model, a następnie kliknij przycisk Potwierdź. Wybierz typ wdrożenia przepustowości prowizyjnej. Po wypełnieniu danych wejściowych i wyjściowych modułu TPM we wbudowanym kalkulatorze pojemności wybierz przycisk Oblicz , aby wyświetlić zalecenie dotyczące alokacji jednostek PTU.
Aby oszacować aprowizowaną pojemność przy użyciu danych na poziomie żądania, otwórz planistę pojemności w portalu Foundry. Kalkulator pojemności znajduje się w Centrum Zarządzania>Kwoty>Aprowizowana Przepływność.
Opcja Aprowizowana przepływność i kalkulator są dostępne tylko w niektórych regionach w okienku Limit przydziału, jeśli ta opcja nie jest widoczna, ustawienie regionu przydziału na Szwecja Środkowa spowoduje udostępnienie tej opcji. Wprowadź następujące parametry na podstawie obciążenia.
| Dane wejściowe | Opis |
|---|---|
| Model | model, którego planujesz użyć. Na przykład: GPT-4 |
| wersja | Wersja modelu, którego planujesz użyć, na przykład 0614 |
| Szczytowa liczba wywołań na minutę | Liczba wywołań na minutę, które mają być wysyłane do modelu |
| Tokeny w zapytaniu wywołania | Liczba tokenów w wierszu polecenia dla każdego wywołania modelu. Wywołania z większymi promptami wykorzystują więcej zasobów wdrożenia PTU. Obecnie ten kalkulator zakłada pojedynczą wartość monitu dla obciążeń o dużej rozbieżności. Zalecamy przeprowadzenie benchmarkingu na Twoim ruchu, aby precyzyjnie oszacować ilość jednostek PTU potrzebnych do wdrożenia. |
| Tokeny w odpowiedzi modelu | Liczba tokenów wygenerowanych na podstawie każdego wywołania modelu. Wywołania o większych wielkościach generacji bardziej obciążają wdrożenie PTU. Obecnie ten kalkulator zakłada pojedynczą wartość monitu dla obciążeń o dużej rozbieżności. Zalecamy przeprowadzenie benchmarkingu na Twoim ruchu, aby precyzyjnie oszacować ilość jednostek PTU potrzebnych do wdrożenia. |
Po wprowadzeniu wymaganych szczegółów wybierz przycisk Oblicz w kolumnie wyjściowej.
Wartości w kolumnie wyjściowej to szacowana wartość jednostek PTU wymaganych dla podanych danych wejściowych obciążenia. Pierwsza wartość wyjściowa reprezentuje szacowane jednostki PTU wymagane dla obciążenia zaokrąglone do najbliższego przyrostu skali PTU. Druga wartość wyjściowa reprezentuje nieprzetworzone szacowane jednostki PTU wymagane dla obciążenia. Sumy tokenów są obliczane przy użyciu następującego równania: Total = Peak calls per minute * (Tokens in prompt call + Tokens in model response).
Uwaga / Notatka
Kalkulatory pojemności zapewniają oszacowanie na podstawie prostych kryteriów wejściowych. Najdokładniejszym sposobem określenia pojemności jest przeprowadzenie testowania porównawczego wdrożenia z obciążeniem odpowiednim dla Twojego przypadku użycia.
Rezerwacje platformy Azure dla zapewnianej przepustowości usługi Foundry
Rabaty dodatkowe do ceny użycia godzinowego można uzyskać, kupując Azure Reservation dla zarezerwowanych zasobów Foundry Regional Provisioned, Data Zone Provisioned i Global Provisioned. Rezerwacja platformy Azure to mechanizm rabatu na terminy współużytkowany przez wiele produktów platformy Azure. Na przykład Compute i usługa Cosmos DB. W przypadku zaprovisionowanych regionalnie usług Foundry, zaprovisionowanej strefy danych i zaprovisionowania globalnego, rezerwacja zapewnia rabat w zamian za zobowiązanie się do płatności za ustaloną liczbę jednostek PTU w okresie jednego miesiąca lub jednego roku.
Rezerwacje platformy Azure są kupowane za pośrednictwem strony Rezerwacje w witrynie Azure Portal.
Rezerwacje są kupowane na poziomie regionalnym i mogą być elastycznie dostosowane, aby obejmowały użycie z grupy wdrożeń. Zakresy rezerwacji obejmują:
Poszczególne grupy zasobów lub subskrypcje
Grupa subskrypcji w Grupie Zarządzania
Wszystkie subskrypcje na koncie rozliczeniowym
Rabat ma zastosowanie, gdy typ wdrożenia (regionalna/strefa danych/globalny), region i zakres rezerwacji (subskrypcja lub grupa zasobów) są zgodne z uruchomionym wdrożeniem. Dopasowywanie nie jest według modelu lub identyfikatora wdrożenia. Wiele wdrożeń w ramach zakresu może korzystać z tej samej rezerwacji do ilości jednostek PTU.
Nowe rezerwacje można kupić, aby obejmowały ten sam zakres co istniejące rezerwacje, co pozwoli na rabatowanie nowych wdrożeń. Zakres istniejących rezerwacji można również zaktualizować w dowolnym momencie bez kary, na przykład w celu pokrycia nowej subskrypcji.
Rezerwacje na wdrożenia globalne, strefy danych i wdrożenia regionalne nie są zamienne. Musisz kupić oddzielną rezerwację dla każdego typu wdrożenia.
Rezerwacje można anulować po zakupie, ale środki są ograniczone.
Jeśli rozmiar aprowizowanych wdrożeń w zakresie rezerwacji przekracza kwotę rezerwacji, nadwyżka jest naliczana według stawki godzinowej. Jeśli na przykład wdrożenia o wartości 250 jednostek PTU istnieją w zakresie rezerwacji 200 PTU, opłaty za 50 jednostek PTU będą naliczane co godzinę, dopóki rozmiary wdrożenia nie zostaną zmniejszone do 200 jednostek PTU lub zostanie utworzona nowa rezerwacja, aby pokryć pozostałe 50.
Rezerwacje gwarantują obniżoną cenę dla wybranego terminu. Nie rezerwują pojemności w usłudze ani nie gwarantują, że będzie ona dostępna, gdy zostanie utworzone wdrożenie. Zdecydowanie zaleca się, aby klienci tworzyli wdrożenia przed zakupem rezerwacji w celu ochrony przed nadmiernym zakupem rezerwacji.
Ważne
Dostępność pojemności dla wdrożeń modelu jest dynamiczna i często zmienia się w różnych regionach i modelach. Aby chronić się przed zakupem rezerwacji dla większej liczby jednostek PTU niż można użyć, najpierw utwórz wdrożenia, a następnie kup rezerwację platformy Azure, aby pokryć wdrożone jednostki PTU. To najlepsze rozwiązanie gwarantuje, że możesz w pełni skorzystać z rabatu na rezerwację i chroni Cię przed zatwierdzeniem rezerwacji, której nie można użyć.
Wymagania dotyczące roli i polityki dzierżawy platformy Azure do zakupu rezerwacji różnią się od wymagań potrzebnych do utworzenia zasobu wdrożeniowego lub zasobu Foundry. Zweryfikuj autoryzację do zakupu rezerwacji przed pojawieniem się potrzeby ich dokonania. Aby uzyskać więcej informacji, zobacz Rezerwacja aprowizowanej przepływności usługi Foundry .
Określenie wielkości zarezerwowanej przepływności dla usługi Foundry
Kwoty jednostek PTU w zakupach rezerwacji są niezależne od jednostek PTU przydzielonych w ramach limitu lub używanych we wdrożeniach. Można kupić rezerwację dla większej liczby jednostek PTU niż w ramach limitu przydziału lub wdrożyć dla żądanego regionu, modelu lub wersji. Należności za przekroczenie zakupionej wielkości rezerwacji są ograniczone, a klienci muszą podjąć kroki w celu utrzymania rozmiarów rezerwacji zgodnych z wdrożonymi jednostkami PTU.
Najlepszym rozwiązaniem jest zawsze zakup rezerwacji po utworzeniu wdrożeń. Zabezpiecza to przed sytuacją, w której kupujesz rezerwację, a potem okazuje się, że wymagana pojemność nie jest dostępna dla żądanego regionu lub modelu.
Rezerwacje na wdrożenia globalne, strefy danych i wdrożenia regionalne nie są zamienne. Musisz kupić oddzielną rezerwację dla każdego typu wdrożenia.
Aby pomóc klientom w zakupie prawidłowych kwot rezerwacji. Łączna liczba jednostek PTU w subskrypcji i regionie, które mogą być objęte rezerwacją, jest wymieniona na stronie 'Limity' portalu Foundry. Zobacz wiadomość "PTU dostępne do rezerwacji".
Zarządzanie rezerwacjami platformy Azure
Po utworzeniu rezerwacji monitoruj ją za pośrednictwem witryny Azure Reservation Portal lub usługi Azure Monitor, aby upewnić się, że rezerwacja otrzymuje oczekiwane użycie. Aby dowiedzieć się więcej na temat zarządzania rezerwacjami platformy Azure i monitorowania ich, zobacz następujące artykuły:
- Wyświetlanie wykorzystania rezerwacji platformy Azure
- Wyświetlanie transakcji zakupu i zwrotu kosztów rezerwacji platformy Azure
- Wyświetlanie zamortyzowanych kosztów korzyści
- Odliczanie kosztów rezerwacji platformy Azure
- Automatyczne odnawianie rezerwacji platformy Azure