Dołączanie aprowizowanych jednostek przepływności

W tym artykule przedstawiono proces dołączania do aprowizowanych jednostek przepływności (PTU). Po zakończeniu początkowego dołączania zalecamy zapoznanie się z przewodnikiem wprowadzenie do jednostki PTU.

Uwaga

Aprowizowanie jednostek przepływności (PTU) różni się od standardowego limitu przydziału w usłudze Azure OpenAI i nie jest domyślnie dostępne. Aby dowiedzieć się więcej o tej ofercie, skontaktuj się z zespołem ds. kont Microsoft.

Kiedy należy używać aprowizowanych jednostek przepływności (PTU)

Należy rozważyć przejście z płatności zgodnie z rzeczywistym użyciem do aprowizowanej przepływności, jeśli masz dobrze zdefiniowane, przewidywalne wymagania dotyczące przepływności. Zazwyczaj dzieje się tak, gdy aplikacja jest gotowa do produkcji lub została już wdrożona w środowisku produkcyjnym i istnieje wiedza na temat oczekiwanego ruchu. Umożliwi to użytkownikom dokładne prognozowanie wymaganej pojemności i unikanie nieoczekiwanych rozliczeń.

Typowe scenariusze ptU

  • Aplikacja gotowa do produkcji lub w środowisku produkcyjnym.
  • Aplikacja ma przewidywalne oczekiwania dotyczące pojemności/użycia.
  • Aplikacja ma wymagania dotyczące czasu rzeczywistego/opóźnienia.

Uwaga

W przypadku wywoływania funkcji i użycia agenta użycie tokenu może być zmienne. Przed migracją obciążeń do jednostek PTU należy szczegółowo zrozumieć oczekiwane użycie tokenów na minutę (TPM).

Ustalanie rozmiaru i szacowanie: aprowizowana tylko zarządzana

Określenie odpowiedniej ilości aprowizowanej przepływności lub jednostek PTU, które są wymagane dla obciążenia, jest niezbędnym krokiem do optymalizacji wydajności i kosztów. W tej sekcji opisano sposób korzystania z narzędzia do planowania pojemności usługi Azure OpenAI. Narzędzie zapewnia oszacowanie wymaganej jednostki PTU, aby zaspokoić potrzeby obciążenia.

Szacowanie aprowizowanej przepływności i kosztów

Aby uzyskać szybkie oszacowanie obciążenia, otwórz planistę pojemności w programie Azure OpenAI Studio. Planista pojemności jest w obszarze Aprowizowane przydziały>zarządzania>.

Opcja Aprowizowana i planista pojemności są dostępne tylko w niektórych regionach w okienku Limit przydziału, jeśli ta opcja nie jest widoczna, ustawienie regionu przydziału na Szwecja Środkowa spowoduje udostępnienie tej opcji. Wprowadź następujące parametry na podstawie obciążenia.

Dane wejściowe opis
Model Model OpenAI, którego planujesz użyć. Na przykład: GPT-4
Wersja Wersja modelu, którego planujesz użyć, na przykład 0614
Monituj tokeny Liczba tokenów w wierszu polecenia dla każdego wywołania
Tokeny generowania Liczba tokenów generowanych przez model w każdym wywołaniu
Szczytowe wywołania na minutę Szczytowe współbieżne obciążenie punktu końcowego mierzone w wywołaniach na minutę

Po wprowadzeniu wymaganych szczegółów wybierz pozycję Oblicz , aby wyświetlić sugerowaną jednostkę PTU dla danego scenariusza.

Zrzut ekranu przedstawiający stronę docelową programu Azure OpenAI Studio.

Uwaga

Planista pojemności jest oszacowaniem na podstawie prostych kryteriów wejściowych. Najdokładniejszym sposobem określenia pojemności jest porównanie wdrożenia z obciążeniem reprezentującym dla danego przypadku użycia.

Opis modelu zakupu aprowizowanej przepływności

W przeciwieństwie do usług platformy Azure, w przypadku których są naliczane opłaty na podstawie użycia, funkcja aprowizowanej przepływności usługi Azure OpenAI jest kupowana jako odnawialne, miesięczne zobowiązanie. To zobowiązanie jest obciążane opłatą za subskrypcję po utworzeniu i przy każdym miesięcznym odnawianiu. Po dołączeniu do aprowizowania przepływności należy utworzyć zobowiązanie dla każdego zasobu usługi Azure OpenAI, w którym zamierzasz utworzyć aprowizowane wdrożenie. Jednostki PTU zakupione w ten sposób są dostępne do użycia podczas tworzenia wdrożeń w tych zasobach.

Łączna liczba jednostek PTU, które można kupić za pośrednictwem zobowiązań, jest ograniczona do kwoty przydziału aprowizowanej przepływności przypisanego do subskrypcji. W poniższej tabeli porównano inne cechy przydziału aprowizowanej przepływności (PTU) i zobowiązania dotyczące aprowizowanej przepływności.

Temat Norma sprzedaży Zobowiązania
Purpose Przyznaje uprawnienia do tworzenia aprowizowania wdrożeń i zapewnia górny limit pojemności, która może być używana Zakup pojazdu dla pojemności aprowizowanej przepływności
Okres istnienia Limit przydziału może zostać usunięty z subskrypcji, jeśli nie zostanie on zakupiony za pośrednictwem zobowiązania w ciągu pięciu dni od udzielenia Minimalny termin to jeden miesiąc z zachowaniem autorenewal wybieranym przez klienta. Nie można anulować zobowiązania i nie można go przenieść do nowego zasobu, gdy jest on aktywny
Scope Limit przydziału jest specyficzny dla subskrypcji i regionu i jest współużytkowany we wszystkich zasobach usługi Azure OpenAI Zobowiązania są atrybutem zasobu usługi Azure OpenAI i są ograniczone do wdrożeń w ramach tego zasobu. Subskrypcja może zawierać tyle aktywnych zobowiązań, ile istnieją zasoby.
Poziom szczegółowości Limit przydziału jest przyznawany specyficzny dla rodziny modeli (na przykład GPT-4), ale można go udostępniać w różnych wersjach modelu w obrębie rodziny Zobowiązania nie są specyficzne dla modelu ani wersji. Na przykład zobowiązanie 1000 PTU zasobu może obejmować wdrożenia zarówno GPT-4, jak i GPT-35-Turbo
Gwarancja pojemności Posiadanie limitu przydziału nie gwarantuje dostępności pojemności podczas tworzenia wdrożenia Dostępność pojemności na pokrycie zatwierdzonych jednostek PTU jest gwarantowana, o ile zobowiązanie jest aktywne.
Wzrosty/spadki Nowy limit przydziału można zażądać i zatwierdzić w dowolnym momencie niezależnie od dat odnowienia zobowiązania W dowolnym momencie można zwiększyć liczbę jednostek PTU objętych zobowiązaniem, ale nie można ich zmniejszyć z wyjątkiem czasu odnowienia.

Limit przydziału i zobowiązania współpracują ze sobą, aby zarządzać tworzeniem wdrożeń w ramach subskrypcji. Aby utworzyć aprowizowane wdrożenie, należy spełnić dwa kryteria:

  • Limit przydziału musi być dostępny dla żądanego modelu w żądanym regionie i subskrypcji. Oznacza to, że nie można przekroczyć limitu subskrypcji/całego regionu dla modelu.
  • Zatwierdzone jednostki PTU muszą być dostępne w zasobie, w którym tworzysz wdrożenie. (Pojemność przypisana do wdrożenia jest płatna).

Właściwości zobowiązania i model ładowania

Zobowiązanie obejmuje kilka właściwości.

Właściwości opis Po ustawieniu
Zasób usługi Azure OpenAI Zasób hostowania zobowiązania Tworzenie zobowiązania
Zatwierdzone jednostki PTU Liczba jednostek PTU objętych zobowiązaniem. Początkowo ustawiane podczas tworzenia zobowiązania i można je zwiększyć w dowolnym momencie, ale nie można go zmniejszyć.
Termin Termin zobowiązania. Zobowiązanie wygasa miesiąc od daty utworzenia. Zasady odnawiania określają, co się dzieje dalej. Tworzenie zobowiązania
Data wygaśnięcia Data wygaśnięcia zobowiązania. Ta godzina wygaśnięcia wynosi północ czasu UTC. Początkowo 30 dni od utworzenia. Jednak data wygaśnięcia zmienia się w przypadku odnowienia zobowiązania.
Zasady odnawiania Istnieją trzy opcje, które należy wykonać po wygaśnięciu:

- Autorenew: Nowy termin zobowiązania rozpoczyna się przez kolejne 30 dni od bieżącej liczby jednostek PTU
- Autorenew z różnymi ustawieniami: to ustawienie jest takie samo jak Autorenew, z tą różnicą, że można zmniejszyć liczbę jednostek PTU zatwierdzonych podczas odnawiania
- Nie autorenewuj: po wygaśnięciu zobowiązanie kończy się i nie jest odnawiane.
Początkowo ustawiane podczas tworzenia zobowiązania i można je zmienić w dowolnym momencie.

Opłaty wynikające ze zobowiązania

Zobowiązania dotyczące aprowizowanej przepływności generują opłaty za subskrypcję platformy Azure w następujących godzinach:

  • Podczas tworzenia zobowiązania. Opłata jest obliczana zgodnie z bieżącą miesięczną stawką PTU i liczbą zatwierdzonych jednostek PTU. Na fakturze otrzymasz pojedynczą opłatę z góry.

  • Po odnowieniu zobowiązania. Jeśli zasady odnawiania są ustawione na autorenew, zostanie wygenerowana nowa opłata miesięczna na podstawie jednostek PTU zatwierdzonych w nowym okresie. Ta opłata jest wyświetlana jako pojedyncza opłata z góry na fakturze.

  • Po dodaniu nowych jednostek PTU do istniejącego zobowiązania. Opłata jest obliczana na podstawie liczby jednostek PTU dodanych do zobowiązania, proporcjonalnie do końca istniejącego okresu zobowiązania. Jeśli na przykład 300 jednostek PTU zostanie dodanych do istniejącego zobowiązania 900 jednostek PTU dokładnie w połowie okresu, w momencie dodania do daty wygaśnięcia zobowiązania zostanie naliczona opłata za odpowiednik 150 jednostek PTU (300 jednostek PTU proporcjonalnie do daty wygaśnięcia zobowiązania). Jeśli zobowiązanie zostanie przedłużone, opłata za kolejny miesiąc zostanie naliczona dla nowej jednostki PTU w sumie 1200 jednostek PTU.

Jeśli liczba wdrożonych jednostek PTU w zasobie jest objęta zobowiązaniem zasobu, zobaczysz tylko opłaty za zobowiązanie dotyczące zobowiązania. Jeśli jednak liczba wdrożonych jednostek PTU w zasobie stanie się większa niż zatwierdzone jednostki PTU zasobu, nadwyżka jednostek PTU będzie naliczana jako nadwyżka w wysokości godzinowej. Zazwyczaj jedynym sposobem, w jaki będzie to miało miejsce, jest to, że zobowiązanie wygaśnie lub zostanie zmniejszone podczas odnawiania, gdy zasób zawiera wdrożenia. Jeśli na przykład 300 zobowiązań PTU może wygasnąć dla zasobu, który ma wdrożone 300 jednostek PTU, wdrożone jednostki PTU nie są już objęte żadnym zobowiązaniem. Po osiągnięciu daty wygaśnięcia subskrypcja jest obciążana godzinową opłatą nadwyżkową na podstawie 300 nadwyżkowych jednostek PTU.

Stawka godzinowa jest wyższa niż miesięczna stawka zobowiązania, a opłaty przekraczają stawkę miesięczną w ciągu kilku dni. Istnieją dwa sposoby kończenia opłat za nadwyżki godzinowe:

  • Usuń lub przeskaluj wdrożenia w dół, aby nie używały większej liczby jednostek PTU niż zostały zatwierdzone.
  • Utwórz nowe zobowiązanie dotyczące zasobu w celu pokrycia wdrożonych jednostek PTU.

Kupowanie zobowiązań i zarządzanie nimi

Planowanie zobowiązań

Po otrzymaniu potwierdzenia, że przydział aprowizowanej jednostki przepływności (PTU) jest przypisywany do subskrypcji, należy utworzyć zobowiązania dotyczące zasobów docelowych (lub rozszerzyć istniejące zobowiązania), aby umożliwić użycie przydziału dla wdrożeń.

Przed utworzeniem zobowiązań zaplanuj sposób użycia zaaprowizowanych wdrożeń i które zasoby usługi Azure OpenAI będą je hostować. Zobowiązania mają minimalny okres jednego miesiąca i nie można go zmniejszyć do końca okresu. Nie można ich również przenieść do nowych zasobów po utworzeniu. Na koniec suma zatwierdzonych jednostek PTU nie może być większa niż limit przydziału — jednostki PTU zatwierdzone w zasobie nie są już dostępne do zatwierdzenia dla innego zasobu, dopóki zobowiązanie nie wygaśnie. Posiadanie jasnego planu, w którym zasoby będą używane do aprowizowania wdrożeń, a pojemność, którą zamierzasz zastosować (przez co najmniej miesiąc), pomoże zapewnić optymalne środowisko konfiguracji aprowizowanej przepływności.

Na przykład:

  • Nie twórz zobowiązania i wdrożenia w zasobie tymczasowym na potrzeby walidacji. Zostaniesz zablokowany do korzystania z tego zasobu przez co najmniej miesiąc. Zamiast tego, jeśli plan ma ostatecznie używać jednostek PTU w zasobie produkcyjnym, utwórz zobowiązanie i wdrożenie testowe dla tego zasobu bezpośrednio od samego początku.

  • Oblicz liczbę jednostek PTU do zatwierdzenia na zasobie na podstawie liczby, modelu i rozmiaru wdrożeń, które chcesz utworzyć, mając na uwadze minimalną liczbę jednostek PTU, których każdy model wymaga utworzenia wdrożenia.

    • Przykład 1: GPT-4-32K wymaga co najmniej 200 jednostek PTU do wdrożenia. Jeśli tworzysz zobowiązanie tylko 100 jednostek PTU dla zasobu, nie będziesz mieć wystarczającej liczby zatwierdzonych jednostek PTU do wdrożenia GPT-4-32K tam

    • Przykład 2: Jeśli musisz utworzyć wiele wdrożeń w zasobie, zsumuj jednostki PTU wymagane dla każdego wdrożenia. Wdrożenia hostingu zasobów produkcyjnych dla 300 jednostek PTU GPT-4 i 500 JEDNOSTEK PTU GPT-4-32K będą wymagać zobowiązania co najmniej 800 JEDNOSTEK PTU do pokrycia obu wdrożeń.

  • Rozpowszechnij lub skonsoliduj jednostki PTU zgodnie z potrzebami. Na przykład łączny limit przydziału 1000 jednostek PTU można dystrybuować między zasoby zgodnie z potrzebami w celu obsługi wdrożeń. Może zostać zatwierdzony na jednym zasobie w celu obsługi co najmniej jednego wdrożenia sumowania do 1000 jednostek PTU lub rozproszonego między wiele zasobów (na przykład zasobu deweloperskiego i prod), o ile łączna liczba zatwierdzonych jednostek PTU jest mniejsza lub równa limitowi przydziału 1000.

  • Uwzględnij wymagania operacyjne w planie. Na przykład:

    • Konwencje nazewnictwa zasobów wymagane przez organizację
    • Zasady ciągłości działania, które wymagają wielu wdrożeń modelu na region, być może w różnych zasobach usługi Azure OpenAI

Zarządzanie zobowiązaniami aprowizowanej przepływności

Zobowiązania dotyczące aprowizowanej przepływności są tworzone i zarządzane w widoku Zarządzanie zobowiązaniami w programie Azure OpenAI Studio. Możesz przejść do tego widoku, wybierając pozycję Zarządzaj zobowiązaniami w okienku Limit przydziału:

Zrzut ekranu przedstawiający interfejs użytkownika zakupu zobowiązania z powiadomieniami.

W widoku Zarządzanie zobowiązaniami można wykonać kilka czynności:

  • Kupowanie nowych zobowiązań lub edytowanie istniejących zobowiązań.
  • Monitoruj wszystkie zobowiązania w ramach subskrypcji.
  • Zidentyfikuj i podejmij działania dotyczące zobowiązań, które mogą powodować nieoczekiwane rozliczenia.

Poniższe sekcje przejmą Cię przez te zadania.

Zakup aprowizowanego zobowiązania dotyczącego przepływności

Gdy plan zobowiązania będzie gotowy, następnym krokiem jest utworzenie zobowiązań. Zobowiązania są tworzone ręcznie za pośrednictwem usługi Azure OpenAI Studio i wymagają od użytkownika utworzenia zobowiązania w celu posiadania roli Współautor lub Współautor usług Cognitive Services na poziomie subskrypcji.

Dla każdego nowego zobowiązania, które należy utworzyć, wykonaj następujące kroki:

  1. Uruchom okno dialogowe Aprowizowanie zakupu przepływności, wybierając pozycję Przydziały>Aprowizowanie aprowizowanych>zobowiązań.

Zrzut ekranu przedstawiający okno dialogowe zakupu.

  1. Wybierz pozycję Zobowiązanie zakupu.

  2. Wybierz zasób Azure OpenAI i kup zobowiązanie. Zasoby zostaną podzielone na zasoby z istniejącymi zobowiązaniami, które można edytować i zasoby, które nie mają obecnie zobowiązania.

Ustawienie Uwagi
Wybierz zasób Wybierz zasób, w którym utworzysz aprowizowane wdrożenie. Po zakupie zobowiązania nie będzie można używać jednostek PTU w innym zasobie do momentu wygaśnięcia bieżącego zobowiązania.
Wybierz typ zobowiązania Wybierz pozycję Aprowizowana. (Aprowizowany jest odpowiednikiem aprowizowania zarządzanego)
Bieżący niezatwierdzony przydział aprowizacji Liczba jednostek PTU, które są obecnie dostępne do zatwierdzenia tego zasobu.
Kwota zatwierdzenia (PTU) Wybierz liczbę jednostek PTU, do których zobowiązujesz się. Tę liczbę można zwiększyć w okresie zobowiązania, ale nie można jej zmniejszyć. Wprowadź wartości w przyrostach 50 dla typu zobowiązania Zainicjowano obsługę administracyjną.
Warstwa zobowiązania dla bieżącego okresu Okres zobowiązania jest ustawiony na jeden miesiąc.
Ustawienia odnawiania Automatyczne odnawianie przy bieżących jednostkach PTU
Automatyczne odnawianie przy niższych jednostkach PTU
Nie odnawiaj automatycznie
  1. Wybierz pozycję Kup. Zostanie wyświetlone okno dialogowe potwierdzenia. Po potwierdzeniu jednostki PTU zostaną zatwierdzone i można ich użyć do utworzenia aprowizowanego wdrożenia. |

Zrzut ekranu przedstawiający interfejs użytkownika zakupu zobowiązania.

Ważne

Nowe zobowiązanie jest rozliczane z góry za cały okres. Jeśli ustawienia odnawiania są ustawione na automatyczne odnawianie, opłaty będą naliczane ponownie na każdą datę odnowienia na podstawie ustawień odnawiania.

Edytowanie istniejącego zobowiązania aprowizowanej przepływności

W widoku Zarządzanie zobowiązaniami możesz również edytować istniejące zobowiązanie. Istnieją dwa typy zmian, które można wprowadzić do istniejącego zobowiązania:

  • Możesz dodać jednostki PTU do zobowiązania.
  • Możesz zmienić ustawienia odnawiania.

Aby edytować zobowiązanie, wybierz bieżący element do edycji, a następnie wybierz pozycję Edytuj zobowiązanie.

Dodawanie aprowizowanych jednostek przepływności do istniejących zobowiązań

Dodanie jednostek PTU do istniejącego zobowiązania umożliwi utworzenie większych lub większej liczby wdrożeń w ramach zasobu. Możesz to zrobić w dowolnym momencie w okresie zobowiązania.

Zrzut ekranu przedstawiający interfejs użytkownika zakupu zobowiązania ze wzrostem wartości zatwierdzenia.

Ważne

Po dodaniu jednostek PTU do zobowiązania będą one rozliczane natychmiast na podstawie proporcjonalnej kwoty od bieżącej daty do końca istniejącego okresu zobowiązania. Dodanie jednostek PTU nie powoduje zresetowania terminu zobowiązania.

Zmienianie ustawień odnawiania

Ustawienia odnowienia zobowiązania można zmienić w dowolnym momencie przed datą wygaśnięcia zobowiązania. Powody, dla których można zmienić ustawienia odnawiania, obejmują zakończenie korzystania z aprowizowanej przepływności przez ustawienie zobowiązania, aby nie odnawiać automatyczne, lub zmniejszenie użycia aprowizowanej przepływności przez obniżenie liczby jednostek PTU, które zostaną zatwierdzone w następnym okresie.

Ważne

Jeśli zezwolisz na wygaśnięcie lub zmniejszenie rozmiaru zobowiązania, tak aby wdrożenia w ramach zasobu wymagały więcej jednostek PTU niż w ramach zobowiązania dotyczącego zasobów, otrzymasz opłaty godzinowe za nadwyżkowe jednostki PTU. Na przykład zasób, który zawiera wdrożenia obejmujące łącznie 500 jednostek PTU i zobowiązanie dla 300 jednostek PTU, spowoduje wygenerowanie opłat za nadwyżkowe opłaty godzinowe za 200 jednostek PTU.

Monitorowanie zobowiązań i zapobieganie nieoczekiwanym rozliczeniom

Okienko Zarządzanie zobowiązaniami zawiera szeroki przegląd wszystkich zasobów z zobowiązaniami i użyciem jednostek PTU w ramach danej subskrypcji platformy Azure. Istotne znaczenie mają następujące znaczenie:

  • Jednostki PTU Zatwierdzone, Wdrożone i Użycie — te dane zawierają rozmiary zobowiązań i ilość używanych przez wdrożenia. Maksymalizuj inwestycję przy użyciu wszystkich zatwierdzonych jednostek PTU.
  • Zasady wygasania i data — data wygaśnięcia i zasady informują, kiedy zobowiązanie wygaśnie i co się stanie, gdy tak się stanie. Zobowiązanie ustawione na automatyczne odnawianie spowoduje wygenerowanie zdarzenia rozliczeniowego w dniu odnowienia. W przypadku zobowiązań wygasających upewnij się, że wdrożenia zostały usunięte z tych zasobów przed datą wygaśnięcia, aby zapobiec naliczaniu godzinowymZaliczanie godzinOweUstawienia bieżącego odnowienia zobowiązania.
  • Powiadomienia — alerty dotyczące ważnych warunków, takich jak nieużywane zobowiązania i konfiguracje, które mogą powodować nadwyżki rozliczeń. Nadwyżki rozliczeń mogą być spowodowane sytuacjami, takimi jak wygaśnięcie zobowiązania, a wdrożenia są nadal obecne, ale zostały przeniesione do rozliczeń godzinowych.

Typowe scenariusze zarządzania zobowiązaniem

Zaprzestanie korzystania z aprowizowanej przepływności

Aby zakończyć korzystanie z aprowizowanej przepływności i zapobiec naliczaniu opłat godzinowych po wygaśnięciu zobowiązania, należy zatrzymać wszelkie opłaty po wygaśnięciu bieżących zobowiązań, należy wykonać dwa kroki:

  1. Ustaw zasady odnawiania dla wszystkich zobowiązań nie autorenew.
  2. Usuń aprowidowane wdrożenia przy użyciu limitu przydziału.

Przenoszenie zobowiązania/wdrożenia do nowego zasobu w tej samej subskrypcji/regionie

W usłudze Azure OpenAI Studio nie można bezpośrednio przenieść wdrożenia ani zobowiązania do nowego zasobu. Zamiast tego należy utworzyć nowe wdrożenie w zasobie docelowym i przenieść do niego ruch. Aby to osiągnąć, konieczne będzie zobowiązanie zakupione na podstawie nowego zasobu. Ponieważ zobowiązania są naliczane z góry przez okres 30 dni, konieczne jest, aby ten ruch upływał wraz z wygaśnięciem pierwotnego zobowiązania, aby zminimalizować nakładanie się na nowe zobowiązanie i "podwójne rozliczenia" podczas nakładania się.

Istnieją dwa podejścia, które można zastosować do wdrożenia tego przejścia.

Opcja 1. Przełączanie bez nakładania się

Ta opcja wymaga przestoju, ale nie wymaga dodatkowego limitu przydziału i nie generuje dodatkowych kosztów.

Kroki Uwagi
Ustawianie zasad odnawiania istniejącego zobowiązania w celu wygaśnięcia Uniemożliwi to odnowienie i wygenerowanie dalszych opłat przez zobowiązanie
Przed wygaśnięciem istniejącego zobowiązania usuń wdrożenie Przestój rozpocznie się w tym momencie i będzie trwać do momentu utworzenia nowego wdrożenia i przeniesienia ruchu. Zminimalizujesz czas trwania, określając czas usunięcia tak blisko daty/godziny wygaśnięcia, jak to możliwe.
Po wygaśnięciu istniejącego zobowiązania utwórz zobowiązanie dotyczące nowego zasobu Zminimalizuj przestój, wykonując ten i następny krok jak najszybciej po wygaśnięciu.
Tworzenie wdrożenia w nowym zasobie i przenoszenie ruchu do niego

Opcja 2. Nakładające się przełączanie

Ta opcja nie ma przestoju, ponieważ zarówno istniejące, jak i nowe wdrożenia działają w tym samym czasie. Wymaga to udostępnienia limitu przydziału w celu utworzenia nowego wdrożenia i spowoduje wygenerowanie dodatkowych kosztów na czas trwania nakładających się wdrożeń.

Kroki Uwagi
Ustawianie zasad odnawiania istniejącego zobowiązania w celu wygaśnięcia Zapobiega to odnowieniu i wygenerowaniu dodatkowych opłat przez zobowiązanie.
Przed wygaśnięciem istniejącego zobowiązania:
1. Utwórz zobowiązanie dotyczące nowego zasobu.
2. Utwórz nowe wdrożenie.
3. Przełącz ruch
4. Usuwanie istniejącego wdrożenia
Upewnij się, że pozostawisz wystarczająco dużo czasu na wszystkie kroki przed wygaśnięciem istniejącego zobowiązania. W przeciwnym razie opłaty nadwyżkowe zostaną wygenerowane (zobacz następną sekcję) dla opcji.

Jeśli ostatni krok trwa dłużej niż oczekiwano i zakończy się po wygaśnięciu istniejącego zobowiązania, istnieją trzy opcje zminimalizowania opłat za nadwyżki.

  • Przestój: usuń oryginalne wdrożenie, a następnie zakończ przenoszenie.
  • Nadwyżka płatności: zachowaj oryginalne wdrożenie i zapłać co godzinę, dopóki nie przeniesiesz ruchu i usuniesz wdrożenie.
  • Zresetuj oryginalne zobowiązanie , aby odnowić jeszcze raz. Pozwoli to na ukończenie przenoszenia ze znanym kosztem.

Zarówno płacenie za nadwyżkę, jak i zresetowanie pierwotnego zobowiązania spowoduje wygenerowanie opłat przekraczających pierwotną datę wygaśnięcia. Płacenie opłat nadwyżkowych może być tańsze niż nowe zobowiązanie jednomiesięczny, jeśli potrzebujesz tylko jednego lub dwóch dni do ukończenia przenoszenia. Porównaj koszty obu opcji, aby znaleźć podejście o najniższych kosztach.

Przenoszenie wdrożenia do nowego regionu i subskrypcji

Te same podejścia mają zastosowanie w przeniesieniu zobowiązania i wdrożenia w regionie, z tą różnicą, że we wszystkich przypadkach będzie wymagane posiadanie dostępnego limitu przydziału w nowej lokalizacji.

Wyświetlanie i edytowanie istniejącego zasobu

W usłudze Azure OpenAI Studio wybierz pozycję Aprowizowane>przydziały>Zarządzaj zobowiązaniami i wybierz zasób z istniejącym zobowiązaniem, aby go wyświetlić/zmienić.

Następne kroki