Co to jest usługa Azure OpenAI?

Artykuł
07/24/2024

Usługa Azure OpenAI Service zapewnia dostęp interfejsu API REST do zaawansowanych modeli językowych openAI, takich jak GPT-4o, GPT-4 Turbo z usługą Vision, GPT-4, GPT-3.5-Turbo i Osadzanie. Modele te można łatwo dostosować do konkretnego zadania, w tym między innymi generowania zawartości, podsumowywania, interpretacji obrazów, wyszukiwania semantycznego i języka naturalnego do tłumaczenia kodu. Użytkownicy mogą uzyskiwać dostęp do usługi za pośrednictwem interfejsów API REST, zestawu Python SDK lub interfejsu internetowego w programie Azure OpenAI Studio.

Omówienie funkcji

Funkcja	Azure OpenAI
Dostępne modele	GPT-4o Seria GPT-4 (w tym GPT-4 Turbo z wizją) Seria GPT-3.5-Turbo Serie osadzania Dowiedz się więcej na naszej stronie Modele .
Dostrajanie	`GPT-4` (wersja zapoznawcza) `GPT-3.5-Turbo` (0613) `babbage-002` `davinci-002`.
Cena	Dostępne tutaj Aby uzyskać szczegółowe informacje na temat GPT-4 Turbo z usługą Vision, zobacz specjalne informacje o cenach.
Obsługa sieci wirtualnej i łącza prywatnego	Tak, chyba że korzystasz z usługi Azure OpenAI na danych.
Tożsamość zarządzana	Tak, za pośrednictwem identyfikatora Entra firmy Microsoft
Środowisko interfejsu użytkownika	Witryna Azure Portal do zarządzania kontami i zasobami, Azure OpenAI Service Studio na potrzeby eksploracji modeli i dostrajania
Dostępność regionalna modelu	Dostępność modelu
Filtrowanie zawartości	Monity i zakończenia są oceniane względem naszych zasad zawartości za pomocą zautomatyzowanych systemów. Zawartość o wysokiej ważności zostanie przefiltrowana.

Odpowiedzialne AI

W firmie Microsoft jesteśmy zobowiązani do rozwoju sztucznej inteligencji opartej na zasadach, które stawiają ludzi na pierwszym miejscu. Modele generowania, takie jak te dostępne w usłudze Azure OpenAI, mają znaczące potencjalne korzyści, ale bez starannego projektowania i przemyślanych środków zaradczych takie modele mogą generować niepoprawną, a nawet szkodliwą zawartość. Firma Microsoft poczyniła znaczne inwestycje w ochronę przed nadużyciami i niezamierzoną szkodą, w tym wymaganie od wnioskodawców przedstawienia dobrze zdefiniowanych przypadków użycia, włączenia zasad firmy Microsoft do odpowiedzialnego używania sztucznej inteligencji, tworzenia filtrów zawartości do obsługi klientów i dostarczania wskazówek dotyczących implementacji odpowiedzialnej sztucznej inteligencji do dołączanych klientów.

Jak mogę uzyskać dostęp do usługi Azure OpenAI?

Formularz rejestracji ograniczonego dostępu nie jest wymagany do uzyskiwania dostępu do większości modeli usługi Azure OpenAI. Dowiedz się więcej na stronie Azure OpenAI Limited Access ( Ograniczony dostęp do usługi Azure OpenAI).

Porównanie usług Azure OpenAI i OpenAI

Usługa Azure OpenAI Service zapewnia klientom zaawansowaną sztuczną inteligencję języka za pomocą biblioteki OpenAI GPT-4, GPT-3, Codex, DALL-E, Whisper i zamiany tekstu na modele mowy przy użyciu zabezpieczeń i obietnicy dla przedsiębiorstw platformy Azure. Usługa Azure OpenAI współtworzy interfejsy API za pomocą interfejsu OpenAI, zapewniając zgodność i bezproblemowe przejście z jednego do drugiego.

Dzięki usłudze Azure OpenAI klienci uzyskują możliwości zabezpieczeń platformy Microsoft Azure podczas uruchamiania tych samych modeli co openAI. Usługa Azure OpenAI oferuje prywatną sieć, dostępność regionalną i odpowiedzialne filtrowanie zawartości sztucznej inteligencji.

Najważniejsze pojęcia

Monity i uzupełnienia

Punkt końcowy uzupełniania jest podstawowym składnikiem usługi interfejsu API. Ten interfejs API zapewnia dostęp do interfejsu tekstowego i wychodzącego modelu. Użytkownicy muszą po prostu podać wiersz wejściowy zawierający polecenie tekstowe w języku angielskim, a model wygeneruje uzupełnianie tekstu.

Oto przykład prostego monitu i ukończenia:

Monituj: """ count to 5 in a for loop """

Ukończenie: for i in range(1, 6): print(i)

Tokeny

Tokeny tekstowe

Usługa Azure OpenAI przetwarza tekst, dzieląc go na tokeny. Tokeny mogą być wyrazami lub tylko grupami znaków. Na przykład słowo "hamburger" zostaje podzielone na tokeny "ham", "bur" i "ger", podczas gdy krótkie i typowe słowo, takie jak "pear" jest pojedynczym tokenem. Wiele tokenów zaczyna się od białych znaków, na przykład "hello" i "bye".

Łączna liczba tokenów przetworzonych w danym żądaniu zależy od długości parametrów wejściowych, wyjściowych i żądań. Ilość przetwarzanych tokenów wpłynie również na opóźnienie odpowiedzi i przepływność modeli.

Tokeny obrazów (GPT-4 Turbo z wizją)

Koszt tokenu obrazu wejściowego zależy od dwóch głównych czynników: rozmiar obrazu i ustawienie szczegółów (niskie lub wysokie) używane dla każdego obrazu. Oto podział sposobu działania:

Szczegóły: Tryb niskiej rozdzielczości
- Niski poziom szczegółowości umożliwia interfejsowi API szybsze zwracanie odpowiedzi i używanie mniejszej liczby tokenów wejściowych w przypadku przypadków użycia, które nie wymagają wysokiej szczegółowości.
- Te obrazy kosztują 85 tokenów, niezależnie od rozmiaru obrazu.
- Przykład: obraz 4096 x 8192 (niski poziom szczegółowości): Koszt jest stałym tokenem 85, ponieważ jest to obraz o niskiej szczegółowości, a rozmiar nie ma wpływu na koszt w tym trybie.
Szczegóły: tryb wysokiej rozdzielczości
- Wysoki poziom szczegółowości umożliwia interfejsowi API wyświetlenie obrazu bardziej szczegółowo przez przycięcie go do mniejszych kwadratów. Każdy kwadrat używa więcej tokenów do generowania tekstu.
- Koszt tokenu jest obliczany przez szereg kroków skalowania:
  1. Obraz jest po raz pierwszy skalowany w celu dopasowania do kwadratu 2048 x 2048 przy zachowaniu współczynnika proporcji.
  2. Obraz jest następnie skalowany w dół, tak aby najkrótsza strona wynosi 768 pikseli.
  3. Obraz jest podzielony na 512-pikselowe kafelki kwadratowe, a liczba tych kafelków (zaokrąglanie w górę dla częściowych kafelków) określa ostateczny koszt. Każdy kafelek kosztuje 170 tokenów.
  4. Dodatkowe 85 tokenów jest dodawanych do łącznego kosztu.
- Przykład: obraz 2048 x 4096 (wysoki poziom szczegółowości)
  1. Początkowo zmieniono rozmiar na 1024 x 2048, aby zmieścić się na placu 2048.
  2. Dodatkowo zmieniono rozmiar na 768 x 1536.
  3. Do pokrycia wymagane jest sześć kafelków 512 pikseli.
  4. Łączny koszt to 170 × 6 + 85 = 1105 tokeny.

Zasoby

Azure OpenAI to nowa oferta produktu na platformie Azure. Możesz rozpocząć pracę z usługą Azure OpenAI tak samo jak każdy inny produkt platformy Azure, w którym tworzysz zasób lub wystąpienie usługi, w ramach subskrypcji platformy Azure. Więcej informacji na temat projektowania zarządzania zasobami platformy Azure można przeczytać.

Wdrożenia

Po utworzeniu zasobu usługi Azure OpenAI należy wdrożyć model, zanim będzie można rozpocząć wykonywanie wywołań interfejsu API i generowanie tekstu. Tę akcję można wykonać przy użyciu interfejsów API wdrażania. Te interfejsy API umożliwiają określenie modelu, którego chcesz użyć.

Inżynieria poleceń

Modele GPT-3, GPT-3.5 i GPT-4 z platformy OpenAI są oparte na monitach. W przypadku modeli opartych na poleceniach użytkownik wchodzi w interakcję z modelem, wprowadzając polecenie tekstowe, na które model odpowiada przez uzupełnienie tekstu. To uzupełnianie jest kontynuacją modelu tekstu wejściowego.

Te modele są niezwykle zaawansowane, jednak ich działanie jest również bardzo zależne od poleceń. Dzięki temu inżynieria jest ważną umiejętnością do opracowania.

Budowa monitów może być trudna. W praktyce monituje o skonfigurowanie wag modelu w celu ukończenia żądanego zadania, ale jest to bardziej sztuka niż nauka, często wymagając doświadczenia i intuicji, aby stworzyć udany monit.

Modele

Usługa zapewnia użytkownikom dostęp do kilku różnych modeli. Każdy model zapewnia inną możliwość i punkt cenowy.

Modele DALL-E (niektóre w wersji zapoznawczej; zobacz modele) generują obrazy na podstawie monitów tekstowych, które udostępnia użytkownik.

Modele Szeptu mogą służyć do transkrypcji i tłumaczenia mowy na tekst.

Modele zamiany tekstu na mowę, obecnie w wersji zapoznawczej, mogą służyć do syntezowania tekstu na mowę.

Dowiedz się więcej o każdym modelu na naszej stronie koncepcji modeli.

Następne kroki

Dowiedz się więcej o modelach bazowych, które zasilają usługę Azure OpenAI.

Udostępnij za pośrednictwem