Co to jest usługa Azure OpenAI?

Usługa Azure OpenAI Service zapewnia dostęp interfejsu API REST do zaawansowanych modeli językowych openAI, w tym serii modeli GPT-4, GPT-4 Turbo z usługą Vision, GPT-3.5-Turbo i Osadzanie. Ponadto nowe modele GPT-4 i GPT-3.5-Turbo osiągnęły teraz ogólną dostępność. Modele te można łatwo dostosować do konkretnego zadania, w tym między innymi generowania zawartości, podsumowywania, interpretacji obrazów, wyszukiwania semantycznego i języka naturalnego do tłumaczenia kodu. Użytkownicy mogą uzyskiwać dostęp do usługi za pośrednictwem interfejsów API REST, zestawu Python SDK lub interfejsu internetowego w programie Azure OpenAI Studio.

Omówienie funkcji

Funkcja Azure OpenAI
Dostępne modele Seria GPT-4 (w tym GPT-4 Turbo z wizją)
Seria GPT-3.5-Turbo
Serie osadzania
Dowiedz się więcej na naszej stronie Modele .
Dostrajanie (wersja zapoznawcza) GPT-3.5-Turbo (0613)
babbage-002
davinci-002.
Cena Dostępne tutaj
Aby uzyskać szczegółowe informacje na temat GPT-4 Turbo z usługą Vision, zobacz specjalne informacje o cenach.
Obsługa sieci wirtualnej i łącza prywatnego Tak, chyba że korzystasz z usługi Azure OpenAI na danych.
Tożsamość zarządzana Tak, za pośrednictwem identyfikatora Entra firmy Microsoft
Środowisko interfejsu użytkownika Witryna Azure Portal do zarządzania kontami i zasobami,
Azure OpenAI Service Studio na potrzeby eksploracji modeli i dostrajania
Dostępność regionalna modelu Dostępność modelu
Filtrowanie zawartości Monity i zakończenia są oceniane względem naszych zasad zawartości za pomocą zautomatyzowanych systemów. Zawartość o wysokiej ważności zostanie przefiltrowana.

Odpowiedzialne AI

W firmie Microsoft jesteśmy zobowiązani do rozwoju sztucznej inteligencji opartej na zasadach, które stawiają ludzi na pierwszym miejscu. Modele generowania, takie jak te dostępne w usłudze Azure OpenAI, mają znaczące potencjalne korzyści, ale bez starannego projektowania i przemyślanych środków zaradczych takie modele mogą generować niepoprawną, a nawet szkodliwą zawartość. Firma Microsoft poczyniła znaczne inwestycje w ochronę przed nadużyciami i niezamierzoną szkodą, w tym wymaganie od wnioskodawców przedstawienia dobrze zdefiniowanych przypadków użycia, włączenia zasad firmy Microsoft do odpowiedzialnego używania sztucznej inteligencji, tworzenia filtrów zawartości do obsługi klientów i dostarczania wskazówek dotyczących implementacji odpowiedzialnej sztucznej inteligencji do dołączanych klientów.

Jak mogę uzyskać dostęp do usługi Azure OpenAI?

Jak mogę uzyskać dostęp do usługi Azure OpenAI?

Dostęp jest obecnie ograniczony, ponieważ poruszamy się po wysokim zapotrzebowaniu, nadchodzących ulepszeniach produktów i zaangażowaniu firmy Microsoft w odpowiedzialne sztuczną inteligencję. Na razie współpracujemy z klientami będącymi rzeczywistymi partnerami firmy Microsoft, mającymi mniej przypadków użycia ryzyka i tymi, którzy zobowiązali się do włączenia środków zaradczych.

Bardziej szczegółowe informacje znajdują się w formularzu wniosku. Doceniamy cierpliwość, ponieważ pracujemy nad odpowiedzialnym włączeniem szerszego dostępu do usługi Azure OpenAI.

Zastosuj tutaj, aby uzyskać dostęp:

Zastosuj teraz

Porównanie usług Azure OpenAI i OpenAI

Usługa Azure OpenAI Service zapewnia klientom zaawansowaną sztuczną inteligencję języka za pomocą biblioteki OpenAI GPT-4, GPT-3, Codex, DALL-E, Whisper i zamiany tekstu na modele mowy przy użyciu zabezpieczeń i obietnicy dla przedsiębiorstw platformy Azure. Usługa Azure OpenAI współtworzy interfejsy API za pomocą interfejsu OpenAI, zapewniając zgodność i bezproblemowe przejście z jednego do drugiego.

Dzięki usłudze Azure OpenAI klienci uzyskują możliwości zabezpieczeń platformy Microsoft Azure podczas uruchamiania tych samych modeli co openAI. Usługa Azure OpenAI oferuje prywatną sieć, dostępność regionalną i odpowiedzialne filtrowanie zawartości sztucznej inteligencji.

Najważniejsze pojęcia

Monity i uzupełnienia

Punkt końcowy uzupełniania jest podstawowym składnikiem usługi interfejsu API. Ten interfejs API zapewnia dostęp do interfejsu tekstowego i wychodzącego modelu. Użytkownicy muszą po prostu podać wiersz wejściowyzawierający polecenie tekstowe w języku angielskim, a model wygeneruje uzupełnianie tekstu.

Oto przykład prostego monitu i ukończenia:

Monituj: """ count to 5 in a for loop """

Ukończenie: for i in range(1, 6): print(i)

Tokeny

Tokeny tekstowe

Usługa Azure OpenAI przetwarza tekst, dzieląc go na tokeny. Tokeny mogą być wyrazami lub tylko grupami znaków. Na przykład słowo "hamburger" zostaje podzielone na tokeny "ham", "bur" i "ger", podczas gdy krótkie i typowe słowo, takie jak "pear" jest pojedynczym tokenem. Wiele tokenów zaczyna się od białych znaków, na przykład "hello" i "bye".

Łączna liczba tokenów przetworzonych w danym żądaniu zależy od długości parametrów wejściowych, wyjściowych i żądań. Ilość przetwarzanych tokenów wpłynie również na opóźnienie odpowiedzi i przepływność modeli.

Tokeny obrazów (GPT-4 Turbo z wizją)

Koszt tokenu obrazu wejściowego zależy od dwóch głównych czynników: rozmiar obrazu i ustawienie szczegółów (niskie lub wysokie) używane dla każdego obrazu. Oto podział sposobu działania:

  • Szczegóły: Tryb niskiej rozdzielczości

    • Niski poziom szczegółowości umożliwia interfejsowi API szybsze zwracanie odpowiedzi i używanie mniejszej liczby tokenów wejściowych w przypadku przypadków użycia, które nie wymagają wysokiej szczegółowości.
    • Te obrazy kosztują 85 tokenów, niezależnie od rozmiaru obrazu.
    • Przykład: obraz 4096 x 8192 (niski poziom szczegółowości): Koszt jest stałym tokenem 85, ponieważ jest to obraz o niskiej szczegółowości, a rozmiar nie ma wpływu na koszt w tym trybie.
  • Szczegóły: tryb wysokiej rozdzielczości

    • Wysoki poziom szczegółowości umożliwia interfejsowi API wyświetlenie obrazu bardziej szczegółowo przez przycięcie go do mniejszych kwadratów. Każdy kwadrat używa więcej tokenów do generowania tekstu.
    • Koszt tokenu jest obliczany przez szereg kroków skalowania:
      1. Obraz jest po raz pierwszy skalowany w celu dopasowania do kwadratu 2048 x 2048 przy zachowaniu współczynnika proporcji.
      2. Obraz jest następnie skalowany w dół, tak aby najkrótsza strona wynosi 768 pikseli.
      3. Obraz jest podzielony na 512-pikselowe kafelki kwadratowe, a liczba tych kafelków (zaokrąglanie w górę dla częściowych kafelków) określa ostateczny koszt. Każdy kafelek kosztuje 170 tokenów.
      4. Dodatkowe 85 tokenów jest dodawanych do łącznego kosztu.
    • Przykład: obraz 2048 x 4096 (wysoki poziom szczegółowości)
      1. Początkowo zmieniono rozmiar na 1024 x 2048, aby zmieścić się na placu 2048.
      2. Dodatkowo zmieniono rozmiar na 768 x 1536.
      3. Do pokrycia wymagane jest sześć kafelków 512 pikseli.
      4. Łączny koszt to 170 × 6 + 85 = 1105 tokeny.

Zasoby

Azure OpenAI to nowa oferta produktu na platformie Azure. Możesz rozpocząć pracę z usługą Azure OpenAI tak samo jak każdy inny produkt platformy Azure, w którym tworzysz zasób lub wystąpienie usługi, w ramach subskrypcji platformy Azure. Więcej informacji na temat projektowania zarządzania zasobami platformy Azure można przeczytać.

Wdrożenia

Po utworzeniu zasobu usługi Azure OpenAI należy wdrożyć model, zanim będzie można rozpocząć wykonywanie wywołań interfejsu API i generowanie tekstu. Tę akcję można wykonać przy użyciu interfejsów API wdrażania. Te interfejsy API umożliwiają określenie modelu, którego chcesz użyć.

Inżynieria poleceń

Modele GPT-3, GPT-3.5 i GPT-4 z platformy OpenAI są oparte na monitach. W przypadku modeli opartych na poleceniach użytkownik wchodzi w interakcję z modelem, wprowadzając polecenie tekstowe, na które model odpowiada przez uzupełnienie tekstu. To uzupełnianie jest kontynuacją modelu tekstu wejściowego.

Te modele są niezwykle zaawansowane, jednak ich działanie jest również bardzo zależne od poleceń. Dzięki temu inżynieria jest ważną umiejętnością do opracowania.

Budowa monitów może być trudna. W praktyce monituje o skonfigurowanie wag modelu w celu ukończenia żądanego zadania, ale jest to bardziej sztuka niż nauka, często wymagając doświadczenia i intuicji, aby stworzyć udany monit.

Modele

Usługa zapewnia użytkownikom dostęp do kilku różnych modeli. Każdy model zapewnia inną możliwość i punkt cenowy.

Modele DALL-E (niektóre w wersji zapoznawczej; zobacz modele) generują obrazy na podstawie monitów tekstowych, które udostępnia użytkownik.

Modele Szeptu mogą służyć do transkrypcji i tłumaczenia mowy na tekst.

Modele zamiany tekstu na mowę, obecnie w wersji zapoznawczej, mogą służyć do syntezowania tekstu na mowę.

Dowiedz się więcej o każdym modelu na naszej stronie koncepcji modeli.

Następne kroki

Dowiedz się więcej o modelach bazowych, które zasilają usługę Azure OpenAI.