Wdrażanie modelu w punkcie końcowym

{liczbaMinut} minut

Podczas tworzenia aplikacji generującej sztuczną inteligencję należy zintegrować modele językowe z aplikacją. Aby móc korzystać z modelu językowego, należy wdrożyć model. Przyjrzyjmy się, jak wdrożyć modele językowe w rozwiązaniu Microsoft Foundry, po zapoznaniu się z pierwszym zrozumieniem, dlaczego wdrożyć model.

Dlaczego warto wdrożyć model?

Wytrenujesz model, aby wygenerować dane wyjściowe na podstawie niektórych danych wejściowych. Aby uzyskać wartość z modelu, potrzebujesz rozwiązania, które pozwala wysyłać dane wejściowe do modelu; model je przetwarza, a następnie dane wyjściowe są dla Ciebie wizualizowane.

W przypadku generowania aplikacji sztucznej inteligencji najczęstszym typem rozwiązania jest aplikacja do czatu, która oczekuje pytania użytkownika, które przetwarza model, w celu wygenerowania odpowiedniej odpowiedzi. Odpowiedź jest następnie wizualizowana jako odpowiedź na jego pytanie dla użytkownika.

Diagram pytania użytkownika przetwarzany przez model wdrożony w punkcie końcowym.

Model językowy można zintegrować z aplikacją czatu, wdrażając model w punkcie końcowym. Punkt końcowy to określony adres URL, pod którym można uzyskać dostęp do wdrożonego modelu lub usługi. Każde wdrożenie modelu zwykle ma własny unikatowy punkt końcowy, który umożliwia różnym aplikacjom komunikowanie się z modelem za pośrednictwem interfejsu API (Interfejs programowania aplikacji).

Gdy użytkownik zadaje pytanie:

Żądanie interfejsu API jest wysyłane do punktu końcowego.
Punkt końcowy określa model, który przetwarza żądanie.
Wynik jest wysyłany z powrotem do aplikacji za pośrednictwem odpowiedzi interfejsu API.

Teraz, gdy już wiesz, dlaczego chcesz wdrożyć model, zapoznajmy się z opcjami wdrażania za pomocą rozwiązania Microsoft Foundry.

Wdrażanie modelu językowego za pomocą rozwiązania Microsoft Foundry

Podczas wdrażania modelu językowego za pomocą rozwiązania Microsoft Foundry dostępnych jest kilka typów, które zależą od modelu, który chcesz wdrożyć.

Opcje wdrażania obejmują:

Wdrożenie standardowe: modele są hostowane w zasobie projektu Microsoft Foundry.
Przetwarzanie bezserwerowe: modele są hostowane w dedykowanych punktach końcowych bezserwerowych zarządzanych przez firmę Microsoft w projekcie centrum Microsoft Foundry.
Zarządzane zasoby obliczeniowe: modele są hostowane w zarządzanych obrazach maszyn wirtualnych w projekcie centrum Microsoft Foundry.

Skojarzony koszt zależy od typu wdrażanego modelu, wybranej opcji wdrożenia i tego, co robisz z modelem:

	Wdrażanie standardowe	Bezserwerowe obliczenia	Zarządzane obliczenia
Obsługiwane modele	Modele rozwiązania Microsoft Foundry (w tym modele azure OpenAI i modele jako usługa)	Modele Foundry z rozliczeniami w modelu płatności za użycie	Otwarte i modele niestandardowe
Usługa hostingu	Zasób Microsoft Foundry	Zasób projektu sztucznej inteligencji w centrum	Zasób projektu sztucznej inteligencji w centrum
Podstawa rozliczeń	Rozliczenia oparte na tokenach	Rozliczenia oparte na tokenach	Rozliczenia oparte na obliczeniach

Uwaga / Notatka

Wdrożenie standardowe jest zalecane w przypadku większości scenariuszy.

Sprzężenie zwrotne

Czy ta strona była pomocna?