Udostępnij za pośrednictwem


Tworzenie punktów końcowych dla wdrożonych usług internetowych usługi Machine Learning Studio (klasycznej)

DOTYCZY:Dotyczy. Usługa Machine Learning Studio (klasyczna) nie ma zastosowania do.Azure Machine Learning

Ważne

Obsługa programu Machine Learning Studio (wersja klasyczna) zakończy się 31 sierpnia 2024 r. Zalecamy przejście do usługi Azure Machine Learning przed tym terminem.

Od 1 grudnia 2021 r. nie będzie można tworzyć nowych zasobów programu Machine Learning Studio (wersja klasyczna). Do 31 sierpnia 2024 r. można będzie nadal korzystać z istniejących zasobów programu Machine Learning Studio (wersja klasyczna).

Dokumentacja programu ML Studio (wersja klasyczna) jest wycofywana i może nie być aktualizowana w przyszłości.

Po wdrożeniu usługi sieci Web dla tej usługi tworzony jest domyślny punkt końcowy. Domyślny punkt końcowy może być wywoływany przy użyciu właściwego dla niego klucza interfejsu API. Możesz dodać więcej punktów końcowych z własnymi kluczami z portalu usług sieci Web. Każdy punkt końcowy w usłudze internetowej jest niezależnie rozwiązywany, ograniczany i zarządzany. Każdy punkt końcowy jest unikatowym adresem URL z kluczem autoryzacji, który można rozpowszechniać wśród klientów.

Dodawanie punktów końcowych do usługi internetowej

Punkt końcowy można dodać do usługi internetowej przy użyciu portalu usług sieci Web Machine Learning. Po utworzeniu punktu końcowego można go używać za pośrednictwem synchronicznych interfejsów API, interfejsów API wsadowych i arkuszy programu Excel.

Uwaga

Jeśli dodano dodatkowe punkty końcowe do usługi internetowej, nie można usunąć domyślnego punktu końcowego.

  1. W usłudze Machine Learning Studio (wersja klasyczna) w lewej kolumnie nawigacji kliknij pozycję Usługi sieci Web.
  2. W dolnej części pulpitu nawigacyjnego usługi internetowej kliknij pozycję Zarządzaj punktami końcowymi. Portal usług sieci Web Machine Learning zostanie otwarty na stronie punktów końcowych dla usługi internetowej.
  3. Kliknij pozycję Nowy.
  4. Wpisz nazwę i opis nowego punktu końcowego. Nazwy punktów końcowych muszą mieć długość co najmniej 24 znaków i muszą składać się z małych liter lub cyfr. Wybierz poziom rejestrowania i określ, czy przykładowe dane są włączone. Aby uzyskać więcej informacji na temat rejestrowania, zobacz Włączanie rejestrowania dla usług sieci Web Machine Learning.

Skalowanie usługi internetowej przez dodanie dodatkowych punktów końcowych

Domyślnie każda opublikowana usługa internetowa jest skonfigurowana do obsługi 20 równoczesnych żądań i może wynosić nawet 200 równoczesnych żądań. Usługa Machine Learning Studio (wersja klasyczna) automatycznie optymalizuje ustawienie, aby zapewnić najlepszą wydajność usługi internetowej, a wartość portalu jest ignorowana.

Jeśli planujesz wywołanie interfejsu API z większym obciążeniem niż wartość Maksymalna liczba współbieżnych wywołań 200, należy utworzyć wiele punktów końcowych w tej samej usłudze internetowej. Następnie możesz losowo rozłożyć obciążenie na wszystkie z nich.

Skalowanie usługi internetowej jest typowym zadaniem. Niektóre powody skalowania to obsługa ponad 200 równoczesnych żądań, zwiększenie dostępności za pośrednictwem wielu punktów końcowych lub udostępnienie oddzielnych punktów końcowych dla usługi internetowej. Możesz zwiększyć skalę, dodając dodatkowe punkty końcowe dla tej samej usługi internetowej za pośrednictwem portalu usługi sieci Web Machine Learning .

Należy pamiętać, że użycie dużej liczby współbieżności może być szkodliwe, jeśli nie wywołujesz interfejsu API z odpowiednio wysoką szybkością. Mogą wystąpić sporadyczne przekroczenia limitu czasu i/lub skoki opóźnienia, jeśli obciążenie interfejsu API jest stosunkowo niskie, skonfigurowane pod kątem dużego obciążenia.

Synchroniczne interfejsy API są zwykle używane w sytuacjach, w których wymagane jest małe opóźnienie. Opóźnienie oznacza tutaj czas potrzebny na ukończenie jednego żądania przez interfejs API i nie uwzględnia opóźnień sieciowych. Załóżmy, że masz interfejs API z opóźnieniem 50 ms. Aby w pełni korzystać z dostępnej pojemności z poziomem ograniczenia wysoki i maksymalna liczba współbieżnych wywołań = 20, musisz wywołać ten interfejs API 20 * 1000 / 50 = 400 razy na sekundę. Rozszerzenie tego celu, maksymalna liczba współbieżnych wywołań 200 umożliwia wywołanie interfejsu API 4000 razy na sekundę, przy założeniu opóźnienia 50 ms.

Następne kroki

Jak korzystać z usługi internetowej Machine Learning.