Udostępnij za pośrednictwem


Tworzenie punktów końcowych dla wdrożonych usług internetowych usługi Machine Learning Studio (klasycznej)

DOTYCZY: Dotyczy.Machine Learning Studio (wersja klasyczna) Nie dotyczy.Azure Machine Learning

Ważne

Obsługa programu Machine Learning Studio (wersja klasyczna) zakończy się 31 sierpnia 2024 r. Zalecamy przejście do usługi Azure Machine Learning przed tym terminem.

Od 1 grudnia 2021 r. nie będzie można tworzyć nowych zasobów programu Machine Learning Studio (wersja klasyczna). Do 31 sierpnia 2024 r. można będzie nadal korzystać z istniejących zasobów programu Machine Learning Studio (wersja klasyczna).

Dokumentacja programu ML Studio (wersja klasyczna) jest wycofywana i może nie być aktualizowana w przyszłości.

Po wdrożeniu usługi sieci Web dla tej usługi tworzony jest domyślny punkt końcowy. Domyślny punkt końcowy może być wywoływany przy użyciu właściwego dla niego klucza interfejsu API. Możesz dodać więcej punktów końcowych z własnymi kluczami z portalu usług sieci Web. Każdy punkt końcowy w usłudze internetowej jest niezależnie rozwiązywany, ograniczany i zarządzany. Każdy punkt końcowy jest unikatowym adresem URL z kluczem autoryzacji, który można dystrybuować do klientów.

Dodawanie punktów końcowych do usługi internetowej

Punkt końcowy można dodać do usługi internetowej przy użyciu portalu usług sieci Web Machine Learning. Po utworzeniu punktu końcowego można go używać za pomocą synchronicznych interfejsów API, interfejsów API wsadowych i arkuszy programu Excel.

Uwaga

Jeśli dodano dodatkowe punkty końcowe do usługi internetowej, nie można usunąć domyślnego punktu końcowego.

  1. W usłudze Machine Learning Studio (wersja klasyczna) w lewej kolumnie nawigacji kliknij pozycję Usługi internetowe.
  2. W dolnej części pulpitu nawigacyjnego usługi internetowej kliknij pozycję Zarządzaj punktami końcowymi. Portal usług sieci Web usługi Machine Learning zostanie otwarty na stronie punktów końcowych dla usługi internetowej.
  3. Kliknij przycisk Nowy.
  4. Wpisz nazwę i opis nowego punktu końcowego. Nazwy punktów końcowych muszą mieć długość co najmniej 24 znaków i muszą składać się z małych liter lub cyfr. Wybierz poziom rejestrowania i określ, czy przykładowe dane są włączone. Aby uzyskać więcej informacji na temat rejestrowania, zobacz Włączanie rejestrowania dla usług sieci Web Machine Learning.

Skalowanie usługi internetowej przez dodanie dodatkowych punktów końcowych

Domyślnie każda opublikowana usługa internetowa jest skonfigurowana do obsługi 20 współbieżnych żądań i może być nawet 200 równoczesnych żądań. Usługa Machine Learning Studio (wersja klasyczna) automatycznie optymalizuje ustawienie, aby zapewnić najlepszą wydajność usługi internetowej, a wartość portalu jest ignorowana.

Jeśli planujesz wywołanie interfejsu API z większym obciążeniem niż maksymalna liczba współbieżnych wywołań 200, należy utworzyć wiele punktów końcowych w tej samej usłudze internetowej. Następnie można losowo rozłożyć obciążenie na wszystkie z nich.

Skalowanie usługi internetowej jest typowym zadaniem. Niektóre powody skalowania to obsługa ponad 200 równoczesnych żądań, zwiększenie dostępności za pośrednictwem wielu punktów końcowych lub udostępnienie oddzielnych punktów końcowych dla usługi internetowej. Skalowanie można zwiększyć, dodając dodatkowe punkty końcowe dla tej samej usługi internetowej za pośrednictwem portalu usługi sieci Web Machine Learning.

Należy pamiętać, że użycie dużej liczby współbieżności może być szkodliwe, jeśli nie wywołujesz interfejsu API z odpowiednio wysoką szybkością. W przypadku stosunkowo małego obciążenia interfejsu API skonfigurowanego pod kątem dużego obciążenia mogą wystąpić sporadyczne przekroczenia limitu czasu i/lub wzrosty opóźnienia.

Synchroniczne interfejsy API są zwykle używane w sytuacjach, w których wymagane jest małe opóźnienie. Opóźnienie w tym miejscu oznacza czas potrzebny na ukończenie jednego żądania przez interfejs API i nie uwzględnia opóźnień sieciowych. Załóżmy, że masz interfejs API z opóźnieniem 50 ms. Aby w pełni korzystać z dostępnej pojemności z poziomem ograniczenia Wysoki i Maksymalna liczba współbieżnych wywołań = 20, należy wywołać ten interfejs API 20 * 1000 / 50 = 400 razy na sekundę. Rozszerzenie tego celu spowoduje, że maksymalna liczba współbieżnych wywołań 200 umożliwia wywołanie interfejsu API 4000 razy na sekundę przy założeniu opóźnienia 50 ms.

Następne kroki

Jak korzystać z usługi internetowej Machine Learning.