Obsługa przewidywań w czasie rzeczywistym za pomocą punktów końcowych modelu uczenia maszynowego (wersja zapoznawcza)

Ważne

Ta funkcja jest dostępna w wersji zapoznawczej.

Microsoft Fabric umożliwia udostępnianie przewidywań w czasie rzeczywistym z modeli uczenia maszynowego z bezpiecznymi, skalowalnymi i łatwymi w użyciu punktami końcowymi online. Te punkty końcowe są dostępne jako wbudowane właściwości większości modeli Fabric i nie wymagają konfiguracji umożliwiającej rozpoczęcie w pełni zarządzanych wdrożeń w czasie rzeczywistym.

Punkty końcowe modelu można aktywować, konfigurować i wykonywać zapytania za pomocą publicznego interfejsu API REST. Możesz również rozpocząć pracę bezpośrednio z interfejsu Fabric, używając środowiska z małą ilością kodu w celu natychmiastowego aktywowania punktów końcowych modelu i przewidywań w wersji zapoznawczej.

Screenshot przedstawiający model uczenia maszynowego w Fabric z wbudowaną właściwością punktu końcowego do obsługi przewidywań w czasie rzeczywistym.

Wymagania wstępne

Ograniczenia

  • Obecnie dostępne są punkty końcowe dla ograniczonego zestawu typów modeli uczenia maszynowego, w tym Keras, LightGBM, Sklearn i XGBoost.
  • Punkty końcowe nie są obecnie dostępne dla modeli ze schematami opartymi na tensorach lub bez schematów.

Uwaga / Notatka

Od stycznia 2026 r. punkty końcowe uczenia maszynowego obsługują teraz wytrenowane modele zautomatyzowanego uczenia maszynowego. To poprzednie ograniczenie zostało usunięte.

Rozpoczynanie pracy z punktami końcowymi modelu

Modele uczenia maszynowego w Fabric są wstępnie utworzone przy użyciu punktów końcowych online, których można użyć do obsługi przewidywań w czasie rzeczywistym. Każda zarejestrowana wersja modelu ma dedykowany adres URL punktu końcowego, który można znaleźć w nagłówku "Szczegóły punktu końcowego" w interfejsie Fabric. Ten adres URL kończy się ścieżką podrzędną wyznaczającą tę określoną wersję (na przykład /versions/1/score).

Zrzut ekranu przedstawiający właściwości punktu końcowego modelu uczenia maszynowego, który może służyć do obsługi przewidywań w czasie rzeczywistym.

Punkty końcowe modelu mają następujące właściwości:

Własność Opis Wartość domyślna
Wersja domyślna Ta właściwość (Yes lub No) wskazuje, czy wersja jest ustawiona jako domyślna wersja modelu do obsługi rzeczywistych przewidywań. Możesz dostosować wersję domyślną w ustawieniach modelu. No
Status Ta właściwość wskazuje, czy punkt końcowy jest gotowy do obsługi przewidywań. Stan może być Inactive, Activating, Active, Deactivating, lub Failed. Tylko aktywne punkty końcowe mogą obsługiwać przewidywania. Inactive
Automatyczne uśpienie Ta właściwość (On lub Off) wskazuje, czy punkt końcowy, raz aktywny, powinien skalować użycie pojemności w dół do zera w przypadku braku ruchu. Jeśli automatyczne uśpienie jest włączone, punkt końcowy wprowadza stan bezczynności po pięciu minutach bez żądań przychodzących. Pierwsze wywołanie wznawiania bezczynnego punktu końcowego wiąże się z krótkim opóźnieniem. On

Aktywowanie punktów końcowych modelu

Punkty końcowe modelu można aktywować bezpośrednio z interfejsu Fabric. Przejdź do wersji, która ma służyć do przewidywania w czasie rzeczywistym, a następnie wybierz "Aktywuj punkt końcowy wersji" z menu.

Zrzut ekranu przedstawiający sposób aktywacji punktu końcowego modelu uczenia maszynowego z interfejsu Fabric.

Wyskakujący komunikat pokazuje, że Fabric przygotowuje punkt końcowy do obsługi przewidywań, a stan punktu końcowego zmieni się na "Aktywowanie". W tle Fabric uruchamia podstawową infrastrukturę kontenera do hostowania modelu. W ciągu kilku minut punkt końcowy jest gotowy do obsługi przewidywań.

Zrzut ekranu przedstawiający punkt końcowy modelu uczenia maszynowego, który jest teraz aktywowany.

Każdy punkt końcowy ma stan wskazujący, czy jest gotowy do obsługi przewidywań w czasie rzeczywistym:

Status Opis
Inactive Punkt końcowy nie jest aktywowany do obsługi przewidywań w czasie rzeczywistym i nie zużywa mocy obliczeniowej Fabric.
Activating Punkt końcowy jest konfigurowany do obsługi przewidywań w czasie rzeczywistym. W tle Fabric konfiguruje infrastrukturę kontenerową do hostowania modelu. W ciągu kilku minut punkt końcowy jest aktywny.
Active Punkt końcowy jest gotowy do obsługi przewidywań w czasie rzeczywistym. W tle Fabric zarządza podstawową infrastrukturą, skalując użycie zasobów w górę na podstawie ruchu przychodzącego. Większy ruch powoduje wyższe użycie pojemności Fabric.
Deactivating Punkt końcowy jest dezaktywowany, aby nie obsługiwał już przewidywań w czasie rzeczywistym ani nie korzystał z pojemności Fabric. Za kulisami, Fabric rozmontowuje podstawową infrastrukturę kontenerów.

Uwaga / Notatka

Modele uczenia maszynowego mogą obsługiwać aktywne punkty końcowe dla maksymalnie pięciu wersji jednocześnie. Aby obsługiwać przewidywania z szóstej wersji, należy najpierw dezaktywować aktywny punkt końcowy.

Zarządzanie punktami końcowymi modelu

Aby uzyskać przegląd aktywnych punktów końcowych modelu, wybierz pozycję "Zarządzaj punktami końcowymi" na wstążce w interfejsie. Każdy model ma dostosowywalny domyślny punkt końcowy, który obsługuje przewidywania z wybranej wersji. Wersję domyślną można zaktualizować przy użyciu selektora rozwijanego w okienku ustawień.

Zrzut ekranu przedstawiający domyślny adres URL punktu końcowego modelu uczenia maszynowego, który można skonfigurować pod kątem obsługi przewidywań z określonej wersji.

Ważne

Pamiętaj, aby ustawić właściwość domyślną na aktywną wersję, jeśli planujesz jej używać. Jeśli właściwość domyślna nie jest ustawiona lub jest ustawiona na nieaktywną wersję, wywołania domyślnego punktu końcowego kończą się niepowodzeniem.

Wszystkie wersje z aktywnymi punktami końcowymi są wymienione w ustawieniach punktu końcowego modelu. Właściwość automatycznego uśpienia każdego punktu końcowego można zmodyfikować, przełączając przełącznik na wartość "Włączone" lub "Wyłączone".

Zrzut ekranu przedstawiający sposób zmiany właściwości automatycznego uśpienia w punktach końcowych modelu uczenia maszynowego.

Wskazówka

Aktywne punkty końcowe z włączonym automatycznym uśpieniem przechodzą w stan bezczynności po pięciu minutach bez przesyłu danych, a pierwsze wywołanie w celu ich wybudzenia powoduje krótkie opóźnienie. Możesz wyłączyć tę właściwość dla punktów końcowych w środowisku produkcyjnym.

Wykonywanie zapytań względem punktów końcowych modelu dla przewidywań w czasie rzeczywistym

Punkty końcowe modelu są dostępne do natychmiastowego testowania przy użyciu środowiska z małą ilością kodu w Fabric. Przejdź do wersji z aktywnym punktem końcowym i wybierz pozycję "Podgląd przewidywań" na wstążce interfejsu. Przykładowe żądania można wysyłać do punktu końcowego — i pobierać przykładowe przewidywania w czasie rzeczywistym — przy użyciu pól formularza, które pasują do podpisu wejściowego modelu.

Zrzut ekranu przedstawiający wbudowane środowisko podglądu służące do pobierania przykładowych przewidywań z aktywnego punktu końcowego modelu uczenia maszynowego.

Aby wypełnić pola formularza losowymi wartościami przykładowymi, wybierz pozycję "Autowypełnianie". Możesz dodać więcej zestawów wartości formularza, aby przetestować punkt końcowy z wieloma danymi wejściowymi. Wybierz "Pobierz przewidywania", aby wysłać przykładowe żądanie do adresu URL końcowego.

Zrzut ekranu przedstawiający widok oparty na formularzach do wysyłania przykładowych żądań do aktywnego punktu końcowego modelu uczenia maszynowego.

Jeśli wolisz formatować przykładowe żądania jako ładunki JSON, użyj selektora listy rozwijanej, aby zmienić widok.

Zrzut ekranu przedstawiający widok oparty na formacie JSON do wysyłania przykładowych żądań do aktywnego punktu końcowego modelu uczenia maszynowego.

Dezaktywowanie punktów końcowych modelu

Punkty końcowe modelu można dezaktywować bezpośrednio z interfejsu Fabric. Przejdź do wersji, która nie musi już obsługiwać przewidywań w czasie rzeczywistym, a następnie wybierz pozycję "Dezaktywuj punkt końcowy wersji" ze wstążki w interfejsie.

Zrzut ekranu przedstawiający sposób dezaktywowania punktu końcowego modelu z uczenia maszynowego z poziomu interfejsu Fabric.

Komunikat typu toast pokazuje, że Fabric jest w trakcie rozmontowywania aktywnego wdrożenia, a status punktu końcowego zmienia się na "Dezaktywacja". Punkt końcowy nie jest w stanie obsługiwać przewidywań w czasie rzeczywistym, chyba że zostanie ponownie aktywowany.

Zrzut ekranu przedstawiający punkt końcowy modelu uczenia maszynowego, który jest teraz dezaktywowany.

Punkty końcowe dla wielu wersji można dezaktywować jednocześnie w okienku ustawień modelu. Wybierz pozycję "Zarządzaj punktami końcowymi" na wstążce w interfejsie i wybierz co najmniej jeden aktywny punkt końcowy do dezaktywowania.

Zrzut ekranu pokazujący, jak dezaktywować wiele punktów końcowych modeli uczenia maszynowego jednocześnie z interfejsu Fabric.

Wskaźnik zużycia

Hostowanie aktywnych punktów końcowych modelu zużywa jednostki wydajności Fabric (Capacity Units, CU). Punkty końcowe działają w węzłach obliczeniowych i mogą automatycznie skalować w górę do trzech węzłów na podstawie ruchu przychodzącego. Rozliczenia są obliczane na węzeł, gdy punkt końcowy jest aktywny. W poniższej tabeli przedstawiono zużycie CU dla aktywnego punktu końcowego modelu Machine Learning.

Operacja Jednostka operacji miary Wskaźnik zużycia
punkt końcowy modelu 1 punkt końcowy modelu (wersja) na sekundę na węzeł 5 sekund CU

W poniższej tabeli przedstawiono przykładowe scenariusze i odpowiadające im stawki zużycia oraz koszty godzinowe.

scenariusz Opis Wskaźnik zużycia Koszt godzinowy
Modele z nieaktywnymi punktami końcowymi Te modele nie mają aktywnych punktów końcowych wersji i nie mają skojarzonego użycia zasobów. Nie wiążą się one z dodatkowymi kosztami. 0 CU sekundy Godzina 0 CU
Modele z aktywnymi, ale bezczynnymi punktami końcowymi Te modele mają co najmniej jeden aktywny punkt końcowy wersji, ale bez zwykłego ruchu wszystkie zostały skalowane do zera, co powoduje automatyczne obniżenie kosztów. 5 sekund CU 0,42 godziny CU
Modele z 1 aktywnym punktem końcowym i stałym niskim ruchem Te modele mają tylko jeden aktywny punkt końcowy, który obsługuje predykcje, ale bez wystarczającego ruchu, aby wywołać pełne skalowanie. Jeden węzeł może obsłużyć cały ruch. Inne punkty końcowe wersji mogą być nieaktywne lub bezczynne. 5 sekund CU 5 godzin CU
Modele z 1 aktywnym punktem końcowym i stałym wysokim natężeniem ruchu Te modele mają tylko 1 aktywny punkt końcowy wersji obsługujący prognozy, przy wystarczającym natężeniu ruchu, aby zainicjować pełne skalowanie poziome. Inne punkty końcowe wersji mogą być nieaktywne lub bezczynne. 15 sekund CU 15 godzin aktualizacji CU
Modele z 5 aktywnymi punktami końcowymi i dużym stałym ruchem Te modele mają 5 aktywnych punktów końcowych wersji (bieżący limit) obsługujących przewidywania, z których każdy ma wystarczającą ilość ruchu, aby wyzwolić pełne skalowanie w poziomie. 75 sekund CU 75 godzin CU

Aplikacja metryk wydajności Fabric wyświetla łączne użycie pojemności dla operacji punktu końcowego modelu pod nazwą "Punkt końcowy modelu". Ponadto użytkownicy mogą wyświetlić podsumowanie opłat rozliczeniowych za użycie punktu końcowego modelu w ramach elementu fakturowania "ML Model Endpoint Capacity Usage CU".

Operacja punktu końcowego modelu jest klasyfikowana jako operacje w tle.

Stawki zużycia mogą ulec zmianie w dowolnym momencie. Microsoft podejmuje rozsądne starania w celu powiadomienia za pośrednictwem poczty e-mail lub powiadomienia w aplikacji. Zmiany wejdą w życie w dniu określonym w notatkach o wydaniu Microsoft lub na blogu Microsoft Fabric. Jeśli jakakolwiek zmiana punktu końcowego modelu w Fabric Wskaźnik zużycia znacznie zwiększa liczbę jednostek pojemności (CU) wymaganych do użycia, klienci mogą skorzystać z opcji anulowania dostępnych dla wybranej formy płatności.