Obsługa przewidywań w czasie rzeczywistym za pomocą punktów końcowych modelu uczenia maszynowego (wersja zapoznawcza)

Ważne

Ta funkcja jest dostępna w wersji zapoznawczej.

Microsoft Fabric umożliwia udostępnianie przewidywań w czasie rzeczywistym z modeli uczenia maszynowego z bezpiecznymi, skalowalnymi i łatwymi w użyciu punktami końcowymi online. Te punkty końcowe są dostępne jako wbudowane właściwości większości modeli Fabric i nie wymagają konfiguracji umożliwiającej rozpoczęcie w pełni zarządzanych wdrożeń w czasie rzeczywistym.

Punkty końcowe modelu można aktywować, konfigurować i wykonywać zapytania za pomocą publicznego interfejsu API REST. Możesz również rozpocząć pracę bezpośrednio z interfejsu Fabric, używając środowiska z małą ilością kodu w celu natychmiastowego aktywowania punktów końcowych modelu i przewidywań w wersji zapoznawczej.

Wymagania wstępne

Punkty końcowe modelu uczenia maszynowego są domyślnie włączone w dzierżawie. Jeśli administrator chce dezaktywować tę funkcję, może wyłączyć przełącznik najemcy dla punktów końcowych modelu uczenia maszynowego w portalu administracyjnym Fabric.

Ograniczenia

Obecnie dostępne są punkty końcowe dla ograniczonego zestawu typów modeli uczenia maszynowego, w tym Keras, LightGBM, Sklearn i XGBoost.
Punkty końcowe nie są obecnie dostępne dla modeli ze schematami opartymi na tensorach lub bez schematów.

Uwaga / Notatka

Od stycznia 2026 r. punkty końcowe uczenia maszynowego obsługują teraz wytrenowane modele zautomatyzowanego uczenia maszynowego. To poprzednie ograniczenie zostało usunięte.

Rozpoczynanie pracy z punktami końcowymi modelu

Modele uczenia maszynowego w Fabric są wstępnie utworzone przy użyciu punktów końcowych online, których można użyć do obsługi przewidywań w czasie rzeczywistym. Każda zarejestrowana wersja modelu ma dedykowany adres URL punktu końcowego, który można znaleźć w nagłówku "Szczegóły punktu końcowego" w interfejsie Fabric. Ten adres URL kończy się ścieżką podrzędną wyznaczającą tę określoną wersję (na przykład /versions/1/score).

Punkty końcowe modelu mają następujące właściwości:

Własność	Opis	Wartość domyślna
Wersja domyślna	Ta właściwość (`Yes` lub `No`) wskazuje, czy wersja jest ustawiona jako domyślna wersja modelu do obsługi rzeczywistych przewidywań. Możesz dostosować wersję domyślną w ustawieniach modelu.	`No`
Status	Ta właściwość wskazuje, czy punkt końcowy jest gotowy do obsługi przewidywań. Stan może być `Inactive`, `Activating`, `Active`, `Deactivating`, lub `Failed`. Tylko aktywne punkty końcowe mogą obsługiwać przewidywania.	`Inactive`
Automatyczne uśpienie	Ta właściwość (`On` lub `Off`) wskazuje, czy punkt końcowy, raz aktywny, powinien skalować użycie pojemności w dół do zera w przypadku braku ruchu. Jeśli automatyczne uśpienie jest włączone, punkt końcowy wprowadza stan bezczynności po pięciu minutach bez żądań przychodzących. Pierwsze wywołanie wznawiania bezczynnego punktu końcowego wiąże się z krótkim opóźnieniem.	`On`

Aktywowanie punktów końcowych modelu

Punkty końcowe modelu można aktywować bezpośrednio z interfejsu Fabric. Przejdź do wersji, która ma służyć do przewidywania w czasie rzeczywistym, a następnie wybierz "Aktywuj punkt końcowy wersji" z menu.

Wyskakujący komunikat pokazuje, że Fabric przygotowuje punkt końcowy do obsługi przewidywań, a stan punktu końcowego zmieni się na "Aktywowanie". W tle Fabric uruchamia podstawową infrastrukturę kontenera do hostowania modelu. W ciągu kilku minut punkt końcowy jest gotowy do obsługi przewidywań.

Każdy punkt końcowy ma stan wskazujący, czy jest gotowy do obsługi przewidywań w czasie rzeczywistym:

Status	Opis
`Inactive`	Punkt końcowy nie jest aktywowany do obsługi przewidywań w czasie rzeczywistym i nie zużywa mocy obliczeniowej Fabric.
`Activating`	Punkt końcowy jest konfigurowany do obsługi przewidywań w czasie rzeczywistym. W tle Fabric konfiguruje infrastrukturę kontenerową do hostowania modelu. W ciągu kilku minut punkt końcowy jest aktywny.
`Active`	Punkt końcowy jest gotowy do obsługi przewidywań w czasie rzeczywistym. W tle Fabric zarządza podstawową infrastrukturą, skalując użycie zasobów w górę na podstawie ruchu przychodzącego. Większy ruch powoduje wyższe użycie pojemności Fabric.
`Deactivating`	Punkt końcowy jest dezaktywowany, aby nie obsługiwał już przewidywań w czasie rzeczywistym ani nie korzystał z pojemności Fabric. Za kulisami, Fabric rozmontowuje podstawową infrastrukturę kontenerów.

Uwaga / Notatka

Modele uczenia maszynowego mogą obsługiwać aktywne punkty końcowe dla maksymalnie pięciu wersji jednocześnie. Aby obsługiwać przewidywania z szóstej wersji, należy najpierw dezaktywować aktywny punkt końcowy.

Zarządzanie punktami końcowymi modelu

Aby uzyskać przegląd aktywnych punktów końcowych modelu, wybierz pozycję "Zarządzaj punktami końcowymi" na wstążce w interfejsie. Każdy model ma dostosowywalny domyślny punkt końcowy, który obsługuje przewidywania z wybranej wersji. Wersję domyślną można zaktualizować przy użyciu selektora rozwijanego w okienku ustawień.

Ważne

Pamiętaj, aby ustawić właściwość domyślną na aktywną wersję, jeśli planujesz jej używać. Jeśli właściwość domyślna nie jest ustawiona lub jest ustawiona na nieaktywną wersję, wywołania domyślnego punktu końcowego kończą się niepowodzeniem.

Wszystkie wersje z aktywnymi punktami końcowymi są wymienione w ustawieniach punktu końcowego modelu. Właściwość automatycznego uśpienia każdego punktu końcowego można zmodyfikować, przełączając przełącznik na wartość "Włączone" lub "Wyłączone".

Wskazówka

Aktywne punkty końcowe z włączonym automatycznym uśpieniem przechodzą w stan bezczynności po pięciu minutach bez przesyłu danych, a pierwsze wywołanie w celu ich wybudzenia powoduje krótkie opóźnienie. Możesz wyłączyć tę właściwość dla punktów końcowych w środowisku produkcyjnym.

Wykonywanie zapytań względem punktów końcowych modelu dla przewidywań w czasie rzeczywistym

Punkty końcowe modelu są dostępne do natychmiastowego testowania przy użyciu środowiska z małą ilością kodu w Fabric. Przejdź do wersji z aktywnym punktem końcowym i wybierz pozycję "Podgląd przewidywań" na wstążce interfejsu. Przykładowe żądania można wysyłać do punktu końcowego — i pobierać przykładowe przewidywania w czasie rzeczywistym — przy użyciu pól formularza, które pasują do podpisu wejściowego modelu.

Aby wypełnić pola formularza losowymi wartościami przykładowymi, wybierz pozycję "Autowypełnianie". Możesz dodać więcej zestawów wartości formularza, aby przetestować punkt końcowy z wieloma danymi wejściowymi. Wybierz "Pobierz przewidywania", aby wysłać przykładowe żądanie do adresu URL końcowego.

Jeśli wolisz formatować przykładowe żądania jako ładunki JSON, użyj selektora listy rozwijanej, aby zmienić widok.

Dezaktywowanie punktów końcowych modelu

Punkty końcowe modelu można dezaktywować bezpośrednio z interfejsu Fabric. Przejdź do wersji, która nie musi już obsługiwać przewidywań w czasie rzeczywistym, a następnie wybierz pozycję "Dezaktywuj punkt końcowy wersji" ze wstążki w interfejsie.

Komunikat typu toast pokazuje, że Fabric jest w trakcie rozmontowywania aktywnego wdrożenia, a status punktu końcowego zmienia się na "Dezaktywacja". Punkt końcowy nie jest w stanie obsługiwać przewidywań w czasie rzeczywistym, chyba że zostanie ponownie aktywowany.

Punkty końcowe dla wielu wersji można dezaktywować jednocześnie w okienku ustawień modelu. Wybierz pozycję "Zarządzaj punktami końcowymi" na wstążce w interfejsie i wybierz co najmniej jeden aktywny punkt końcowy do dezaktywowania.

Wskaźnik zużycia

Hostowanie aktywnych punktów końcowych modelu zużywa jednostki wydajności Fabric (Capacity Units, CU). Punkty końcowe działają w węzłach obliczeniowych i mogą automatycznie skalować w górę do trzech węzłów na podstawie ruchu przychodzącego. Rozliczenia są obliczane na węzeł, gdy punkt końcowy jest aktywny. W poniższej tabeli przedstawiono zużycie CU dla aktywnego punktu końcowego modelu Machine Learning.

Operacja	Jednostka operacji miary	Wskaźnik zużycia
punkt końcowy modelu	1 punkt końcowy modelu (wersja) na sekundę na węzeł	5 sekund CU

W poniższej tabeli przedstawiono przykładowe scenariusze i odpowiadające im stawki zużycia oraz koszty godzinowe.

scenariusz	Opis	Wskaźnik zużycia	Koszt godzinowy
Modele z nieaktywnymi punktami końcowymi	Te modele nie mają aktywnych punktów końcowych wersji i nie mają skojarzonego użycia zasobów. Nie wiążą się one z dodatkowymi kosztami.	0 CU sekundy	Godzina 0 CU
Modele z aktywnymi, ale bezczynnymi punktami końcowymi	Te modele mają co najmniej jeden aktywny punkt końcowy wersji, ale bez zwykłego ruchu wszystkie zostały skalowane do zera, co powoduje automatyczne obniżenie kosztów.	5 sekund CU	0,42 godziny CU
Modele z 1 aktywnym punktem końcowym i stałym niskim ruchem	Te modele mają tylko jeden aktywny punkt końcowy, który obsługuje predykcje, ale bez wystarczającego ruchu, aby wywołać pełne skalowanie. Jeden węzeł może obsłużyć cały ruch. Inne punkty końcowe wersji mogą być nieaktywne lub bezczynne.	5 sekund CU	5 godzin CU
Modele z 1 aktywnym punktem końcowym i stałym wysokim natężeniem ruchu	Te modele mają tylko 1 aktywny punkt końcowy wersji obsługujący prognozy, przy wystarczającym natężeniu ruchu, aby zainicjować pełne skalowanie poziome. Inne punkty końcowe wersji mogą być nieaktywne lub bezczynne.	15 sekund CU	15 godzin aktualizacji CU
Modele z 5 aktywnymi punktami końcowymi i dużym stałym ruchem	Te modele mają 5 aktywnych punktów końcowych wersji (bieżący limit) obsługujących przewidywania, z których każdy ma wystarczającą ilość ruchu, aby wyzwolić pełne skalowanie w poziomie.	75 sekund CU	75 godzin CU

Aplikacja metryk wydajności Fabric wyświetla łączne użycie pojemności dla operacji punktu końcowego modelu pod nazwą "Punkt końcowy modelu". Ponadto użytkownicy mogą wyświetlić podsumowanie opłat rozliczeniowych za użycie punktu końcowego modelu w ramach elementu fakturowania "ML Model Endpoint Capacity Usage CU".

Operacja punktu końcowego modelu jest klasyfikowana jako operacje w tle.

Stawki zużycia mogą ulec zmianie w dowolnym momencie. Microsoft podejmuje rozsądne starania w celu powiadomienia za pośrednictwem poczty e-mail lub powiadomienia w aplikacji. Zmiany wejdą w życie w dniu określonym w notatkach o wydaniu Microsoft lub na blogu Microsoft Fabric. Jeśli jakakolwiek zmiana punktu końcowego modelu w Fabric Wskaźnik zużycia znacznie zwiększa liczbę jednostek pojemności (CU) wymaganych do użycia, klienci mogą skorzystać z opcji anulowania dostępnych dla wybranej formy płatności.

Programowe zarządzanie punktami końcowymi i wykonywanie zapytań o nie za pomocą interfejsu API REST punktu końcowego modelu uczenia maszynowego.
Wywoływanie punktów końcowych modelu z usługi Dataflow Gen2 w celu wzbogacania danych w czasie rzeczywistym.
Generowanie przewidywań partii za pomocą funkcji PREDICT w notesach Fabric.
Dowiedz się więcej na temat trenowania i eksperymentowania modeli w Fabric.
Czy brakowało nam potrzebnej funkcji? Zasugeruj go na forum Fabric Ideas.

Opinia

Czy ta strona była pomocna?

Last updated on 2026-04-07