Zasady ograniczania sieci szkieletowej

2025-04-30

Zjawisko ograniczania występuje, gdy operacje zużywają więcej jednostek obliczeniowych w sekundach (CU) niż pozwala na to wybrana specyfikacja SKU pojemności. Zbyt duże ograniczenie przepustowości może spowodować obniżenie wydajności środowiska użytkownika końcowego. Dzierżawa usługi Microsoft Fabric może tworzyć wiele pojemności i przypisywać obszary robocze do określonej pojemności na potrzeby rozliczeń i rozmiarów.

Ograniczanie przepustowości jest stosowane na poziomie pojemności, co oznacza, że podczas gdy jedna pojemność lub zestaw obszarów roboczych mogą mieć obniżoną wydajność z powodu przeciążenia, inne pojemności mogą nadal działać normalnie. W przypadkach, gdy funkcje takie jak artefakty OneLake są generowane w jednej pojemności i używane przez inną, stan ograniczania pojemności zużywającej określa, czy wywołania artefaktu są ograniczane.

Równowaga między wydajnością a niezawodnością

Infrastruktura sieciowa została zaprojektowana, aby zapewnić klientom szybkie działanie. Zadania, które na innych platformach mogą zająć kilka minut, na Fabric ukończą się w zaledwie kilka sekund. Duże operacje mogą być uruchamiane w dowolnym momencie dnia bez konieczności starannego planowania, ponieważ obliczenia dla tych operacji są rozłożone na dłuższy czas bez spowalniania operacji. Sieć szkieletowa umożliwia korzystanie z wbudowanych mechanizmów skalowania i wygładzania. Umożliwiają one samodzielne zarządzanie pojemnościami i samonaprawienie, gdy tymczasowe skoki użycia w przeciwnym razie spowodują awarię lub spowolnienie innych systemów.

Zwielokrotnienie wydajności

Aby zapewnić szybką wydajność, Fabric wykorzystuje dynamiczne zwiększanie zasobów, aby operacje mogły wykonywać się tak szybko, jak to możliwe. Przebijanie umożliwia operacjom tymczasowe użycie większej ilości mocy obliczeniowej niż przydzielona moc obliczeniowa dla SKU pojemności. Ze względu na wzrost wydajności użytkownicy szybko uzyskują wyniki bez oczekiwania. Bursting umożliwia także mniejszą pojemność do uruchamiania większych operacji, które normalnie wymagałyby droższej pojemności.

Wygładzanie

Aby uniknąć karania użytkowników, gdy operacje korzystają z gwałtownego zwiększenia zasobów, Fabric wygładza lub uśrednia użycie CU operacji w dłuższym przedziale czasu. To zachowanie gwarantuje, że użytkownicy mogą cieszyć się spójną szybką wydajnością bez ograniczania przepustowości.

Smoothing rozkłada wykorzystanie CU w przyszłych punktach czasu. Punkty czasowe w Fabric mają długość 30 sekund. W ciągu najbliższych 24 godzin istnieje 2880 punktów czasu. Sieć szkieletowa automatycznie zarządza ilością zużywanych jednostek CU w każdym punkcie czasu.

Typ wykorzystania operacji określa liczbę punktów czasu używanych do wygładowywania. Dowiedz się więcej o operacjach technologii Fabric.

Działanie interaktywne są zoptymalizowane przez co najmniej pięć minut, a maksymalnie do 64 minut, w zależności od ilości zużytej mocy CU.
Operacje w tle są wygładzane w okresie 24 godzin, ponieważ zwykle mają długie czasy działania i duże zużycie jednostek obliczeniowych CU.

Ze względu na wygładzanie, tylko część użycia CU dla operacji ma zastosowanie do dowolnego pojedynczego punktu czasu, co zmniejsza ogólne ograniczenie przepustowości. Wygładzone użycie CU gromadzi się podczas działania operacji. Wygładzone użycie jest opłacane przez przyszłą pojemność, która jest dostępna w przyszłych momentach czasowych, ponieważ pojemność działa ciągle.

Zwiększanie przepustowości i wygładzanie współpracują ze sobą, aby ułatwić użytkownikom zarządzającym pojemnością wykonywanie pracy. Na przykład użytkownicy zwykle poświęcają czas na planowanie zadań i rozłożenie ich w ciągu dnia. Dzięki rozłożeniu kosztów obliczeń zadania w tle są równomiernie rozłożone na 24 godziny. Oznacza to, że zaplanowane zadania mogą być uruchamiane jednocześnie bez powodowania żadnych skoków, które mogłyby w przeciwnym razie blokować uruchamianie zadań. Jednocześnie użytkownicy mogą cieszyć się spójną i szybką wydajnością bez oczekiwania na ukończenie powolnych zadań lub tracenia czasu na zarządzanie harmonogramami zadań.

Uwaga

Zwiększanie i wygładzenie nie jest obsługiwane, gdy administrator pojemności włączył rozliczanie automatycznego skalowania dla platformy Spark. W tym scenariuszu użycie Spark działa w trybie Pay-As-You-Go, a pojęcia przebijania i wygładzania nie mają zastosowania.

Wyzwalacze ograniczania i etapy ograniczania

Mimo że pojemności mają wbudowany mechanizm wygładzania, który zmniejsza wpływ skoków użycia, nadal można przeciążyć pojemność, uruchamiając zbyt wiele operacji.

Pojemność automatycznie przyhamowuje nowe operacje, gdy jest przeciążona. Ograniczanie odbywa się stopniowo w celu zminimalizowania wpływu na ważne zadania, takie jak odświeżanie danych.

Nawet jeśli pojemność działa powyżej 100% wykorzystania, sieć szkieletowa nie stosuje natychmiast ograniczania przepustowości. Zamiast tego pojemność zapewnia ochronę nadwyżkową , która umożliwia korzystanie z 10 minut przyszłej pojemności bez ograniczania przepustowości. To zachowanie zapewnia ograniczoną wbudowaną ochronę przed przepięciami, zapewniając jednocześnie użytkownikom spójną szybką wydajność bez zakłóceń.

Ograniczanie rozpoczyna się, gdy pojemność zużywa wszystkie zasoby CU przez następne 10 minut. Pierwsza faza ograniczania dotyczy opóźnienia o 20 sekund dla nowych interaktywnych operacji. W drugiej fazie ograniczania odrzucane są nowe operacje interakcyjne, gdy pojemność zużyje wszystkie swoje zasoby jednostek obliczeniowych (CU) na nadchodzącą godzinę. Na tym etapie mogą być uruchamiane i prowadzone operacje w tle. Trzecia faza ograniczania poprzez odrzucanie wszystkich nowych żądań, zarówno interakcyjnych, jak i w tle, następuje, kiedy pojemność wykorzysta wszystkie dostępne zasoby CU na następne 24 godziny. Wydajność nadal ogranicza żądania do momentu wyrównania zużytych zasobów CU.

Uwaga

Firma Microsoft stara się zwiększyć elastyczność klienta w korzystaniu z usługi, równoważąc konieczność zarządzania użyciem pojemności klienta. Z tego powodu firma Microsoft może zmienić lub zaktualizować zasady ograniczania sieci szkieletowej.

Tabela zawiera podsumowanie wyzwalaczy i etapów ograniczania przepustowości.

Użycie	Limity zasad	Wpływ na środowisko zasad platformy
Użycie <= 10 minut	Ochrona przed nadwyżkami	Zadania mogą zużywać 10 minut przyszłego użycia pojemności bez ograniczania przepustowości.
Użycie 10 minut <<= 60 minut	Opóźnienie interakcyjne	Zadania interakcyjne żądane przez użytkownika są opóźnione o 20 sekund podczas przesyłania.
Użycie 60 minut <<= 24 godziny	Odrzucenie interakcyjne	Zadania interakcyjne żądane przez użytkownika są odrzucane.
Użycie > 24 godziny	Odrzucenie w tle	Wszystkie żądania są odrzucane.

Przykład ograniczeń wygładzania i kontrolowania

Oto ilustracyjny przykład, jak wygładzanie działa w przypadku jednej operacji w tle, która zużyła 1 CUHr (co odpowiadało 1 CU przez 1 godzinę). Operacje w tle są płynnie dostosowywane w ciągu 24 godzin. Wkład operacji w tle w dowolnym momencie to # CUHrs dla operacji / # CUHrs na poziomie jednostki SKU. W przypadku F2 to zadanie dodaje 1 CUHr / 48CUhrs = ~2,1% do każdego punktu czasowego. Wpływ na limity dławienia 10-minutowe i 60-minutowe wynosi ok. 2,1%.

Oto szczegóły wspierające przykład:

1 CUHr = 3600 jednostek CU (1 CU * 60 minut na godzinę * 60 sekund na minutę)

Każdy punkt czasu to 30 sekund długości. W ciągu 24 godzin istnieją 2880 punktów czasu (24 godziny * 60 minut * 2 punkty czasu na minutę).

Ponieważ 3600 jednostek CU jest wygładzanych w ciągu 24 godzin, zadanie wnosi 3600 jednostek CU/2880 chwil czasowych do każdego 30-sekundowego momentu. W związku z tym wnosi 1,25 jednostek CU na każdą jednostkę czasu.

10-minutowa procentowa wartość dławienia jest oparta na łącznej liczbie jednostek CU dostępnych w ciągu najbliższych 10 minut czasu aktywności pojemności.

Pojemność F2 ma 2 CU na każdą sekundę (czyli 2 jednostki CU). W każdym punkcie czasu jednostka F2 ma 2 jednostki CU * 30 sekund = 60 jednostek CU mocy obliczeniowej.

Wkład zadania w tle do dowolnego punktu czasowego wynosi 1,25 CU/60 CU = ~2,1% danego punktu czasowego.

W ciągu 10 minut F2 ma 2 CU * 60 sekund * 10 minut = 1200 CU obliczeniowych.

Część zadania w tle, która została wygładzona w ciągu najbliższych 10 minut pojemności, wynosi 1,25 jednostek CUs * 2 punkty czasowe na minutę * 10 minut = 25 jednostek CUs.

Dlatego 10-minutowy wskaźnik ograniczania wynosi 25 jednostek CU / 1200 jednostek CU = ~2,1%.

Podobnie, procentowy wpływ 60-minutowego ograniczania zadania w tle wynosi również ok. 2,1%.

Mimo że operacja w tle zużywała więcej jednostek CU, niż jest dostępnych w następnym 10-minutowym przedziale czasowym (zużywała sześć razy większą ilość), pojemność F2 nie jest ograniczana, ponieważ łączna liczba jednostek CU jest wyrównywana przez 24 godziny. Ze względu na wygładzenie tylko niewielka część zużytych jednostek CU ma zastosowanie do dowolnego indywidualnego punktu czasu.

Nadwyżki, przeniesienie i burndown wykres

Gdy operacje wykorzystują większą pojemność niż obsługuje SKU w danym momencie, obliczana jest nadwyżka. Nadwyżki są obliczane po zastosowaniu wygładzenia. Jeśli występują nadwyżki przekraczające dozwolone okno 10-minutowego ograniczania przepustowości, stają się przeniesionymi CU.

Ochrona nadwyżkowa zapewnia, że pojemność nie ogranicza się do momentu zapełnienia 10-minutowego okna ograniczania przepustowości. Zaprojektowano go tak, aby zmniejszyć częstotliwość opóźnień interaktywnych spowodowanych tymczasowymi wzrostami wykorzystania.

Jednostki CU przeniesienia są stosowane do każdego kolejnego momentu czasowego. Jeśli punkt czasu nie jest pełny, nieużywane jednostki CU zmniejszają liczbę przenoszonych jednostek CU. Redukcja jest określana jako wypalenie.

Egzekwowanie ograniczania przepustowości będzie kontynuowane do momentu, aż niewykorzystana pojemność spłaci wszystkie przeniesione jednostki CU.

Monitorowanie pojemności na potrzeby ograniczania przepustowości

Administratorzy pojemności mogą konfigurować alerty e-mail, aby otrzymywać powiadomienia, gdy pojemność zużywa 100% z przydzielonych zasobów jednostek przeliczeniowych (CU). Administratorzy mogą również używać aplikacji metryk pojemności do przeglądania poziomów ograniczania wydajności dla ich pojemności.

Dostosowywanie rozmiaru i optymalizowanie pojemności

Stale wysokie poziomy ograniczania wskazują na konieczność równoważenia obciążenia w wielu pojemnościach lub zwiększenie rozmiaru jednostki SKU pojemności. W przypadku korzystania z F SKU możesz ręcznie zwiększać i zmniejszać ich rozmiar w dowolnym momencie w ustawieniach administracyjnych, aby rozwiązać problemy z ograniczeniami gdy jest to konieczne.

Jak stwierdzić, że występuje ograniczanie wydajności

Gdy pojemność odrzuca żądania, użytkownicy widzą określone kody błędów i tekst błędu:

Kod stanu CapacityLimitExceeded
Komunikat o błędzie Your organization's Fabric compute capacity has excceded its limits. Try again later.
Komunikat o błędzie Cannot load model due to reaching capacity limits

Uwaga

Niska wydajność, jeśli często wynika z projektu elementu. Tylko czasami niska wydajność wynika z ograniczania pojemności.

Gdy pojemność jest przeciążona, administrator pojemności może użyć aplikacji do zarządzania pojemnością sieci Fabric, aby potwierdzić ograniczenie.

Tabela zdarzeń systemowych na stronie Obliczenia zawiera historię zdarzeń ograniczania przepustowości.
Wykresy ograniczania przepustowości na stronie Obliczenia pokazują, kiedy wygładzone użycie przekracza jeden z limitów ograniczania przepustowości.

Jak zatrzymać ograniczanie przepustowości w przypadku wystąpienia

Pojemności są samopodnoszące, więc zawsze można poczekać, aż stan przeciążenia minie, zanim prześlesz nowe żądania.

Jednak aby szybciej zatrzymać spowalnianie, możesz użyć strategii wymienionych poniżej.

W przypadku korzystania z pojemności SKU typu F, aby zatrzymać limitowanie przepustowości:

Tymczasowo zwiększ SKU. Zwiększając liczbę jednostek SKU, szybciej redukujesz przenoszone zadania, ponieważ każdy moment ma większą rezerwę mocy produkcyjnej.
Wstrzymaj, a następnie wznów zdolność. Wstrzymanie pojemności powoduje wystąpienie zdarzenia rozliczeniowego dla skumulowanego użycia pojemności w przyszłości. Gdy pojemność jest uruchamiana lub wznawiana, ma zerowe użycie pojemności w przyszłości, dzięki czemu może od razu akceptować nowe operacje.

W przypadku korzystania z pojemności jednostki SKU P, aby zatrzymać ograniczanie przepustowości:

Włącz automatyczne skalowanie dla pojemności P.

Operacje w locie nie są ograniczane

Ograniczanie przepływności wpływa tylko na operacje żądane po rozpoczęciu ograniczania pojemności. Wszystkie operacje, w tym długotrwałe, które zostały przesłane przed rozpoczęciem ograniczania przepustowości, mogą zostać uruchomione do ukończenia. To zachowanie zapewnia pewność, że operacje są wykonywane, nawet podczas wzrostów użycia aktualizacji cu.

Złożona ochrona przed ograniczaniem przepustowości

W Fabric jedna operacja często inicjuje ukończenie innych elementów lub zadań. Istnieje wiele przykładów, ale typowym przykładem jest wyświetlenie raportu. Każda wizualizacja w raporcie uruchamia zapytanie względem bazowego modelu semantycznego. Model semantyczny może również odczytywać formularz danych OneLake, aby podać wynik zapytania. Każde z tych żądań tworzy łańcuch.

Jeśli występuje łańcuch wywołań, istnieje ryzyko złożonego limitowania, polegającego na stosowaniu limitowania więcej niż raz do tego samego żądania. Fabric ma wbudowaną ochronę przed złożonym ograniczaniem przepustowości, która zmniejsza prawdopodobieństwo wystąpienia takiego ograniczania. Obciążenia mogą zdecydować się na korzystanie z tej ochrony.

Gdy obciążenia obsługują ochronę ograniczenia złożonego, żądanie jest ograniczane tylko raz dla każdego zasobu, który uczestniczy w łańcuchu. Decyzja o ograniczeniu występuje, gdy żądanie zostaje zainicjowane i ma zastosowanie do wszystkich operacji w łańcuchu operacji.

Jeśli łańcuch opiera się na więcej niż jednej zdolności, każda zdolność nakłada swoje ograniczenie raz dla pierwszego otrzymanego żądania w łańcuchu.

Następujące środowiska obciążeń obsługują ograniczanie złożone:

Semantyczne modele łączące się z innymi modelami semantycznymi przy użyciu zapytania bezpośredniego.
Zapytania języka DAX z raportów stronicowanych do modeli semantycznych.

Zachowanie ograniczania jest specyficzne dla obciążeń Fabric

Chociaż większość produktów sieci szkieletowej jest przestrzegana wcześniej wymienionych reguł ograniczania przepustowości, istnieją pewne wyjątki.

Na przykład strumienie zdarzeń sieci szkieletowej mają wiele operacji, które mogą być uruchamiane przez lata po ich uruchomieniu. Ograniczanie przepływności nowych operacji strumienia zdarzeń nie miałoby sensu, więc zamiast tego ilość zasobów CU przydzielonych do utrzymania otwartego strumienia jest zmniejszana do momentu ponownego wystąpienia pojemności.

Innym wyjątkiem jest analiza w czasie rzeczywistym, która nie byłaby w czasie rzeczywistym, gdyby operacje były opóźnione o 20 sekund. W związku z tym Real-Time Intelligence nie stosuje pierwszego etapu ograniczania, który obejmuje 20-sekundowe opóźnienia, przy 10 minutach przyszłej wydajności. Real-Time Analiza czeka na fazę odrzucenia na 60 minut przyszłej pojemności, aby rozpocząć ograniczanie przepustowości. To zachowanie gwarantuje, że użytkownicy mogą nadal korzystać z wydajności w czasie rzeczywistym nawet w okresach wysokiego zapotrzebowania.

Podobnie prawie wszystkie operacje w kategorii Magazyn są zgłaszane jako tło , aby skorzystać z 24-godzinnego wygładania działania, aby umożliwić najbardziej elastyczne wzorce użycia. Klasyfikowanie wszystkich hurtowni danych jako zaplecze zapobiega zbyt szybkiemu wyzwalaniu ograniczania przepustowości przez szczyty wykorzystania jednostek obliczeniowych (CU). Niektóre żądania mogą wyzwalać łańcuch operacji, które są ograniczane inaczej. Gdy operacja interaktywna uruchamia łańcuch zawierający operację w tle, operacja w tle może zostać poddana ograniczaniu jako operacja interaktywna.

Klasyfikacje interakcyjne i w tle na potrzeby ograniczania i wygładzania

Niektórzy administratorzy mogą zauważyć, że operacje są czasami klasyfikowane jako interaktywne i wygładzone jako tło lub na odwrót. Dzieje się tak, ponieważ systemy ograniczania przepustowości sieci szkieletowej muszą stosować reguły ograniczania, zanim żądanie zacznie działać.

System ograniczania próbuje dokładnie kategoryzować operacje po przesłaniu. Czasami, gdy operacja zaczyna być wykonywana, bardziej szczegółowe informacje stają się dostępne, które zmieniają kategoryzację. W niejednoznacznych scenariuszach system ograniczania przepływności wraca do klasyfikowania operacji w tle, co jest w najlepszym interesie użytkownika.

Śledzenie nadwyżek i odrzuconych operacji

Możesz sprawdzić, czy pojemność jest przeciążona, przeglądając wykres Wykorzystania w aplikacji Microsoft Fabric Capacity Metrics. Pik, który przechodzi przez linię, wskazuje nadwyżkę. Aby dokładniej zbadać nadwyżkę, przejdź do strony punktu czasu. Następnie możesz przejrzeć zarówno operacje interakcyjne, jak i operacje w tle oraz sprawdzić, które z nich były odpowiedzialne za nadwyżki.

Ponieważ użycie przekraczające 100% nie oznacza automatycznego ograniczania przepustowości, należy użyć wykresu Ograniczanie przepustowości podczas oceniania nadwyżki. Z tego miejsca możesz otworzyć tabelę, w której można wyświetlić kilka minut, wykres z dodawaniem, wypaleniem i skumulowanym procentem i nie tylko. W minutach na spalenie szacuje, jak długo będzie trwać spalenie, jeśli w pojemności nie wystąpi więcej operacji.

Aby wyświetlić wizualną historię dowolnego nadmiernego wykorzystania zasobów, w tym przenoszenia, skumulowanych danych oraz redukcji zużycia, przejdź do karty Nadwyżki. Możesz zmienić skalę nadwyżki, aby wizualizować dane w przedziałach 10 minut, 60 minut i 24 godziny.

Przechodzenie do szczegółów aplikacji Metryki pojemności usługi Microsoft Fabric umożliwia administratorom wyświetlanie operacji, które zostały odrzucone podczas zdarzenia ograniczania przepustowości. Istnieją ograniczone informacje o tych operacjach, ponieważ nigdy nie mogły rozpocząć. Administrator może zobaczyć produkt, użytkownika, identyfikator operacji i czas przesłania żądania. Gdy żądanie zostanie odrzucone, użytkownicy końcowi otrzymają komunikat o błędzie z prośbą o ponowną próbę później.

Podlegające i niepodlegające rozliczeniu zasoby obliczeniowe

Podczas przeglądania użycia pojemności w aplikacji metryk pojemności niektóre operacje są rozliczane, a inne nie są rozliczane. Tylko rozliczane operacje są uwzględniane w obliczeniach ograniczania przepustowości. Funkcje wersji zapoznawczej mogą generować operacje nierozliczane. Użyj operacji bez rozliczeń, aby zaplanować z wyprzedzeniem, aby pojemność mogła być prawidłowo ustawiana, gdy te funkcje w wersji zapoznawczej staną się rozliczane.

Zainstaluj aplikację Metryki pojemności usługi Microsoft Fabric , aby monitorować pojemności usługi Fabric.
Jak zmienić rozmiar pojemności.

Udostępnij za pośrednictwem

Zasady ograniczania sieci szkieletowej

Równowaga między wydajnością a niezawodnością

Zwielokrotnienie wydajności

Wygładzanie

Wyzwalacze ograniczania i etapy ograniczania

Przykład ograniczeń wygładzania i kontrolowania

Nadwyżki, przeniesienie i burndown wykres

Monitorowanie pojemności na potrzeby ograniczania przepustowości

Dostosowywanie rozmiaru i optymalizowanie pojemności

Jak stwierdzić, że występuje ograniczanie wydajności

Jak zatrzymać ograniczanie przepustowości w przypadku wystąpienia

Operacje w locie nie są ograniczane

Złożona ochrona przed ograniczaniem przepustowości

Zachowanie ograniczania jest specyficzne dla obciążeń Fabric

Klasyfikacje interakcyjne i w tle na potrzeby ograniczania i wygładzania

Śledzenie nadwyżek i odrzuconych operacji

Podlegające i niepodlegające rozliczeniu zasoby obliczeniowe

Powiązana zawartość

Opinia

Dodatkowe zasoby