Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
A limitação ocorre quando as operações consomem mais unidades de computação por segundo (CUs) do que a capacidade da SKU permite. Muita limitação pode resultar em uma experiência degradada do usuário final. Um locatário do Microsoft Fabric pode criar múltiplas capacidades e atribuir espaços de trabalho a uma capacidade específica para cobrança e dimensionamento.
A limitação é aplicada no nível de capacidade, o que significa que, embora uma capacidade, ou conjunto de espaços de trabalho, possa estar enfrentando um desempenho reduzido devido à sobrecarga, outras capacidades podem continuar em execução normalmente. Nos casos em que recursos como artefatos do OneLake são produzidos em uma capacidade e consumidos por outra, o estado de limitação da capacidade de consumo determina se as chamadas para o artefato são limitadas.
Equilíbrio entre desempenho e confiabilidade
O Fabric foi projetado para oferecer um desempenho rápido aos seus clientes. Tarefas que podem levar vários minutos para serem concluídas em outras plataformas podem ser concluídas em meros segundos no Fabric. Operações grandes podem ser executadas a qualquer hora do dia sem a necessidade de um agendamento cuidadoso, pois a computação dessas operações é distribuída por um período de tempo mais longo, sem atrasar a operação. O Fabric permite isso por meio de bursting e smoothing internos. Eles permitem que as capacidades sejam autogerenciáveis e auto-recuperáveis, para que picos temporários de uso não façam com que outros sistemas falhem ou desacelerem.
Intermitências
Para garantir alto desempenho, o Fabric usa bursting para permitir que as operações sejam executadas o mais rápido possível. O bursting permite que as operações usem temporariamente mais computação do que a computação provisionada para o SKU de capacidade. Devido ao bursting, os usuários obtêm resultados rapidamente, sem precisar esperar. O bursting também permite que uma capacidade menor execute operações maiores, que normalmente exigiriam uma capacidade mais cara.
Suavizando
Para evitar penalizar os usuários quando as operações se beneficiam do bursting, o Fabric suaviza ou calcula a média do uso de unidades de capacidade de uma operação ao longo de um período maior. Esse comportamento garante que os usuários possam aproveitar um desempenho rápido e constante sem sofrer limitação.
O smoothing distribui o uso das unidades de capacidade consumidas entre os futuros pontos no tempo. Os pontos de tempo no Fabric têm 30 segundos de duração. Há 2.880 pontos no tempo nas próximas 24 horas. O Fabric gerencia automaticamente a quantidade de unidades de capacidade consumidas em cada ponto no tempo.
O tipo de utilização de uma operação determina o número de pontos de tempo usados para suavização. Saiba mais sobre as operações do Fabric.
- As operações interativas são suavizadas por no mínimo cinco minutos e até 64 minutos, dependendo do quanto consomem em unidades de capacidade.
- As operações em segundo plano são suavizadas por um período de 24 horas, pois normalmente têm longos tempos de execução e grande consumo de unidades de capacidade.
Devido ao smoothing, apenas uma parte do uso de unidades de capacidade de uma operação se aplica a qualquer ponto no tempo individual, o que reduz a limitação geral. O uso de unidades de capacidade suavizado se acumula à medida que as operações são executadas. O uso suavizado é coberto pela capacidade futura, que representa as CUs disponíveis em pontos de tempo futuros, já que a capacidade é utilizada de forma contínua.
O bursting e o smoothing funcionam juntos para facilitar o trabalho dos usuários da capacidade. Por exemplo, os usuários normalmente gastam tempo agendando trabalhos e espalhando-os ao longo do dia. Com o smoothing, o custo de computação para trabalhos em segundo plano é suavizado ao longo de 24 horas. Isso significa que os trabalhos agendados podem ser executados simultaneamente sem causar picos que, de outra forma, impediriam o início dos trabalhos. Ao mesmo tempo, os usuários podem desfrutar de um desempenho consistentemente rápido sem esperar trabalhos lentos para concluir ou desperdiçar tempo gerenciando agendas de trabalho.
Observação
Não há suporte para intermitência e suavização quando um administrador de capacidade habilita a Cobrança de Dimensionamento Automático para Spark. Nesse cenário, o uso do Spark opera em um modo de pagamento comoYou-Go e os conceitos de intermitência e suavização não se aplicam.
Limitar gatilhos e limitar estágios
Embora as capacidades tenham suavização interna que reduz o impacto dos picos de uso, ainda é possível sobrecarregar uma capacidade executando muitas operações.
A capacidade limita automaticamente novas operações quando está sobrecarregada. A limitação ocorre em etapas progressivas para minimizar o impacto em tarefas importantes, como atualizações de dados.
Mesmo quando uma capacidade está operando acima de 100% de utilização, o Fabric não aplica limitação imediatamente. Em vez disso, a capacidade oferece proteção contra excedente, que permite consumir 10 minutos de capacidade futura sem limitação. Esse comportamento oferece uma proteção interna limitada contra surtos, ao mesmo tempo em que fornece aos usuários um desempenho consistentemente rápido sem interrupções.
A limitação começa quando uma capacidade usa todos os seus recursos de unidade de capacidade para os próximos 10 minutos. A primeira fase da limitação aplica atrasos de 20 segundos a novas operações interativas. A segunda fase da limitação rejeita novas operações interativas quando uma capacidade usa todos os seus recursos de unidade de capacidade para a próxima hora. Durante essa fase, as operações em segundo plano podem ser iniciadas e executadas. A terceira fase da limitação rejeita todas as novas solicitações, interativas e em segundo plano, quando a capacidade usa todos os seus recursos de unidade de capacidade disponíveis para as próximas 24 horas. A capacidade continua a restringir solicitações até que as unidades de capacidade consumidas sejam pagas.
Observação
A Microsoft tenta melhorar a flexibilidade de clientes no uso do serviço, ao mesmo tempo em que equilibra a necessidade de gerenciar o uso da capacidade de clientes. Por esse motivo, a Microsoft pode alterar ou atualizar a política de limitação do Fabric.
A tabela resume os disparadores e estágios de limitação.
Uso | Limites de política | Impacto da experiência de política de plataforma |
---|---|---|
Uso <= 10 minutos | Proteção contra sobrecarga | Os trabalhos podem consumir 10 minutos de uso futuro da capacidade sem limitação. |
Uso de 10 minutos <<= 60 minutos | Atraso interativo | Os trabalhos interativos solicitados pelo usuário são atrasados 20 segundos no envio. |
Uso de 60 minutos <<= 24 horas | Rejeição interativa | Os trabalhos interativos solicitados pelo usuário são rejeitados. |
Uso > 24 horas | Rejeição em segundo plano | Todas as solicitações são rejeitadas. |
Exemplo de limites de suavização e limitação
Veja um exemplo ilustrativo de como a suavização funciona para uma operação em segundo plano que consumiu 1 CUHr (o uso foi equivalente a 1 unidade de capacidade por 1 hora). As operações em segundo plano são suavizadas ao longo de 24 horas. A contribuição de uma operação em segundo plano em qualquer ponto no tempo é o número de CUHrs da operação dividido pelo número de CUHrs no nível do SKU. Para um F2, esse trabalho contribuiria com 1 CUHr / 48 CUhrs = aproximadamente 2,1% para cada ponto no tempo. O impacto nas restrições de limitação de 10 minutos e 60 minutos é de aproximadamente 2,1%.
Veja os detalhes que dão suporte ao exemplo:
1 CUHr = 3.600 CUs (1 * 60 minutos por hora * 60 segundos por minuto)
Cada ponto de tempo tem 30 segundos. Em 24 horas, há 2.880 pontos de tempo (24 horas * 60 minutos * 2 pontos de tempo por minuto).
Como as 3.600 unidades de capacidade são suavizadas ao longo de 24 horas, o trabalho contribui com 3.600 CUs/2.880 pontos no tempo para cada ponto no tempo de 30 segundos. Portanto, contribui com 1,25 unidades de capacidade por ponto no tempo.
O percentual de limitação de 10 minutos é baseado no total de unidades de capacidade disponíveis nos próximos 10 minutos de atividade da capacidade.
Uma capacidade F2 tem 2 unidades de capacidade para cada segundo (ou 2 CUs). Em cada ponto de tempo, um F2 tem 2 CUs * 30 segundos = 60 CUs de computação.
A contribuição do trabalho em segundo plano para qualquer ponto no tempo individual é de 1,25 CUs/60 unidades de capacidade = aproximadamente 2,1% de um ponto no tempo individual.
Em 10 minutos, o F2 tem 2 CUs * 60 segundos * 10 minutos = 1.200 unidades de computação (CUs).
A parte do trabalho em segundo plano suavizada para os próximos 10 minutos da capacidade é 1,25 unidades de capacidade * 2 pontos no tempo por minuto * 10 minutos = 25 unidades de capacidade.
Portanto, o percentual de limitação de 10 minutos é 25 unidades de capacidade / 1.200 unidades de capacidade = aproximadamente 2,1%.
Da mesma forma, o impacto percentual de limitação de 60 minutos do trabalho em segundo plano também é de aproximadamente 2,1%.
Embora a operação em segundo plano tenha consumido mais unidades de capacidade do que as disponíveisl para os próximos 10 minutos (ela consumiu seis vezes a quantidade), a capacidade F2 não é limitada porque o total de unidades de capacidade é suavizado ao longo de 24 horas. Devido à suavização, apenas uma pequena parte das unidades de capacidade consumidas se aplica a qualquer ponto no tempo individual.
Excedentes, carryforward e burndown
Quando as operações usam mais capacidade do que a SKU dá suporte em um único ponto de tempo, uma sobrecarga é computada. Os excedentes são computados depois que a suavização é aplicada. Se houver excedentes que ultrapassem a janela de limitação de 10 minutos permitida, eles se tornarão unidades de capacidade carryforward.
A proteção contra excedentes garante que a capacidade não seja limitada até que a janela de limitação de 10 minutos esteja cheia. Ele foi projetado para reduzir a frequência de atrasos interativos devido a picos temporários na utilização.
As unidades de capacidade carryforward são aplicadas a cada ponto no tempo subsequente. Se um ponto no tempo não estiver cheio, as unidades de capacidade não usadas reduzirão a quantidade de unidades de capacidade carryforward. A redução é conhecida como burndown.
A imposição de limitação continua até que a capacidade não utilizada quite todas as unidades de capacidade carryforward.
Monitoramento de capacidades para limitação
Os administradores de capacidade podem configurar alertas de email para serem notificados quando uma capacidade consumir 100% dos seus recursos de unidade de capacidade provisionados. Os administradores também podem usar o aplicativo de métricas de capacidade para revisar os níveis de limitação da capacidade.
Dimensionamento correto e otimização de uma capacidade
Níveis de limitação consistentemente altos indicam a necessidade de balancear a carga entre várias capacidades ou de aumentar o tamanho do SKU da capacidade. Ao usar SKUs F, você pode aumentar e diminuir manualmente o tamanho do SKU a qualquer momento nas configurações de administração, o que permite resolver a limitação quando necessário.
Como saber se está havendo limitação de capacidade
Quando uma capacidade rejeita solicitações, os usuários veem códigos de erro e texto de erro específicos:
- Código de status
CapacityLimitExceeded
- Mensagem de erro
Your organization's Fabric compute capacity has excceded its limits. Try again later
. - Mensagem de erro
Cannot load model due to reaching capacity limits
Observação
Um desempenho lento é frequentemente devido ao design de um item. Nem sempre o desempenho lento é causado por limitação de capacidade.
Quando uma capacidade está sobrecarregada, um administrador de capacidade pode usar o aplicativo de métricas de capacidade do Fabric para confirmar a limitação.
- A tabela Eventos do sistema na página Computação mostra o histórico de eventos de limitação.
- Os gráficos de Limitação na página de Computação mostram quando o uso suavizado excede um dos limites de limitação.
Como interromper a limitação quando ela ocorrer
As capacidades são de autorrecuperação, portanto, você sempre pode aguardar até que o estado de sobrecarga seja resolvido antes de enviar novas solicitações.
No entanto, para interromper a limitação mais rapidamente, você pode usar as estratégias listadas abaixo.
Ao usar capacidades de SKU F, para interromper a limitação:
- Aumente temporariamente o SKU. Ao aumentar o SKU, você reduz o carryforward mais rapidamente, pois cada ponto no tempo tem mais capacidade ociosa.
- Pause e retome sua capacidade. A pausa de uma capacidade resulta em um evento de cobrança pelo uso futuro acumulado da capacidade. Quando uma capacidade é iniciada ou retomada, ela não tem nenhum uso futuro de capacidade para que possa aceitar novas operações imediatamente.
Ao usar capacidades de SKU P, para interromper a limitação:
- Habilite o Dimensionamento Automático para a capacidade P.
As operações de pré-lançamento não são limitadas
A limitação só afeta as operações solicitadas após o início da limitação da capacidade. Todas as operações, incluindo as de execução prolongada que foram enviadas antes do início da limitação, podem ser executadas até a conclusão. Esse comportamento oferece a garantia de que as operações são concluídas, mesmo durante os surtos no uso de CU.
Proteção contra limitação composta
No Fabric, uma operação geralmente dispara outros itens ou cargas de trabalho para serem concluídos. Há muitos exemplos, mas um típico é exibir um relatório. Cada visual no relatório executa uma consulta em um modelo semântico subjacente. O modelo semântico também pode ler o formulário de dados OneLake para fornecer o resultado da consulta. Cada uma dessas solicitações forma uma cadeia.
Quando há uma cadeia de chamadas, há risco de limitação composta, que ocorre quando a limitação é aplicada mais de uma vez à mesma solicitação. O Fabric tem uma proteção interna contra limitação composta que reduz a probabilidade de sua ocorrência. As cargas de trabalho podem optar por usar essa proteção.
Quando as cargas de trabalho dão suporte à proteção contra limitação composta, uma solicitação é limitada apenas uma vez para cada capacidade que participa da cadeia. A decisão de limitação ocorre quando a solicitação é iniciada e se aplica a todas as operações na cadeia.
Se uma cadeia depender de mais de uma capacidade, cada capacidade imporá sua limitação uma vez para a primeira solicitação recebida na cadeia.
As seguintes cargas de trabalho dão suporte à limitação composta:
- Modelos semânticos que se conectam a outros modelos semânticos usando a Consulta Direta.
- Consultas DAX de relatórios paginados para modelos semânticos.
O comportamento da limitação é específico para cargas de trabalho do Fabric
Embora a maioria dos produtos do Fabric siga as regras de limitação mencionadas anteriormente, há algumas exceções.
Por exemplo, os eventstreams do Fabric têm muitas operações que podem ser executadas por anos depois de serem iniciadas. A limitação de novas operações de eventstreams não faria sentido, portanto, em vez disso, a quantidade de recursos de CU alocada para manter o fluxo aberto é reduzida até que a capacidade esteja em uma boa posição novamente.
Outra exceção é a Inteligência em Tempo Real, que não seria em tempo real se as operações fossem atrasadas em 20 segundos. Como resultado, a inteligência de dados em tempo real não aplica a primeira fase de limitação com atrasos de 20 segundos em 10 minutos de capacidade futura. A inteligência de dados em tempo real aguarda até a fase de rejeição, com 60 minutos de capacidade futura, para começar a limitação. Esse comportamento garante que os usuários possam continuar a desfrutar do desempenho em tempo real mesmo durante períodos de alta demanda.
Da mesma forma, quase todas as operações na categoria Warehouse são relatadas como em segundo plano para aproveitar a suavização de 24 horas da atividade para permitir os padrões de uso mais flexíveis. Classificar todo o data warehousing como em segundo plano impede que picos de utilização de CU disparem a limitação demasiadamente rápido. Algumas solicitações podem disparar uma cadeia de operações que são controladas diferentemente. Quando uma operação interativa inicia uma cadeia que inclui uma operação em segundo plano, a operação em segundo plano pode estar sujeita à limitação como uma operação interativa.
Classificações interativas e em segundo plano para limitação e suavização
Alguns administradores podem notar que as operações às vezes são classificadas como interativas e suavizadas como em tela de fundo ou vice-versa. Essa distinção ocorre porque os sistemas de limitação do Fabric devem aplicar regras de limitação antes que uma solicitação comece a ser executada.
O sistema de limitação tenta categorizar operações com precisão no momento do envio. Às vezes, quando uma operação começa a ser executada, ficam disponíveis informações mais detalhadas que alteram a categorização. Em cenários ambíguos, o sistema de limitação recorre à classificação das operações como em segundo plano, o que favorece o usuário.
Acompanhe excessos e operações rejeitadas
Você pode ver se sua capacidade está sobrecarregada examinando o gráfico de utilização no aplicativo Métricas de Capacidade do Microsoft Fabric. Um pico que ultrapassa a linha indica uma sobreposição. Para investigar mais sobre o excedente, acesse o detalhamento até a página de ponto no tempo. Em seguida, você pode examinar suas operações interativas e em segundo plano e ver quais foram responsáveis pelos excessos.
Como horas trabalhadas superiores a 100% não significam automaticamente limitação, você precisa usar o gráfico Limitação ao avaliar excedentes. A partir daí, você pode abrir uma tabela que mostra minutos para burndown, um gráfico com as opções de adicionar, burndown e porcentagem acumulada e muito mais. Minutos para burndown estima quanto tempo o burndown levaria se não ocorressem mais operações na capacidade.
Para exibir um histórico visual de superutilização de capacidade, incluindo transferência, acumulativo e burndown de dados de horas trabalhadas, vá para a Tab Excedentes. Você pode alterar a escala visual de excedentes para exibir dez minutos, 60 minutos e 24 horas.
O drilldown do aplicativo Métricas de Capacidade do Microsoft Fabric permite que os administradores vejam operações que foram rejeitadas durante um evento de limitação. Há informações limitadas sobre essas operações, pois elas nunca foram autorizadas a iniciar. O administrador pode ver o produto, o usuário, a ID da operação e a hora em que a solicitação foi enviada. Quando uma solicitação é rejeitada, os usuários finais recebem uma mensagem de erro que solicita que eles tentem novamente mais tarde.
Computação faturável e não faturável
Quando você analisa o uso da capacidade no aplicativo de métricas de capacidade, algumas operações são faturáveis e outras não são faturáveis. Somente operações faturáveis são incluídas nos cálculos de limitação. Os recursos de visualização podem gerar operações não faturáveis. Utilize operações não faturáveis para planejar antecipadamente, garantindo que sua capacidade seja dimensionada corretamente para quando esses recursos de pré-visualização se tornarem faturáveis.
Conteúdo relacionado
- Instale o aplicativo de métricas de capacidade do Microsoft Fabric para monitorar as capacidades do Fabric.
- Como redimensionar sua capacidade.