Escalone um trabalho do Azure Stream Analytics para aumentar a largura de banda

Este artigo mostra-lhe como ajustar uma consulta de Stream Analytics para aumentar o débito de tarefas de Stream Analytics. Pode usar o guia seguinte para escalar o seu trabalho e lidar com maiores cargas e tirar partido de mais recursos do sistema (como mais largura de banda, mais recursos de CPU, mais memória).

Como pré-requisito, leia os seguintes artigos:

Caso 1 – A sua consulta é inerentemente totalmente paralelizável entre partições de entrada

Se a sua consulta for inerentemente totalmente paralelizável entre partições de entrada, pode seguir os seguintes passos:

Escreva a sua consulta de forma embaraçosamente paralela usando a palavra-chave PARTITION BY . Para obter mais informações, consulte Utilize a paralelização de consultas no Azure Stream Analytics.
Dependendo dos tipos de saída usados na sua consulta, algumas saídas podem não ser paralelizáveis ou necessitar de configuração adicional para serem embaraçosamente paralelas. Por exemplo, a saída do Power BI não é paralelizável. As saídas são sempre fundidas antes de serem enviadas para o sumidouro de saída. Blobs, Tabelas, Azure Data Lake Storage, Service Bus e Azure Function são automaticamente paralelizados. As saídas SQL e Azure Synapse Analytics têm uma opção de paralelização. Um hub de eventos precisa de ter a configuração PartitionKey definida para corresponder ao campo PARTITION BY (normalmente PartitionId). Para os Event Hubs, preste também atenção extra para corresponder o número de partições para todas as entradas e todas as saídas, evitando o cruzamento entre partições.
Executa a sua consulta com 1 unidade de streaming (SU) V2 (que é a capacidade total de um único nó de computação) para medir o débito máximo alcançável, e se estiver a utilizar GROUP BY, meça quantos grupos (cardinalidade) o trabalho consegue gerir. Os sintomas gerais quando o trabalho atinge os limites de recursos do sistema são os seguintes.
- A métrica de utilização da unidade de fluxo (SU) % é superior a 80%. Indica que o uso de memória é elevado. Os fatores que contribuem para o aumento desta métrica são descritos em Compreensão e ajuste das unidades de streaming do Stream Analytics.
- O carimbo temporal de saída está a ficar atrasado em relação ao tempo do relógio de parede. Dependendo da lógica da consulta, o timestamp de saída pode ter um desfasamento lógico em relação ao tempo do relógio. No entanto, deverão progredir aproximadamente ao mesmo ritmo. Se o carimbo temporal de saída estiver a ficar progressivamente atrasado, é um indicador de que o sistema está a trabalhar excessivamente. Pode ser resultado de uma limitação de fluxo de saída a jusante ou de uma elevada utilização da CPU. Neste momento não fornecemos métricas de utilização de CPU, por isso pode ser difícil diferenciar os dois.
  - Se o problema for devido ao throttling do sink, é necessário aumentar o número de partições de saída (e também partições de entrada para manter o job totalmente paralelizável), ou aumentar a quantidade de recursos do sink (por exemplo, o número de Request Units para o Cosmos DB).
- No diagrama de tarefas, há uma métrica de eventos de atraso por partição para cada entrada. Se a métrica de eventos do backlog continuar a aumentar, é também um indicador de que os recursos do sistema estão sobrecarregados (seja devido à limitação do escape de saída, seja por alta utilização da CPU).
Depois de determinar os limites do que um trabalho V2 de um SU pode alcançar, pode extrapolar linearmente a capacidade de processamento do trabalho à medida que adiciona mais SUs, assumindo que não tem qualquer desvio de dados que torne certa partição "quente".

Observação

Escolha o número certo de unidades de streaming: Como o Stream Analytics cria um nó de processamento para cada 1 SU V2 adicionado, é melhor fazer do número de nós um divisor do número de partições de entrada, para que as partições possam ser distribuídas uniformemente entre os nós. Por exemplo, mediu que o seu trabalho de 1 SU na versão V2 pode atingir uma taxa de processamento de 4 MB/s e conta com 4 partições de entrada. Pode optar por executar o seu trabalho com 2 SU V2 para alcançar uma taxa de processamento de cerca de 8 MB/s, ou 4 SU V2 para atingir 16 MB/s. Depois, podes decidir quando aumentar o número de SU para o trabalho e para qual valor, em função da tua taxa de entrada.

Caso 2 - Se a sua consulta não for embaraçosamente paralela.

Se a sua consulta não for embaraçosamente paralela, pode seguir estes passos.

Comece primeiro com uma consulta sem PARTITION BY para evitar complexidade de partição, e execute a sua consulta com 1 SU V2 para medir a carga máxima, como no Caso 1.
Se conseguir atingir a carga prevista em termos de rendimento, está feito. Alternativamente, podes optar por medir o mesmo trabalho a correr com nós fracionados a 2/3 SU V2 e 1/3 SU V2, para descobrir o número mínimo de unidades de streaming que funciona para o teu cenário.
Caso não consiga atingir o throughput desejado, tente dividir a sua consulta em várias etapas, caso ainda não tenha várias, e aloque até um SU V2 para cada etapa da consulta. Por exemplo, se tiveres três etapas, aloca três SU V2 na opção "Escala".
Para executar este tipo de tarefa, o Stream Analytics coloca cada etapa no seu próprio nó com um recurso SU V2 dedicado.
Se ainda não atingiu o seu objetivo de carga, pode tentar usar PARTITION BY a partir dos passos mais próximos da entrada. Para o operador GROUP BY que não é naturalmente particionável, pode usar o padrão de agregação local/global para realizar um GROUP BY particionado seguido de um GROUP BY não particionado. Por exemplo, se quiseres contar quantos carros passam por cada portagem a cada 3 minutos, e o volume de dados ultrapassa o que pode ser processado por um SU V2.

Consulta:

WITH Step1 AS (
SELECT COUNT(*) AS Count, TollBoothId, PartitionId
FROM Input1 Partition By PartitionId
GROUP BY TumblingWindow(minute, 3), TollBoothId, PartitionId
)
SELECT SUM(Count) AS Count, TollBoothId
FROM Step1
GROUP BY TumblingWindow(minute, 3), TollBoothId

Na consulta, estás a contar carros por portagem por partição, e depois somas a contagem de todas as partições juntas.

Uma vez particionada, para cada partição do passo, aloca um SU V2 para que cada partição possa ser colocada no seu próprio nó de processamento.

Observação

Se a sua consulta não puder ser particionada, adicionar SU adicional numa consulta com múltiplos passos nem sempre pode melhorar o throughput. Uma forma de obter desempenho é reduzir o volume nos passos iniciais usando um padrão agregado local/global, conforme descrito no passo 5.

Caso 3 - Estás a fazer muitas consultas independentes num trabalho.

Para certos casos de uso de ISV, onde é mais rentável processar dados de múltiplos inquilinos num único trabalho, usando entradas e saídas separadas para cada inquilino, acabas por executar bastantes (por exemplo, 20) consultas independentes num único trabalho. A suposição é que a carga de cada subconsulta é relativamente pequena.

Neste caso, pode seguir estes passos.

Neste caso, não use PARTITION BY na consulta
Reduz a contagem de partições de entrada para o valor mais baixo possível, 2, se estiveres a usar Event Hubs.
Executa a consulta com um SU V2. Com a carga esperada para cada subconsulta, adicione o maior número possível dessas subconsultas, até que o trabalho atinja os limites de recursos do sistema. Consulte o Caso 1 para os sintomas que ocorrem quando isso acontece.
Quando atingir o limite de subquery medido, comece a adicionar a subquery a um novo trabalho. O número de tarefas a executar em função do número de consultas independentes deve ser bastante linear, assumindo que não tens qualquer desvio de carga. Depois podes prever quantos empregos SU V2 precisas de executar em função do número de inquilinos que gostarias de servir.
Ao usar dados de referência em tais consultas, una as entradas antes de juntar aos mesmos dados de referência. Depois, separe os eventos se necessário. Caso contrário, cada junção de dados de referência mantém uma cópia dos dados de referência na memória, o que provavelmente resulta em um uso excessivo e desnecessário de memória.

Observação

Quantos inquilinos colocar em cada trabalho? Este padrão de consulta tem frequentemente um grande número de subconsultas e resulta numa topologia muito grande e complexa. O controlador do trabalho pode não ser capaz de lidar com uma topologia tão grande. Como regra geral, mantenha-se abaixo dos 40 inquilinos para um trabalho V2 com 1/3 de SU, e 60 inquilinos para empregos V2 com 2/3 e 1 SU. Quando ultrapassa a capacidade do controlador, o trabalho não começa com êxito.

Obter ajuda

Para obter mais assistência, experimente a nossa página de perguntas e respostas da Microsoft para o Azure Stream Analytics.

Próximos passos

Comentários

Esta página foi útil?

Last updated on 2026-02-26

Escalone um trabalho do Azure Stream Analytics para aumentar a largura de banda

Caso 1 – A sua consulta é inerentemente totalmente paralelizável entre partições de entrada

Caso 2 - Se a sua consulta não for embaraçosamente paralela.

Caso 3 - Estás a fazer muitas consultas independentes num trabalho.

Obter ajuda

Próximos passos

Comentários

Recursos adicionais