Diretrizes de dimensionamento de máquina virtual do host de sessão para a Área de Trabalho Virtual do Azure e os Serviços de Área de Trabalho Remota

Aplica-se a: ✅ Windows Server 2025, ✅ Windows Server 2022, ✅ Windows Server 2019, ✅ Windows Server 2016, ✅ Windows 11, ✅ Windows 10

O dimensionamento do host de sessão para a Área de Trabalho Virtual do Azure e os Serviços de Área de Trabalho Remota requer uma consideração cuidadosa dos tipos de carga de trabalho e das configurações de hardware. Diferentes tipos de cargas de trabalho exigem configurações de hardware diferentes para garantir o desempenho ideal.

Há dois tipos de hosts de sessão a serem considerados ao dimensioná-los adequadamente para os usuários:

Sessão única: dedicada a um único usuário por vez.
Várias sessões: compartilhadas entre vários usuários simultaneamente.

Em um ambiente em que áreas de trabalho e aplicativos são acessados remotamente, a execução e o processamento de dados ocorrem no host da sessão, a menos que os aplicativos ofereçam suporte ao descarregamento local. Dimensionar corretamente cada host de sessão e o número de hosts de sessão é importante para que você não fique sem recursos computacionais durante cargas de pico, o que, caso contrário, levaria à interrupção das atividades dos usuários.

Os hosts de sessão podem ser executados em máquinas virtuais ou em hardware físico para os serviços de área de trabalho remota. As máquinas virtuais têm alguma sobrecarga, portanto, você deve considerar isso ao dimensionar seus hosts de sessão, o que é abordado neste artigo.

Os exemplos neste artigo são diretrizes genéricas e você só deve usá-las para estimativas de desempenho iniciais. Para obter a melhor experiência possível, dimensione sua implantação dependendo das necessidades dos usuários.

Planejamento de capacidade

A capacidade e os recursos que você precisa fornecer são diferentes para todos, pois dependem de muitos fatores contribuintes. O planejamento de capacidade é o processo de determinar os hosts de sessão e seus recursos necessários para atender às demandas de carga de trabalho esperadas. Envolve analisar as necessidades atuais e futuras de recursos, estimar o número de usuários por host de sessão e determinar os tamanhos apropriados para garantir o desempenho ideal.

Ao planejar a capacidade para hosts de sessão, considere as seguintes áreas:

Area	DESCRIÇÃO
Carga de trabalho do usuário	Entenda os tipos de aplicativos e tarefas que os usuários executam. Cargas de trabalho diferentes têm requisitos de recursos variados, como CPU, memória e armazenamento.
Contagem de usuários	Estimar o número de usuários simultâneos que acessam os hosts de sessão. Isso ajuda a determinar os recursos necessários para dar suporte à carga de usuário esperada.
Requisitos de recursos	Analise os requisitos de recursos dos aplicativos e tarefas que os usuários executam. Isso inclui CPU, memória, armazenamento e largura de banda de rede.
Expectativas de desempenho	Defina as expectativas de desempenho para os hosts de sessão, como tempo de resposta, tempo de logon, hora de inicialização do aplicativo e experiência geral do usuário. Considere o desempenho de logon para horários-chave, como o início de um dia de trabalho ou turno, já que isso pode afetar o desempenho em comparação com um estado normal.
Escalabilidade	Considere a capacidade de dimensionar os hosts de sessão à medida que as demandas do usuário aumentam. Isso pode envolver a adição de mais hosts de sessão ou redimensionamento dos existentes para acomodar usuários ou cargas de trabalho extras.
Resiliência e redundância	Considere implementar mecanismos de redundância e failover para garantir alta disponibilidade e minimizar o tempo de inatividade se houver falhas de hardware ou software.
Monitoramento e otimização	Implemente ferramentas de monitoramento para acompanhar a utilização de recursos e as métricas de desempenho. Use esses dados para otimizar os hosts de sessão e fazer ajustes contínuos conforme necessário.

As duas abordagens a seguir são comumente usadas para ajudá-lo a determinar a capacidade dos hosts de sessão:

Abordagem piloto: implantar um único servidor de teste e aumentar gradualmente a carga enquanto monitora os comentários do usuário e indicadores de desempenho do sistema, como CPU, paginação, disco e rede. Essa abordagem é confiável para implantações menores, mas pode exigir investimentos iniciais de hardware que podem não atender às metas finais de implantação.
Abordagem de simulação: use ferramentas de automação para gerar cargas de trabalho de usuário simuladas que imitam o comportamento real do usuário. Normalmente, a simulação envolve aumentar gradualmente o número de usuários simulados ao longo do tempo e as métricas de desempenho são coletadas durante todo o teste. A análise ajuda a identificar o ponto em que o desempenho degrada além dos limites aceitáveis. Essa abordagem é mais adequada para implantações maiores em que a determinação precisa da capacidade influencia significativamente as decisões de compra.

O piloto tende a ser mais eficiente em termos de tempo e custo para implantações menores, enquanto a abordagem de simulação pode ser mais adequada para implantações maiores, em que determinar com precisão a capacidade do anfitrião de sessão pode influenciar significativamente as decisões de compra.

Seja qual for a abordagem usada, você também precisa considerar os horários-chave para o logon do usuário, como o início de um dia de trabalho ou turno, que pode afetar o desempenho em comparação com um estado estável e causar longos tempos de logon. Um host de sessão pode ser capaz de dar suporte a usuários suficientes para um determinado cenário, mas pode não ter a capacidade de atender todos esses usuários fazendo logon simultaneamente. Planeje também uma margem de segurança para acomodar picos inesperados na atividade dos usuários ou nas demandas de recursos.

Recomendamos que você documente o processo de planejamento de capacidade, incluindo suposições, cálculos e decisões tomadas. Comunique o plano aos stakeholders para garantir o alinhamento e a compreensão.

Principais fatores que afetam a capacidade e o desempenho

Há vários fatores-chave que afetam a capacidade dos hosts de sessão. Entender esses fatores pode ajudá-lo a tomar decisões informadas sobre dimensionamento e escalabilidade de hosts de sessão.

Dimensionamento do CPU:
- O número de núcleos de CPU afeta diretamente o número de usuários que podem ter suporte em uma VM de host de sessão.
- Dobrar o número de núcleos de CPU não necessariamente dobra a capacidade do usuário devido à diminuição dos retornos e à sobrecarga de sincronização. O fator de dimensionamento é maior quando o número inicial de CPUs é pequeno e diminui à medida que o número de núcleos aumenta. Por exemplo, o fator de dimensionamento que vai de 4 núcleos para 8 núcleos é maior do que aquele que vai de 8 núcleos para 16 núcleos.
- O fator de dimensionamento normalmente varia entre 1,5 e 1,9, o que significa que, para cada núcleo extra, você pode esperar um aumento proporcional na capacidade do usuário, mas não linear.
Impacto na memória:
- A quantidade de memória alocada para a VM host de sessão afeta diretamente o número de usuários que ela pode dar suporte.
- Quando a memória é o fator limitante, adicionar mais memória em capacidades mais baixas pode melhorar significativamente o desempenho. Por exemplo, aumentar a memória de 8 GB para 16 GB pode mais do que dobrar o número de usuários que você pode dar suporte.
Impacto do logon do usuário:
- O logon do usuário é uma operação com uso intensivo de CPU e altas taxas de logon simultâneas podem afetar significativamente o desempenho do sistema.
- Planeje padrões de logon esperados, como o início de um dia de trabalho às 9h, em que muitos usuários fazem logon simultaneamente. Caso contrário, os usuários poderão experimentar tempos de logon estendidos.
Sobrecarga de virtualização
- A execução em máquinas virtuais pode incorrer em um custo de capacidade de 15 a 20% em comparação com bare-metal, com base em testes internos.
- Um hipervisor introduz mais latência e sobrecarga de CPU que podem resultar em tempos de resposta do usuário de 10% a 20% maiores do que em bare-metal.
Benefícios do hiperthreading
- O hiperthreading pode melhorar a capacidade do usuário, permitindo que mais threads sejam executados simultaneamente em cada núcleo, fazendo uso mais eficiente dos recursos do processador.
- Os benefícios do hiperthreading variam dependendo da carga de trabalho e do número de núcleos. Cargas de trabalho menos intensivas em CPU podem se beneficiar de recursos adicionais de processamento paralelo e obter melhor desempenho por meio do hiperthreading.
Desempenho de rede
- Latência de rede, perda de pacotes e tremulação podem afetar a experiência do usuário, especialmente para aplicativos que exigem comunicação frequente com servidores remotos ou bancos de dados. Qualquer combinação de alta latência, perda de pacotes e tremulação pode levar a tempos de resposta mais lentos e desempenho degradado.
- RtT de rede mais baixo, perda de pacotes e tremulação levam a tempos de resposta mais rápidos e melhor desempenho geral. Considere usar conexões de rede de baixa latência para minimizar o impacto do desempenho da rede na experiência do usuário.
Desempenho do armazenamento
- O desempenho do armazenamento pode afetar a experiência do usuário, especialmente para aplicativos que exigem acesso frequente ao disco.
- Use soluções de armazenamento de alto desempenho, como SSDs ou unidades NVMe, para garantir o acesso rápido aos dados e minimizar a latência.
Requisitos de GPU (unidade de processamento gráfico)
- Algumas cargas de trabalho, como aplicativos com uso intensivo de gráficos para renderização de vídeo, design 3D e simulações ou áreas de trabalho virtuais com exibições de alta resolução, podem exigir GPUs dedicadas para garantir o desempenho ideal.
- Considere usar hosts de sessão com funcionalidades de GPU se os usuários executarem aplicativos com uso intensivo de gráficos ou exigirem exibições de alta resolução.

Todos esses fatores podem afetar o desempenho geral e a capacidade dos hosts de sessão. A medida do atraso de entrada do usuário ou do tempo de resposta da sessão de ponta a ponta é uma métrica fundamental a ser considerada ao avaliar o desempenho dos usuários. Essa métrica mede o tempo necessário para que a entrada de um usuário seja processada e refletida na sessão, fornecendo uma representação mais precisa da experiência do usuário. Os usuários geralmente esperam um tempo de resposta inferior a 200 milissegundos para suas ações e qualquer atraso além disso pode levar a uma experiência de usuário degradada. Para obter mais informações sobre como medir a experiência do usuário, consulte Usar contadores de desempenho para diagnosticar problemas de desempenho do aplicativo em Hosts de Sessão da Área de Trabalho Remota.

Workloads

Ao dimensionar hosts de sessão, é importante considerar o tipo de carga de trabalho que os usuários executam, pois eles podem ser significativamente diferentes. Por exemplo, trabalhadores com carga leve de entrada de dados têm baixa utilização de recursos, que levam a uma alta densidade de usuários. No entanto, profissionais especializados que usam aplicativos 3D pesados consomem uma maior quantidade de recursos, o que levaria a uma baixa densidade de usuários com o mesmo hardware.

Aqui está um exemplo que categoriza cargas de trabalho em quatro tipos: luz, média, pesada e potência. Cada tipo de carga de trabalho tem requisitos de recursos e expectativas do usuário diferentes.

A tabela a seguir descreve cada carga de trabalho. Os usuários de exemplo são os tipos de usuários que podem achar cada carga de trabalho mais útil. Aplicativos de exemplo são os tipos de aplicativos que funcionam melhor para cada carga de trabalho.

Tipo de carga de trabalho	Usuários de exemplo	Aplicativos de exemplo
Leve	Usuários fazendo tarefas básicas de entrada de dados	Aplicativos de entrada de banco de dados, interfaces de linha de comando
Medium	Consultores e pesquisadores de mercado	Aplicativos de entrada de banco de dados, interfaces de linha de comando, Microsoft Word, páginas da Web estáticas
Heavy	Engenheiros de software, criadores de conteúdo	Aplicativos de entrada de banco de dados, interfaces de linha de comando, Microsoft Word, páginas da Web estáticas, Microsoft Outlook, Microsoft PowerPoint, páginas da Web dinâmicas, desenvolvimento de software
Energia	Designers gráficos, fabricantes de modelos 3D, pesquisadores de machine learning	Aplicativos de entrada de banco de dados, interfaces de linha de comando, Microsoft Word, páginas da Web estáticas, Microsoft Outlook, Microsoft PowerPoint, páginas da Web dinâmicas, edição de fotos e vídeos, CAD (design auxiliado por computador), CAM (fabricação auxiliada por computador)

Recomendações de dimensionamento de host de sessão única

Em um cenário de sessão única , apenas um usuário é conectado a um host de sessão ao mesmo tempo. Por exemplo, se você usar pools de hosts pessoais na Área de Trabalho Virtual do Azure, estará usando um cenário de sessão única.

Essas recomendações de dimensionamento para cenários de sessão única são baseadas em VMs do Azure. Você também pode usar esses números como uma linha de base para hosts de sessão física, considere sua abordagem de planejamento de capacidade para refinar essas recomendações para suas cargas de trabalho.

Recomendamos que você use pelo menos dois núcleos físicos de CPU por VM, normalmente quatro vCPUs com hiper-threading. Se você precisar de recomendações de dimensionamento de VM mais específicas para cenários de sessão única, pergunte aos fornecedores de software específicos à sua carga de trabalho. O dimensionamento de VM para hosts de sessão única geralmente se alinha com as diretrizes do dispositivo físico.

A tabela a seguir mostra exemplos de cargas de trabalho típicas:

Tipo de carga de trabalho	Mínimo de armazenamento de vCPU/RAM/SO	Exemplo de instâncias do Azure	Armazenamento mínimo do contêiner de perfil
Leve	2 vCPUs, 8 GB de RAM, 32 GB de armazenamento	D2s_v5, D2s_v4	30 GB
Medium	4 vCPUs, 16 GB de RAM, 32 GB de armazenamento	D4s_v5, D4s_v4	30 GB
Heavy	8 vCPUs, 32 GB de RAM, 32 GB de armazenamento	D8s_v5, D8s_v4	30 GB

Recomendações de dimensionamento para hosts de sessões múltiplas

Em um cenário de várias sessões, mais de um usuário está conectado em uma máquina virtual de host de sessão em um determinado momento. Por exemplo, quando você usa pools de hosts compartilhados na Área de Trabalho Virtual do Azure com o sistema operacional (SO) de múltiplas sessões do Windows 11 Enterprise, trata-se de uma implantação de múltiplas sessões.

Um ambiente de computação de várias sessões experimenta cargas de pico significativamente mais altas em comparação com ambientes de sessão única. Um host de sessão com uma capacidade de hardware específica tem um limite máximo de carga de trabalho que pode dar suporte antes que seus recursos sejam esgotados.

Essas recomendações de dimensionamento para cenários de várias sessões são baseadas em VMs do Azure. Você também pode usar esses números como uma linha de base para hosts de sessão física, considere sua abordagem de planejamento de capacidade para refinar essas recomendações para suas cargas de trabalho.

A tabela a seguir lista o número máximo sugerido de usuários por vCPU (unidade de processamento central virtual) e a configuração mínima de VM para uma carga de trabalho de usuário padrão ou maior. Se você precisar de recomendações de dimensionamento de VM mais específicas para cenários de sessão única, pergunte aos fornecedores de software específicos à sua carga de trabalho.

Tipo de carga de trabalho	Máximo de usuários por vCPU	Recursos mínimos de armazenamento para vCPU/RAM/Sistema Operacional	Exemplo de instâncias do Azure	Armazenamento de perfil mínimo
Leve	6	8 vCPUs, 16 GB de RAM, 32 GB de armazenamento	D8s_v5, D8s_v4, F8s_v2, D8as_v4, D16s_v5, D16s_v4, F16s_v2, D16as_v4	30 GB
Medium	4	8 vCPUs, 16 GB de RAM, 32 GB de armazenamento	D8s_v5, D8s_v4, F8s_v2, D8as_v4, D16s_v5, D16s_v4, F16s_v2, D16as_v4	30 GB
Heavy	2	8 vCPUs, 16 GB de RAM, 32 GB de armazenamento	D8s_v5, D8s_v4, F8s_v2, D8as_v4, D16s_v5, D16s_v4, F16s_v2, D16as_v4	30 GB
Energia	1	6 vCPUs, 56 GB de RAM, 340 GB de armazenamento	D16ds_v5, D16s_v4, D16as_v4, NV6, NV16as_v4	30 GB

Para cargas de trabalho de várias sessões, você deve limitar o tamanho da VM para entre 4 vCPUs e 24 vCPUs pelos seguintes motivos:

Todas as VMs devem ter mais de dois núcleos. Os componentes de interface do usuário no Windows dependem do uso de pelo menos dois threads paralelos para algumas das operações de renderização mais pesadas. Para cenários de várias sessões, ter vários usuários em uma VM de dois núcleos faz com que a interface do usuário e os aplicativos se tornem instáveis, o que reduz a qualidade da experiência do usuário. Quatro núcleos são o menor número recomendado de núcleos que uma VM estável de várias sessões deve ter.
As VMs não devem ter mais de 32 núcleos. À medida que o número de núcleos aumenta, a sobrecarga de sincronização do sistema também aumenta. Para a maioria das cargas de trabalho, em cerca de 16 núcleos, o retorno sobre o investimento fica menor, com a maior parte da capacidade extra compensada pela sobrecarga de sincronização. A experiência do usuário é melhor com duas VMs de 16 núcleos em vez de uma VM de 32 núcleos.

O intervalo recomendado entre 4 e 24 núcleos geralmente fornece melhores retornos de capacidade para seus usuários à medida que você aumenta o número de núcleos. Por exemplo, se você tiver 12 usuários conectados ao mesmo tempo para uma VM que tenha quatro núcleos, a taxa será de três usuários por núcleo. Em uma VM com 8 núcleos e 14 usuários, a taxa é de 1,75 usuários por núcleo. Nesse cenário, a última configuração com uma taxa de 1,75 oferece maior capacidade de intermitência para aplicativos que têm demanda de CPU de curto prazo.

Essa recomendação é verdadeira em uma escala maior. Para cenários com 20 ou mais usuários conectados a uma única VM, várias VMs menores teriam um desempenho melhor do que uma ou duas VMs grandes. Por exemplo, se você espera que 30 ou mais usuários entrem dentro de 10 minutos um do outro no mesmo host de sessão com 16 núcleos, duas VMs de 8 núcleos lidarão melhor com a carga de trabalho. Você também pode usar o balanceamento de carga em largura para distribuir uniformemente os usuários em diferentes VMs em vez do balanceamento de carga em profundidade, onde você só pode usar um novo host de sessão depois que o existente estiver cheio de usuários.

Também é melhor usar um grande número de VMs menores em vez de algumas VMs grandes. É mais fácil desligar VMs que precisam ser atualizadas ou que não estão em uso no momento. Com VMs maiores, é mais provável que você tenha pelo menos um usuário conectado a qualquer momento, o que impede que você desligue a VM. Quando você tem muitas VMs menores, é mais provável que você tenha algumas VMs sem usuários ativos. Você pode desligar com segurança essas VMs não usadas para conservar recursos manualmente ou automaticamente usando o dimensionamento automático na Área de Trabalho Virtual do Azure. A conservação de recursos torna sua implantação mais resiliente, fácil de manter e menos cara.

Use contadores de desempenho para diagnosticar problemas de desempenho de apps em Hosts de Sessão da Área de Trabalho Remota.
Whitepaper de Planejamento de Capacidade do Windows Server 2025 (PDF) para obter diretrizes mais aprofundadas sobre o planejamento das implantações dos Serviços de Área de Trabalho Remota do Windows Server 2025.

Comentários

Esta página foi útil?

Last updated on 2026-02-24