Sélectionner une référence SKU pour votre cluster Azure Data Explorer
Quand vous créez un cluster ou que vous optimisez un cluster pour une charge de travail changeante, Azure Data Explorer met à votre disposition plusieurs références SKU de machine virtuelle. Les références SKU de calcul ont été soigneusement choisies pour vous permettre de bénéficier du coût optimal pour n’importe quelle charge de travail.
La taille et la référence SKU d’une machine virtuelle du cluster de gestion des données sont entièrement gérées par le service Azure Data Explorer. Elles sont déterminées par des facteurs tels que la taille de la machine virtuelle du moteur et la charge de travail d'ingestion.
Vous pouvez modifier la référence SKU de calcul pour le cluster à tout moment en effectuant un scale-up du cluster. Il est préférable de commencer par la plus petite taille de référence SKU correspondant au scénario initial. Vous pouvez aussi utiliser les recommandations d’Azure Advisor pour optimiser votre référence SKU de calcul.
Vous pouvez utiliser la Calculatrice de prix pour estimer le prix de votre cluster Azure Data Explorer, en fonction de vos charges de travail et de votre volume de données.
Conseil
En achetant une réservation, vous pouvez pré-payer pour le cluster, les machines virtuelles utilisées dans le cluster et les coûts liés aux ressources de stockage pendant une période d’un ou trois ans. Ces instances réservées (RI) sont achetées séparément et peuvent permettre d’économiser un montant important pour garantir les meilleurs tarifs pour votre cluster Azure Data Explorer. Pour plus d’informations, voir Prépayer des unités de majoration Azure Data Explorer avec la capacité de réserve Azure Data Explorer.
Sélectionner un type de cluster
Azure Data Explorer offre deux types de clusters :
- Production (avec contrat SLA) : les clusters de production contiennent au moins deux nœuds pour le cluster de moteur et au moins deux nœuds pour le cluster de gestion des données. Ces clusters fonctionnent sous le contrat SLA Azure Data Explorer.
- Dev/Test (sans contrat SLA) : les clusters Dev/Test contiennent un nœud unique pour le cluster de moteur et un nœud unique pour le cluster de gestion des données. Ces clusters sont la configuration la plus économique en raison de leur faible nombre de instance. Il n’existe pas de redondance ou de SLA pour cette configuration de cluster.
Développement et production
Les clusters de développement sont parfaits pour l’évaluation du service, la configuration d’un pipeline d’ingestion, la preuve de concept (PoC) ou une validation de scénario. Les principales différences entre les clusters de développement et les clusters de production sont les suivantes :
- Les clusters de développement sont limités en taille et ne peuvent pas dépasser un seul nœud
- La majoration Azure Data Explorer n’est pas facturée pour les clusters de développement
- Aucun SLA pour les clusters de développement
Types de références SKU de calcul
Le cluster Azure Data Explorer prend en charge plusieurs SKU pour les différents types de charges de travail. Chaque référence SKU offre un ratio de SSD et de processeur distinct pour aider vous aider à dimensionner correctement votre déploiement et à créer des solutions optimales en termes de coûts pour votre charge de travail analytique d’entreprise.
Optimisé pour le calcul
- Fournit un ratio cœur/cache élevé et le coût le plus bas par cœur.
- SSD local pour des E/S à faible latence.
Optimisé pour le stockage
- Fournit un stockage plus grand allant de 1 téraoctet (To) à 4 To par nœud de moteur et le coût le plus bas par gigaoctet (Go).
- Adapté aux charges de travail nécessitant un stockage pour de grands volumes de données.
- Certaines références SKU utilisent un stockage Premium (PS) attaché au nœud de moteur au lieu des disques SSD en local. L’accès au stockage PS est plus lent que l’accès aux disques SSD en local. Les références SKU avec PS sont plus coûteuses et sont moins performantes que les références SKU avec disque SSD local attaché.
Sélectionner et optimiser votre référence SKU de calcul
Sélectionner votre référence SKU de calcul lors de la création du cluster
Quand vous créez un cluster Azure Data Explorer, sélectionnez la référence SKU de machine virtuelle optimale pour la charge de travail planifiée. Utilisez les attributs suivants pour vous aider à choisir la référence SKU appropriée pour votre environnement :
Attribut | Détails |
---|---|
Coût par Go | Coût élevé avec optimisation pour le calcul. Faible coût avec les références SKU optimisées pour le stockage |
Coût par cœur | Faible coût avec optimisation pour le calcul. Faible coût avec les références SKU optimisées pour le stockage. |
Tarification des RI | La remise pour les RI varie selon la région et la référence SKU. |
Notes
Le coût de calcul est la partie la plus importante du coût d’un cluster.
Optimiser la référence SKU de calcul de votre cluster
Pour optimiser la référence SKU de calcul de votre cluster, configurez la mise à l’échelle verticale et vérifiez les recommandations d’Azure Advisor.
Avec les différentes options de référence SKU de calcul disponibles, vous pouvez optimiser les coûts en fonctions des exigences de performances et de cache de données chaudes de votre scénario. Choisissez une référence SKU optimisée pour le calcul pour des performances optimales lorsque les volumes de requête sont élevés. Choisissez une référence SKU optimisée pour le stockage pour obtenir les meilleures performances lors de requêtes portant sur de grands volumes de données qui doivent être mis en cache.
Il est préférable d’utiliser quelques nœuds de machines virtuelles plus volumineuses qui utilisent plus de RAM, que de nombreuses machines virtuelles plus petites. Davantage de RAM est nécessaire pour certains types de requêtes qui demandent plus de ressources RAM, notamment celles qui utilisent les jointures. Ainsi, lors de la mise à l’échelle du cluster, nous vous recommandons d’effectuer un scale-up vers une référence SKU plus grande et de procéder à un scale-out en ajoutant davantage de nœuds en fonction des besoins.
Notes
La modification ou la mise à l’échelle de la référence SKU du cluster peut entraîner une interruption de service d’une à trois minutes. Les performances des requêtes peuvent être affectées pendant la migration de la référence SKU, et l’étendue de l’impact peut varier en fonction des modèles d’utilisation.
Disponibilité de la référence SKU
La disponibilité de la référence SKU diffère en fonction des facteurs suivants :
- Région : toutes les références SKU ne sont pas disponibles dans toutes les régions et zones de disponibilité. Pour plus d’informations, consultez chaque page de référence SKU pour la disponibilité régionale.
- Abonnement : certaines références SKU peuvent uniquement être disponibles pour des types d’abonnement spécifiques. Si aucune référence SKU répondant à vos besoins métier n’est disponible pour votre abonnement dans une localisation ou zone, envoyez une demande de référence SKU au Support Azure.
Options de référence SKU
Les séries de références SKU suivantes sont disponibles pour les machines virtuelles de cluster Azure Data Explorer. Les familles de références SKU au sein des catégories optimisées pour le calcul et pour le stockage sont classées dans l’ordre de recommandation.
Optimisé pour le stockage
Série de références SKU | Configuration vCPU disponible | Type de référence SKU | Prend en charge le stockage Premium |
---|---|---|---|
Lasv3 | 8, 16 , 32 | AMD | Non |
Lsv3 | 8, 16 , 32 | Intel | Non |
Easv4, Easv5, ECasv5 | 8, 16 | AMD | Oui |
Esv4, Esv5 | 8, 16 | Intel | Oui |
DSv2 | 8, 16 | Intel | Oui |
Optimisé pour le calcul
Série de références SKU | Configuration vCPU disponible | Type de référence SKU | Prend en charge le stockage Premium |
---|---|---|---|
Eadsv5, ECadsv5 | 2, 4, 8, 16 | AMD | Non |
Edv4, Edv5 | 2, 4, 8, 16 | Intel | Non |
Eav4 | 2, 4, 8, 16 | AMD | Non |
Dv2 | 2, 4, 8, 16 | Intel | Non |
Notes
Toutes les références SKU optimisées pour le calcul avec 2 cœurs peuvent être configurées en tant que clusters de développement.
Il est recommandé d’utiliser L32asv3/L32sv3 uniquement dans les cas d’utilisation avec des clusters L16asv3/L16sv3 très volumineux atteignant la limite de 1 000 nœuds de cluster ou des clusters avec des taux de requêtes simultanées extrêmement élevés. ECasv5 et ECadsv5 sont des références SKU de calcul confidentiel. Pour plus d’informations, consultez les informations sur les machines virtuelles d’informatique confidentielle. Pour les références SKU ECasv5 optimisées pour le stockage, si vous utilisez votre propre clé gérée par le client (CMK), le chiffrement CMK est effectué sur les comptes de stockage et les disques de stockage Premium.
- Avec l’isolation du calcul et du stockage Azure Data Explorer, vous pouvez commencer par la référence SKU offrant le coût le plus optimal et passer à une autre référence SKU une fois le modèle d’utilisation arrivé à maturité ou après une perte de données.
- Vous pouvez visualiser la liste mise à jour des références SKU de calcul par région en utilisant l’API ListSkus d’Azure Data Explorer.
Taille du cache
Azure Data Explorer réserve une partie de la taille de disque indiquée dans chacune des spécifications de référence SKU de calcul Azure à utiliser pour les opérations de cluster. La taille exacte du cache pour chaque référence SKU est disponible dans la section de sélection des références SKU dans le portail.
Contenu connexe
- Découvrez comment utiliser la calculatrice de prix