Share via


Selezionare uno SKU per il cluster Esplora dati di Azure

Quando si crea un nuovo cluster o si ottimizza un cluster per un carico di lavoro mutevole, Azure Esplora dati offre più SKU di macchine virtuali (VM) tra cui scegliere. Questi SKU di calcolo sono stati scelti con attenzione per offrire il costo più ottimale per qualsiasi carico di lavoro.

Le dimensioni e lo SKU della macchina virtuale del cluster di gestione dei dati sono completamente gestiti dal servizio Azure Esplora dati. Sono determinati da fattori come le dimensioni della macchina virtuale del motore e il carico di lavoro di inserimento.

È possibile modificare lo SKU di calcolo per il cluster in qualsiasi momento aumentando il cluster. È consigliabile iniziare con le dimensioni dello SKU più piccole che si adattano allo scenario iniziale. È anche possibile usare le raccomandazioni di Azure Advisor per ottimizzare lo SKU di calcolo.

È possibile usare il calcolatore prezzi per stimare i prezzi del cluster Esplora dati di Azure, in base ai carichi di lavoro e al volume di dati.

Suggerimento

Acquistando una prenotazione, è possibile pagare in base al pagamento anticipato per il cluster, le macchine virtuali usate nel cluster e i costi delle risorse di archiviazione per un periodo di uno o tre anni. Queste istanze riservate vengono acquistate separatamente e consentono di risparmiare una notevole quantità di denaro per garantire le tariffe migliori per il cluster Esplora dati di Azure. Per altre informazioni, vedere Pagare in anticipo le unità di markup di Azure Esplora dati con capacità riservata di Azure Esplora dati.

Selezionare un tipo di cluster

Azure Esplora dati offre due tipi di cluster:

  • Produzione (con contratto di servizio): i cluster di produzione contengono almeno due nodi per il cluster del motore e almeno due nodi per il cluster di gestione dei dati. Questi cluster operano con il contratto di servizio di Azure Esplora dati.
  • Sviluppo/test (nessun contratto di servizio): i cluster di sviluppo/test contengono un singolo nodo per il cluster del motore e un singolo nodo per il cluster di gestione dei dati. Questi cluster sono la configurazione con costi più bassi a causa del numero di istanze ridotto. Non esiste alcuna ridondanza o contratto di servizio per questa configurazione del cluster.

Sviluppo e produzione

I cluster di sviluppo sono ideali per la valutazione del servizio, la configurazione di una pipeline di inserimento, l'esecuzione di un modello di verifica (PoC) o una convalida dello scenario. Le differenze principali tra cluster di sviluppo e cluster di produzione includono:

  • I cluster di sviluppo hanno dimensioni limitate e non possono superare un singolo nodo
  • Il markup Esplora dati di Azure non viene addebitato per i cluster di sviluppo
  • Nessun contratto di servizio per i cluster di sviluppo

Tipi di SKU di calcolo

I cluster Esplora dati di Azure supportano vari SKU per diversi tipi di carichi di lavoro. Ogni SKU offre un rapporto di archiviazione e CPU SSD distinto che consente di ridimensionare correttamente la distribuzione e creare soluzioni ottimali per il carico di lavoro analitico aziendale.

Con ottimizzazione per il calcolo

  • Fornisce un rapporto elevato tra core e cache e il costo più basso per core.
  • UNITÀ SSD locale per operazioni di I/O a bassa latenza.

Con ottimizzazione per l'archiviazione

  • Fornisce spazio di archiviazione più ampio compreso tra 1 terabyte (TB) e 4 TB per nodo del motore e il costo più basso per gigabyte (GB).
  • Adatto per i carichi di lavoro che richiedono l'archiviazione per grandi volumi di dati.
  • Alcuni SKU usano l'archiviazione Premium (PS) collegata al nodo del motore anziché alle unità SSD locali. L'accesso a PS è più lento rispetto alle unità SSD locali, quindi gli SKU con PS sono più costosi e sono meno efficienti rispetto agli SKU collegati a SSD locale.

Selezionare e ottimizzare lo SKU di calcolo

Selezionare lo SKU di calcolo durante la creazione del cluster

Quando si crea un cluster di Azure Esplora dati, selezionare lo SKU ottimale della macchina virtuale per il carico di lavoro pianificato. Usare gli attributi seguenti per scegliere lo SKU corretto per l'ambiente:

Attributo Dettagli
Costo per GB Costi elevati con ottimizzazione per il calcolo. Costi ridotti con SKU ottimizzati per l'archiviazione.
Costo per core Costi ridotti con ottimizzazione per il calcolo. Costi elevati con SKU ottimizzati per l'archiviazione.
Prezzi delle istanze riservate Lo sconto dell'istanza riservata varia in base all'area e alla SKU.

Nota

Il costo di calcolo è la parte più significativa del costo di un cluster.

Ottimizzare lo SKU di calcolo del cluster

Per ottimizzare lo SKU di calcolo del cluster, configurare il ridimensionamento verticale e controllare le raccomandazioni di Azure Advisor.

Con varie opzioni di SKU di calcolo tra cui scegliere, è possibile ottimizzare i costi per le prestazioni e i requisiti della cache ad accesso frequente per lo scenario. Scegliere uno SKU ottimizzato per il calcolo per ottenere prestazioni ottimali quando sono presenti volumi di query elevati. Scegliere uno SKU ottimizzato per l'archiviazione per ottenere prestazioni ottimali quando si eseguono query su grandi volumi di dati che devono essere memorizzati nella cache.

È preferibile usare alcuni nodi di macchine virtuali di dimensioni maggiori che usano più RAM, rispetto a molte macchine virtuali più piccole. È necessaria una quantità maggiore di RAM per alcuni tipi di query che richiedono più RAM, ad esempio le query che usano join. Pertanto, quando si ridimensiona il cluster, è consigliabile aumentare le prestazioni fino a uno SKU di dimensioni maggiori e aumentare il numero di istanze aggiungendo altri nodi in base alle esigenze.

Nota

La modifica o la scalabilità dello SKU del cluster possono causare un'interruzione del servizio da uno a tre minuti. Le prestazioni delle query possono essere influenzate durante la migrazione dello SKU e l'entità dell'impatto può variare a seconda dei modelli di utilizzo.

Disponibilità SKU

La disponibilità dello SKU è diversa in base ai fattori seguenti:

  • Area: non tutti gli SKU sono disponibili in tutte le aree o nelle zone di disponibilità. Per altre informazioni, vedere ogni pagina SKU per la disponibilità a livello di area.
  • Sottoscrizione: alcuni SKU possono essere disponibili solo per tipi di sottoscrizione specifici. Se uno SKU non è disponibile per la sottoscrizione in una località o in una zona che soddisfa le esigenze aziendali, inviare una richiesta di SKU a supporto tecnico di Azure.

Opzioni SKU

Per le macchine virtuali del cluster di Azure Esplora dati sono disponibili le serie di SKU seguenti. Le famiglie di SKU all'interno delle categorie ottimizzate per le risorse di calcolo e archiviazione vengono classificate in ordine di raccomandazione.

Ottimizzato per l'archiviazione

Serie SKU Configurazione vCPU disponibile Tipo di SKU Supporta l'archiviazione Premium
Lasv3 8, 16 , 32 AMD No
Lsv3 8, 16 , 32 Intel No
Easv4, Easv5, ECasv5 8, 16 AMD
Esv4, Esv5 8, 16 Intel
DSv2 8, 16 Intel

Con ottimizzazione per il calcolo

Serie SKU Configurazione vCPU disponibile Tipo di SKU Supporta l'archiviazione Premium
Eadsv5, ECadsv5 2, 4, 8, 16 AMD No
Edv4, Edv5 2, 4, 8, 16 Intel No
Eav4 2, 4, 8, 16 AMD No
Dv2 2, 4, 8, 16 Intel No

Nota

Tutti gli SKU ottimizzati per il calcolo con 2 core possono essere configurati come cluster di sviluppo.

È consigliabile usare I32asv3/L32sv3 solo nei casi d'uso con cluster L16asv3/L16sv3 che raggiungono il limite del nodo del cluster 1000 o i cluster con tassi di richiesta simultanei estremamente elevati. ECasv5 e ECadsv5 sono SKU di calcolo riservati. Per altre informazioni, vedere Informazioni sulle macchine virtuali di calcolo riservato. Per gli SKU ottimizzati per l'archiviazione ECasv5, nel caso in cui si usi una chiave gestita dal cliente (CMK), la crittografia CMK viene eseguita sia negli account di archiviazione che nei dischi di archiviazione Premium.

  • Con Azure Esplora dati l'isolamento di calcolo e archiviazione, è possibile iniziare con lo SKU di costo più ottimale e passare a un altro SKU dopo aver maturo il modello di utilizzo o la perdita di dati.
  • È possibile visualizzare l'elenco di SKU di calcolo aggiornato per area usando l'API ListSkus di Azure Esplora dati.

Dimensioni cache

Azure Esplora dati riserva una parte delle dimensioni del disco visualizzate in ognuna delle specifiche dello SKU di calcolo di Azure da usare per le operazioni del cluster. Le dimensioni esatte della cache per ogni SKU sono disponibili nella sezione selezione SKU nel portale.