Aracılığıyla paylaş


Azure Synapse Analytics'te ayrılmış SQL havuzu (eski adı SQL DW) mimarisi

Azure Synapse Analytics, kurumsal veri ambarı ve Büyük Veri analizini bir araya getiren bir analiz hizmetidir. Bu, koşullarınıza göre verileri sorgulama özgürlüğü sağlar.

Not

Azure Synapse Analytics hakkında daha fazla bilgi için Veri Taşıma Geliştirmelerini açıklayan bu videoyu izleyin.

Synapse SQL mimarisi bileşenleri

Ayrılmış SQL havuzu (eski adı SQL DW), verilerin hesaplamalı işlenmesini birden çok düğüme dağıtmak için bir genişleme mimarisinden yararlanıyor. Ölçek birimi, veri ambarı birimi olarak bilinen işlem gücünün soyutlamasıdır. İşlem depolamadan ayrıldığından, işlemi sisteminizde verilerden bağımsız olarak ölçeklendirebilirsiniz.

Ayrılmış SQL havuzu (eski adıyla SQL DW) mimarisi

Ayrılmış SQL havuzu (eski adıYLA SQL DW), düğüm tabanlı bir mimari kullanır. Uygulamalar T-SQL komutlarını bir Denetim düğümüne bağlar ve yayımlar. Denetim düğümü, sorguları paralel işleme için en iyi duruma getirerek işlemlerini paralel olarak yapmak üzere İşlem düğümlerine geçiren dağıtılmış sorgu altyapısını barındırıyor.

İşlem düğümleri tüm kullanıcı verilerini Azure Depolama’da depolar ve paralel sorgular çalıştırır. Veri Taşıma Hizmeti (DMS), sorguları paralel olarak çalıştırmak ve doğru sonuçlar döndürmek için verileri düğümler arasında taşıyan, sistem düzeyindeki bir dahili hizmettir.

Ayrılmış depolama ve işlem ile ayrılmış bir SQL havuzu (eski adı SQL DW) kullanılırken şunları yapabilirsiniz:

  • Depolama gereksinimlerinizden bağımsız olarak işlem gücünü bağımsız olarak boyutlandırın.
  • Verileri taşımadan ayrılmış bir SQL havuzu içinde (eski adı SQL DW) işlem gücünü büyütün veya küçültün.
  • İşlem kapasitesini duraklatır ve verileri olduğu gibi bırakır; böylece yalnızca depolama için ödeme yaparsınız.
  • Çalışma saatleri içinde işlem kapasitesini sürdürme.

Azure Depolama

Ayrılmış SQL havuzu SQL (eski adıYLA SQL DW), kullanıcı verilerinizi güvende tutmak için Azure Depolama'yı kullanır. Verileriniz Azure Depolama tarafından depolanıp yönetildiğinden, depolama tüketiminiz için ayrı bir ücret uygulanır. Veriler, sistemin performansını iyileştirmek için dağıtımlara ayrılır. Tabloyu tanımlarken verileri dağıtmak için hangi parçalama deseninin kullanılacağını seçebilirsiniz. Bu parçalama desenleri desteklenir:

  • Haş
  • Döner Sistem
  • Kopyala

Denetim düğümü

Denetim düğümü mimarinin beynidir. Tüm uygulamalarla ve bağlantılarla etkileşim kuran ön uçtur. Dağıtılmış sorgu altyapısı, paralel sorguları iyileştirmek ve koordine etmek için Denetim düğümünde çalışır. Bir T-SQL sorgusu gönderdiğinizde, Denetim düğümü bunu her dağıtımda paralel olarak çalışan sorgulara dönüştürür.

Hesaplama düğümleri

İşlem düğümleri, hesaplama gücü sağlar. Dağıtımlar, işleme tabi tutulmak üzere İşlem düğümleriyle eşleştirilir. Ödeyerek daha fazla hesaplama kaynağı satın aldığınızda dağıtımlar kullanılabilir hesaplama düğümleriyle yeniden eşlenir. İşlem düğümlerinin sayısı 1 ile 60 arasında değişir ve Synapse SQL hizmet düzeyine göre belirlenir.

Her İşlem düğümü, sistem görünümlerinde görünen bir düğüm kimliğine sahiptir. sistem görünümlerinde adları sys.pdw_nodes ile başlayan node_id sütununu arayarak İşlem düğümü kimliğini görebilirsiniz. Bu sistem görünümlerinin listesi için bkz . Synapse SQL sistem görünümleri.

Veri Taşıma Hizmeti

Veri Taşıma Hizmeti (DMS), İşlem düğümleri arasında veri hareketini koordine eden veri taşıma teknolojisidir. Bazı sorgular, paralel sorguların doğru sonuçlar döndürmesini sağlamak için veri taşıma gerektirir. Veri taşıma gerektiğinde DMS, doğru verilerin doğru konuma ulaştığından emin olur.

Dağıtım

Dağıtım, dağıtılmış veriler üzerinde çalışan paralel sorgular için temel depolama ve işleme birimidir. Synapse SQL bir sorgu çalıştırdığında, iş paralel olarak çalışan 60 daha küçük sorguya bölünür.

60 küçük sorgunun her biri veri dağıtımlarından birinde çalışır. Her İşlem düğümü, 60 dağıtımın bir veya daha fazlasını yönetir. İşlem düğümü başına en fazla işlem kaynağına sahip ayrılmış SQL havuzunun (eski adı SQL DW) bir dağıtımı vardır. En düşük işlem kaynaklarına sahip ayrılmış SQL havuzu (eski adı SQL DW), tüm dağıtımları tek bir işlem düğümünde içerir.

Not

İş yüklerinize göre kullanılacak en iyi tablo dağıtım stratejisine ilişkin öneriler için bkz . Azure Synapse SQL Dağıtım Danışmanı.

Hash dağıtılmış tablolar

Dağıtılmış bir karma tablo, büyük tablolarla birleştirmeler ve toplamalar için en yüksek sorgu performansını sunabilir.

Verileri karma dağıtılmış bir tabloya bölmek için, her satırı bir dağıtıma belirleyici bir şekilde atamak için bir karma işlevi kullanılır. Tablo tanımında sütunlardan biri dağıtım sütunu olarak atanır. Karma işlevi, her satırı bir dağıtıma atamak için dağıtım sütunundaki değerleri kullanır.

Aşağıdaki diyagramda tam (dağıtılmayan tablo) karma dağıtılmış tablo olarak nasıl depolandığı gösterilmektedir.

Dağıtılmış tablo

  • Her satır bir dağıtıma aittir.
  • Belirlenimci karma algoritması her satırı tek bir dağıtıma atar.
  • Dağıtım başına tablo satırı sayısı, tabloların farklı boyutlarıyla gösterildiği gibi değişir.

Bir dağıtım sütununun seçiminde performans açısından dikkat edilmesi gereken noktalar vardır. Örneğin, fark, veri dengesizliği ve sistemde çalışan sorgu türleri.

Dönüşümlü dağıtılmış tablolar

Dairesel tablo, yükleri hazırlarken etkilendiğinde hızlı performans sağlayan ve oluşturması en basit tablodur.

Round-robin dağıtılmış tablo, verileri tabloda eşit olarak dağıtır ancak başka bir optimizasyon gerçekleştirilmez. Önce rastgele bir dağıtım seçilir ve ardından satır arabellekleri sıralı olarak dağıtımlara atanır. Verileri dairevi bir tabloya yüklemek hızlıdır ancak sorgu performansı çoğunlukla hash dağıtılmış tablolar ile daha iyi olabilir. Dönüşümlü tablolardaki birleştirmeler, verilerin yeniden düzenlenmesini gerektirir, bu da ek zaman alır.

Çoğaltılmış Tablolar

Çoğaltılmış bir tablo, küçük tablolar için en hızlı sorgu performansını sağlar.

Çoğaltılan tablo, her işlem düğümünde tablonun tam kopyasını önbelleğe alır. Sonuç olarak, bir tablo çoğaltıldığında bir birleştirme veya toplama öncesinde işlem düğümleri arasında verileri aktarma gereksinimi ortadan kalkar. Çoğaltılmış tablolar, küçük tablolar ile en iyi şekilde kullanılabilir. Ek depolama gereklidir ve veri yazarken oluşan ek ek yük vardır ve bu da büyük tabloları pratik yapmaz.

Aşağıdaki diyagramda, her işlem düğümündeki ilk dağıtımda önbelleğe alınmış çoğaltılmış bir tablo gösterilmektedir.

Çoğaltılmış tablo

Artık Azure Synapse hakkında biraz bilgi edindiğinize göre, hızlı bir şekilde ayrılmış bir SQL havuzu (eski adı SQL DW) oluşturmayı ve örnek verileri yüklemeyi öğrenin. Azure'da yeniyseniz, yeni terminolojiyle karşılaştığınızda Azure'ın temel kavramlarını yararlı bulabilirsiniz. Veya bu diğer Azure Synapse Kaynaklarından bazılarını inceleyin.