Havuz oluşturma

Makale
03/01/2024

Bu makalede, kullanıcı arabirimini kullanarak havuz oluşturma açıklanmaktadır. Databricks CLI kullanarak havuz oluşturmayı öğrenmek için bkz . Örnek Havuzları CLI 'sı (eski). Rest API'yi kullanarak havuz oluşturmayı öğrenmek için örnek havuzları API'sine bakın.

Gereksinimler

Havuz oluşturma izniniz olmalıdır; Bkz. Havuz erişim denetimi.

Kullanıcı arabirimini kullanarak havuz oluşturma

Kullanıcı arabirimini kullanarak havuz oluşturmak için:

Kenar çubuğunda İşlem'e tıklayın.
Havuzlar sekmesine tıklayın.
Havuz Oluştur düğmesine tıklayın.
Havuz yapılandırmasını belirtin.
Oluştur düğmesine tıklayın.

Havuza küme ekleme

Küme oluşturma kullanıcı arabirimini kullanarak bir havuza küme eklemek için, kümeyi yapılandırırken Sürücü Türü veya Çalışan Türü açılan listesinden havuzu seçin. Kullanılabilir havuzlar her açılan listenin en üstünde listelenir. Sürücü düğümü ve çalışan düğümleri için aynı havuzu veya farklı havuzları kullanabilirsiniz.

Kümeler API'sini kullanıyorsanız, sürücü düğümü ve instance_pool_id çalışan düğümleri için belirtmeniz driver_instance_pool_id gerekir.

Havuz boyutu ve otomatik sonlandırma

Havuz oluşturduğunuzda, boyutunu denetlemek için üç parametre ayarlayabilirsiniz: en düşük boştaki örnekler, maksimum kapasite ve boştaki örnek otomatik sonlandırma.

Minimum Boşta Kalan Örnekler

Havuzun boşta tuttuğu en az örnek sayısı. Bu örnekler, otomatik sonlandırma ayarlarından bağımsız olarak sonlandırılmaz. Bir küme havuzdan boşta örnekleri tüketiyorsa, Azure Databricks en düşük düzeyde tutmak için ek örnekler sağlar.

Maksimum Kapasite

Havuzun sağlayabileceğiniz en fazla örnek sayısı. Ayarlanırsa, bu değer tüm örnekleri kısıtlar (boşta + kullanılan). Havuzu kullanan bir küme otomatik ölçeklendirme sırasında bu sayıdan daha fazla örnek isterse istek bir INSTANCE_POOL_MAX_CAPACITY_FAILURE hatayla başarısız olur.

Bu yapılandırma isteğe bağlıdır. Azure Databricks yalnızca aşağıdaki durumlarda bir değer ayarlamanızı önerir:

Altında kalmanız gereken bir örnek kotanız var.
Bir çalışma kümesini başka bir çalışma kümesini etkilemeye karşı korumak istiyorsunuz. Örneğin, örnek kotanızın 100 olduğunu ve işleri çalıştırması gereken A ve B ekiplerinizin olduğunu varsayalım. İki ekibin 100 kotayı adil bir şekilde paylaşması için maksimum 50 ile A havuzu ve maksimum 50 ile B havuzu oluşturabilirsiniz.
Maliyeti üst sınırına düşürmelisiniz.

Boşta Örnek Otomatik Sonlandırma

Havuz tarafından sonlandırılmadan önce örneklerin boşta olabileceği Minimum Boşta Örnekleri'nde ayarlanan değerin üzerinde dakika cinsinden süre.

Örnek türleri

Havuz, hem yeni kümeler için hazır tutulan boştaki örneklerden hem de kümeler çalıştırılarak kullanılmakta olan örneklerden oluşur. Bu örneklerin tümü aynı örnek sağlayıcısı türündedir ve havuz oluşturulurken seçilir.

Havuzun örnek türü düzenlenemez. Havuza bağlı kümeler, sürücü ve çalışan düğümleri için aynı örnek türünü kullanır. Farklı örnek türü aileleri, yoğun bellek kullanan veya işlem yoğunluklu iş yükleri gibi farklı kullanım örneklerine uyar.

Azure Databricks, örnek türü desteğini durdurmadan önce her zaman bir yıllık kullanımdan kaldırma bildirimi sağlar.

Not

Güvenlik gereksinimleriniz işlem yalıtımını içeriyorsa, çalışan türünüz olarak bir Standard_F72s_V2 örneği seçin. Bu örnek türleri, fiziksel konağın tamamını kullanan yalıtılmış sanal makineleri temsil eder ve örneğin ABD Savunma Bakanlığı Etki Düzeyi 5 (IL5) iş yüklerini desteklemek için gereken yalıtım düzeyini sağlar.

Databricks Runtime sürümü önceden yüklenmiş

Havuzdaki boştaki örneklere yüklenecek Databricks Runtime sürümünü seçerek küme başlatmalarını hızlandırabilirsiniz. Kullanıcı havuz tarafından yedeklenen bir küme oluştururken bu çalışma zamanını seçerse, bu küme önceden yüklenmiş Databricks Runtime sürümünü kullanmayan havuz destekli bir kümeden daha hızlı başlatılır.

Databricks Runtime sürümünün isteğe bağlı olarak havuzdaki boştaki örneklere indirilmesine neden olduğundan, bu seçeneğin Hiçbiri olarak ayarlanması küme başlatmalarını yavaşlatır. Küme havuzdaki örnekleri serbest bıraktığında Databricks Runtime sürümü bu örneklerde önbelleğe alınmış olarak kalır. Aynı Databricks Runtime sürümünü kullanan sonraki küme oluşturma işlemi bu önbelleğe alma davranışından yararlanabilir, ancak garanti edilmemektedir.

Önceden yüklenmiş Docker görüntüsü

Havuzu oluşturmak için Örnek Havuzları API'sini kullanırsanız Docker görüntüleri havuzlarla desteklenir.

Havuz etiketleri

Havuz etiketleri, kuruluşunuzdaki çeşitli gruplar tarafından kullanılan bulut kaynaklarının maliyetini kolayca izlemenizi sağlar. Havuz oluştururken etiketleri anahtar-değer çiftleri olarak belirtebilirsiniz ve Azure Databricks bu etiketleri VM'ler ve disk birimleri gibi bulut kaynaklarına ve DBU kullanım raporlarına uygular.

Kolaylık olması için Azure Databricks her havuza üç varsayılan etiket uygular: Vendor, DatabricksInstancePoolIdve DatabricksInstancePoolCreatorId. Havuz oluştururken özel etiketler de ekleyebilirsiniz. En fazla 41 özel etiket ekleyebilirsiniz.

Özel etiketler

Havuza başka etiketler eklemek için Havuz Oluştur sayfasının en altındaki Sekmeler sekmesine gidin. + Ekle düğmesine tıklayın ve anahtar-değer çiftini girin.

Havuz destekli kümeler, havuz yapılandırmasından varsayılan ve özel etiketleri devralır. Havuz etiketleri ve küme etiketlerinin birlikte nasıl çalıştığı hakkında ayrıntılı bilgi için bkz . Etiketleri kullanarak kullanımı izleme.

Yerel depolamayı otomatik ölçeklendirme

Genellikle belirli bir işin ne kadar disk alanı alacağını tahmin etmek zor olabilir. Azure Databricks, oluşturma sırasında havuzunuza kaç gigabayt yönetilen disk iliştirmek zorunda olmadığınızı tahmin etmek zorunda kalmaktan kurtarmak için tüm Azure Databricks havuzlarında yerel depolamayı otomatik olarak ölçeklendirmeyi etkinleştirir.

Yerel depolamayı otomatik ölçeklendirme ile Azure Databricks, havuzunuzun örneklerinde kullanılabilir boş disk alanı miktarını izler. Bir örneğin diskte çok az çalışması durumunda, disk alanı dolmadan önce yeni bir yönetilen disk otomatik olarak eklenir. Diskler, sanal makine başına toplam 5 TB disk alanı sınırına (sanal makinenin ilk yerel depolama alanı dahil) bağlanır.

Bir sanal makineye bağlı yönetilen diskler yalnızca sanal makine Azure'a döndürülürken ayrılır. Yani, yönetilen diskler bir havuzun parçası olduğu sürece hiçbir zaman bir sanal makineden ayrılmaz.

Spot örnekleri

Maliyetten tasarruf etmek için Tüm Spot radyo düğmesini işaretleyerek spot örnekleri kullanmayı seçebilirsiniz.

Havuzdaki kümeler tüm düğümler, sürücü ve çalışan için spot örneklerle başlatılır (havuz dışı kümeler için karma isteğe bağlı sürücü ve spot örnek çalışanlarının aksine).

Spot örnekler kullanılamadığından çıkarılırsa, isteğe bağlı örnekler çıkarılan örneklerin yerini almaz.

Havuzu silme

Havuzun silinmesi, havuzun boşta olan örneklerini sonlandırır ve yapılandırmasını kaldırır. Havuzu silmek için Havuzlar sayfasındaki eylemlerdeki simgeye tıklayın . Bir havuzu silerseniz:

Havuza bağlı çalışan kümeler çalışmaya devam eder, ancak yeniden boyutlandırma veya ölçeği artırma sırasında örnekleri ayıramaz.
Havuza eklenen sonlandırılan kümeler başlatılamaz.

Önemli

Bu eylemi geri alamazsınız.