Azure Databricks ile çalışmaya başlama

Tamamlandı

Azure Databricks'i kullanmak için Azure aboneliğinizde bir Azure Databricks çalışma alanı oluşturmanız gerekir. Workspace, bir bulut hizmeti hesabındaki Azure Databricks dağıtımıdır. Belirtilen bir kullanıcı kümesi için Azure Databricks varlıklarıyla çalışmak için birleşik bir ortam sağlar.

Azure Databricks çalışma alanını şu şekilde oluşturabilirsiniz:

  • Azure portalı kullanıcı arabirimini kullanma.
  • Azure Resource Manager (ARM), Bicep veya Terraform şablonu kullanma.
  • New-AzDatabricksWorkspace Azure PowerShell cmdlet'ini kullanma.
  • az databricks workspace kullanarak Azure komut satırı arabirimi (CLI) komutu oluşturun.

Çalışma alanı oluştururken şunları belirtmeniz gerekir:

  • Çalışma alanı adı.
  • Kullanılabilir bir bölge seçin. Kullanılabilir bölgeler için bkz. Bölgeye göre kullanılabilir Azure hizmetleri.
  • Fiyatlandırma katmanı:
    • Standart - Microsoft Entra ID tümleştirmesi ile Temel Apache Spark özellikleri.
    • Premium - Rol tabanlı erişim denetimleri ve diğer kurumsal düzey özellikler.
    • Deneme - Premium düzey çalışma alanının 14 günlük ücretsiz deneme sürümü
  • Yönetilen Kaynak Grubu adı (isteğe bağlı): Azure'ın Databricks çalışma alanınız için gereken altyapı kaynaklarını sağladığı ve yönettiği otomatik olarak oluşturulmuş bir kaynak grubu.

Azure Portal'da Azure Databricks'in ekran görüntüsü.

Azure CLI kullanarak bir Azure Databricks dağıtımı oluşturmaya karar verirseniz, bu anımsanacak az databricks workspace komutu olacaktır:

az databricks workspace create
    --resource-group myresourcegroup \
    --name mydatabricksws  \
    --location westus2  \
    --sku standard

Eşdeğer New-AzDatabricksWorkspace PowerShell cmdlet'i:

New-AzDatabricksWorkspace -Name mydatabricksws -ResourceGroupName myresourcegroup -Location westus2 -ManagedResourceGroupName databricks-group -Sku standard

Azure Databricks çalışma alanını sağladıktan sonra, veri ve işlem kaynaklarıyla çalışmak için çalışma alanı kullanıcı arabirimini kullanabilirsiniz. Çalışma alanı kullanıcı arabirimi, Spark kümeleri gibi çalışma alanı kaynaklarını oluşturup yönetebileceğiniz ve dosya ve tablolardaki verilerle çalışmak için not defterlerini ve sorguları kullanabileceğiniz web tabanlı bir kullanıcı arabirimidir.

Azure Databricks Çalışma Alanı kullanıcı arabiriminin ekran görüntüsü.

Giriş sayfası, kullanmaya başlamanıza yardımcı olmak için ortak görevlere ve çalışma alanı nesnelerine kısayollar sağlar. Verileri içeri aktarabilir, not defteri oluşturabilir, sorgu oluşturabilir ve AutoML denemesi yapılandırabilirsiniz.

Kenar çubuğunda yaygın Databricks kategorileri (Çalışma Alanı, Son Kullanılanlar, Katalog, İşler ve İşlem Hatları, Hesaplama, Market) gösterilmektedir. Ardından ürün alanına göre ayrılır:

  • SQL: SQL Düzenleyicisi, Sorgular, Panolar, Genie, Uyarılar, Sorgu Geçmişi, SQL Ambarları
  • Veri Mühendisliği: İş Çalışmaları, Veri Girişi
  • Makine Öğrenmesi: Oyun Alanı, Denemeler, Özellikler, Modeller, Sunum

+ Yeni'yi seçerek:

  • Not defterleri, sorgular, depolar, panolar, uyarılar, işler, işlem hatları, denemeler, modeller ve hizmet uç noktaları gibi çalışma alanı nesneleri oluşturun.
  • Kümeler, SQL ambarları ve ML uç noktaları gibi işlem kaynakları oluşturun.

Not defterleri, sorgular, panolar, uyarılar, dosyalar, klasörler, kitaplıklar, Unity Kataloğu'nda kayıtlı tablolar, işler ve depolar gibi çalışma alanı nesnelerini tek bir yerde aramak için üst çubuğu kullanın. Ayrıca, arama çubuğunda son görüntülenen nesnelere de erişebilirsiniz.

Çalışma alanı birden çok dilde kullanılabilir. Çalışma alanı dilini değiştirmek için üst gezinti çubuğunda kullanıcı adınızı seçin, Ayarlar'ı seçin ve Tercihler sekmesine gidin.

Databricks Yardımcısı'ndan yardım alma

Databricks Yardımcısı , doğrudan not defterlerinde, panolarda ve dosyalarda kod veya sorgu oluşturarak, açıklayarak ve düzelterek Databricks'te daha verimli çalışmanıza yardımcı olan yapay zeka destekli bir çift programcı ve destek aracıdır.

Azure Databricks Yardımcısı'nın ekran görüntüsü.

Hataları tanımlama ve düzeltme, veri görselleştirmeleri oluşturma, iş sorunlarını tanılama ve doğal dil istemlerini kullanarak verileri filtreleme veya analiz etme gibi çok çeşitli görevlere yardımcı olabilir. Yardımcı, Azure Databricks belgelerinden ilgili yönergeleri ortaya çıkarabilir.

Unity Kataloğu meta verilerini kullanarak yanıtlarını kuruluşunuzun veri varlıklarına (tablolar, sütunlar ve açıklamalar) göre kişiselleştirerek verilerinizi keşfetmeyi ve bunlarla çalışmayı kolaylaştırır.