Aracılığıyla paylaş


Azure Databricks bileşenleri

Bu makalede, Azure Databricks'i etkili bir şekilde kullanmak için anlamanız gereken temel bileşenler tanıtılmaya çalışlanmaktadır.

Hesaplar ve çalışma alanları

Azure Databricks'te çalışma alanı , ekibinizin Databricks varlıklarına erişmesi için bir ortam olarak işlev gösteren bulutta bir Azure Databricks dağıtımıdır. Kuruluşunuz, ihtiyaçlarına bağlı olarak birden çok çalışma alanı veya yalnızca bir çalışma alanı olmasını seçebilir.

Azure Databricks hesabı , birden çok çalışma alanı içerebilen tek bir varlığı temsil eder. Unity Kataloğu için etkinleştirilen hesaplar, kullanıcıları ve bu kullanıcıların hesaptaki tüm çalışma alanlarındaki verilere erişimini merkezi olarak yönetmek için kullanılabilir.

Faturalama: Databricks Üniteleri (DBU)

Azure Databricks, VM örneği türüne bağlı olarak saat başına işlem kapasitesi birimleri olan Databricks birimleri (DBU) üzerinden faturalandırılır.

Bkz. Azure Databricks fiyatlandırma sayfası.

Kimlik doğrulaması ve yetkilendirme

Bu bölümde, Azure Databricks kimliklerini yönetirken bilmeniz gereken kavramlar ve bunların Azure Databricks varlıklarına erişimi açıklanmaktadır.

Kullanıcı

Sisteme erişimi olan benzersiz bir kişi. Kullanıcı kimlikleri e-posta adresleriyle temsil edilir. Bkz. Kullanıcıları yönetme.

Hizmet sorumlusu

İşler, betikler, uygulamalar, CI/CD platformları gibi otomasyon araçları ve sistemlerle kullanmak için bir hizmet kimliği. Hizmet sorumluları bir uygulama kimliğiyle temsil edilir. Bkz. Hizmet sorumluları.

Grup

Kimliklerden oluşan bir koleksiyon. Gruplar kimlik yönetimini basitleştirerek çalışma alanlarına, verilere ve güvenli hale getirilebilen diğer nesnelere erişim atamayı kolaylaştırır. Databricks kimliklerinin tamamı gruplara üye olarak atanabilir. Bkz. Gruplar.

Erişim denetim listesi (ACL)

Çalışma alanına, kümeye, işe, tabloya veya denemeye eklenmiş izinlerin listesi. ACL, nesnelere hangi kullanıcılara veya sistem işlemlerine erişim verildiğini ve varlıklar üzerinde hangi işlemlere izin verildiğini belirtir. Tipik bir ACL'deki her girdi bir konu ve bir işlem belirtir. Bkz . Erişim denetim listeleri.

Kişisel erişim belirteci (PAT)

Kişisel erişim belirteci REST API çağrılarının, Teknoloji iş ortağı bağlantılarının ve diğer araçların kimliğini doğrulamak için kullanılan bir dizedir. Bkz. Azure Databricks kişisel erişim belirteçleriyle kimlik doğrulaması (eski).

Rest API'de kimlik doğrulaması yapmak için Microsoft Entra Id belirteçleri de kullanılabilir.

Azure Databricks arabirimleri

Bu bölümde, Azure Databricks'teki varlıklarınıza erişmeye yönelik arabirimler açıklanmaktadır.

Kullanıcı arabirimi

Azure Databricks kullanıcı arabirimi, çalışma alanı klasörleri ve bunların içerdiği nesneler, veri nesneleri ve hesaplama kaynakları gibi özelliklerle etkileşime yönelik bir grafik arabirimdir.

REST API

Databricks REST API,Azure Databricks hesabı ve çalışma alanı nesneleri hakkında bilgi değiştirmek veya istemek için uç noktalar sağlar. Bkz. hesap başvurusu ve çalışma alanı başvurusu.

SQL REST API

SQL REST API,SQL nesnelerindeki görevleri otomatikleştirmenizi sağlar. Bkz. SQL API'si.

CLI

Databricks CLI, GitHub'da barındırılır. CLI, Databricks REST API'sinin üzerine kurulmuştur.

Veri yönetimi

Bu bölümde, Azure Databricks'te verileri düzenlemek ve yönetmek için kullanılan araçlar ve mantıksal nesneler açıklanmaktadır. Bkz. Azure Databricks'te veritabanı nesneleri.

Unity Kataloğu

Unity Kataloğu, Databricks çalışma alanlarında merkezi erişim denetimi, denetim, köken ve veri bulma özellikleri sağlayan Azure Databricks'te veriler ve yapay zeka varlıkları için birleşik bir idare çözümüdür. Bkz. Unity Kataloğu nedir?.

Katalog

Kataloglar, Azure Databricks'te verileri düzenlemeye ve yalıtmaya yönelik en üst düzey kapsayıcıdır. Katalogları aynı bölge ve hesap içindeki çalışma alanları arasında paylaşabilirsiniz. Bkz. Azure Databricks'te kataloglar nelerdir?.

Şema

Veritabanları olarak da bilinen şemalar katalogların içinde yer alır ve daha ayrıntılı bir kuruluş düzeyi sağlar. Birimler, tablolar, işlevler ve modeller gibi veritabanı nesnelerini ve yapay zeka varlıklarını içerir. Bkz. Azure Databricks'te şemalar nelerdir?.

Masa

Tablolar yapılandırılmış verilere erişimi düzenler ve yönetir. Apache Spark SQL ve Apache Spark API'leri ile tabloları sorgularsınız. Bkz. Azure Databricks tabloları.

Görüntüle

Görünüm, bir veya daha fazla tablo ve görünümden türetilmiş salt okunur bir nesnedir. Görünümler, tablolarda tanımlanan sorguları kaydeder. Bkz. Görünüm nedir?.

Hacim

Birimler, bulut nesnesi depolama konumundaki mantıksal depolama birimini temsil eder ve tablosal olmayan verilere erişimi düzenler ve yönetir. Databricks, bulut nesne depolamadaki tablosal olmayan verilere tüm erişimi yönetmek için birimlerin kullanılmasını önerir. Şuna bakın: Unity Kataloğu hacimleri nelerdir?.

Delta tabloları

Varsayılan olarak, Azure Databricks'te oluşturulan tüm tablolar Delta tablolarıdır. Delta tabloları, bulut nesne depoları üzerinde yüksek performanslı ACID tablo depolama için bir çerçeve olan Delta Lake açık kaynak projesini temel alır. Delta tablosu, verileri bulut nesne depolamadaki dosyaların dizini olarak depolar ve tablo meta verilerini bir katalog ve şema içindeki meta veri deposuna kaydeder.

Metadükkan

Unity Kataloğu; veriler, yapay zeka ve kataloglar, şemalar ve tablolar hakkındaki izinlerle ilgili meta verileri kaydeden hesap düzeyinde bir meta veri deposu sağlar. Bkz. Metastore.

Azure Databricks, Unity Kataloğu'nu benimsememiş müşteriler için eski bir Hive meta veri deposu sağlar. Bkz. Hive meta veri deposu tablo erişim denetimi (eski).

Katalog Tarayıcısı

Katalog Gezgini şemalar (veritabanları), tablolar, modeller, birimler (tablosal olmayan veriler), işlevler ve kayıtlı ML modelleri dahil olmak üzere verileri ve yapay zeka varlıklarını keşfetmenize ve yönetmenize olanak tanır. Veri nesnelerini ve sahiplerini bulmak, tablolar arasındaki veri ilişkilerini anlamak ve izinleri ve paylaşımı yönetmek için kullanabilirsiniz. Bkz . Katalog Gezgini nedir?.

DBFS kökü

Önemli

DBFS kök veya DBFS bağlamalarını kullanarak verileri depolama ve bunlara erişme, kullanım dışı bırakılmış bir düzendir ve Databricks tarafından önerilmez. Bunun yerine Databricks, tüm verilere erişimi yönetmek için Unity Kataloğu'nu kullanmanızı önerir. Bkz. Unity Kataloğu nedir?.

DBFS kökü, varsayılan olarak tüm kullanıcılar tarafından kullanılabilen bir depolama konumudur. Bkz. DBFS nedir?.

Hesaplama yönetimi

Bu bölümde, Azure Databricks'te hesaplamaları çalıştırmak için bilmeniz gereken kavramlar açıklanmaktadır.

Küme

Üzerinde not defterlerini ve işleri çalıştırdığınız bir dizi hesaplama kaynağı ve yapılandırma. İki tür küme vardır: çok amaçlı ve görev. Bkz. İşlem.

  • Kullanıcı arabirimini, CLI'yı veya REST API'yi kullanarak çok amaçlı bir küme oluşturursunuz. Genel amaçlı bir kümeyi kendiniz sonlandırıp yeniden başlatabilirsiniz. Birden çok kullanıcı, ortaklaşa etkileşimli analiz yapmak için bu kümeleri paylaşabilir.
  • Azure Databricks iş zamanlayıcı, yeni bir iş kümesinde bir iş çalıştırdığınızda bir iş kümesi oluşturur ve iş tamamlandığında kümeyi sonlandırır. bir iş kümesini yeniden başlatamazsınız .

Havuz

Küme başlatma ve otomatik ölçeklendirme sürelerini azaltan boşta, kullanıma hazır örnekler kümesi. Bir havuza bağlandığında, küme sürücü ve çalışan düğümlerini havuzdan alır. Bkz. Havuz yapılandırma referansı.

Havuz, kümenin isteğini karşılamak için yeterli boşta kaynaklara sahip değilse, örnek sağlayıcısından yeni örnekler ayırarak havuz genişler. Ekli küme sonlandırıldığında, kullandığı örnekler havuza döndürülür ve farklı bir küme tarafından yeniden kullanılabilir.

Databricks çalışma zamanı

Azure Databricks tarafından yönetilen kümelerde çalışan temel bileşenler kümesi. Bkz. İşlem. Azure Databricks aşağıdaki çalışma zamanlarına sahiptir:

  • Databricks Runtime Apache Spark'ı içerir, ancak büyük veri analizinin kullanılabilirliğini, performansını ve güvenliğini önemli ölçüde geliştiren bir dizi bileşen ve güncelleştirme ekler.
  • Machine Learning için Databricks Runtime , Databricks Runtime üzerine kurulmuştur ve Azure Databricks çalışma alanının tüm özellikleriyle tümleştirilmiş önceden oluşturulmuş makine öğrenmesi altyapısı sağlar. TensorFlow, Keras, PyTorch ve XGBoost gibi birden çok popüler kitaplık içerir.

Görevler ve İşlem Hatları Kullanıcı Arabirimi

İşler ve İşlem Hatları çalışma alanı kullanıcı arabirimi, iş akışlarını düzenlemenize ve zamanlamanıza olanak tanıyan araçlar olan İşler, Lakeflow Spark Bildirimli İşlem Hatları ve Lakeflow Connect URI'lerine giriş sağlar.

İşler

Not defterlerini, kitaplıkları ve diğer görevleri düzenlemeye ve zamanlamaya yönelik etkileşimli olmayan bir mekanizma. Bkz. Lakeflow İş

Boru Hatları

Lakeflow Spark Bildirimli İşlem Hatları güvenilir, sürdürülebilir ve test edilebilir veri işleme işlem hatları oluşturmaya yönelik bildirim temelli bir çerçeve sağlar. Bkz . Lakeflow Spark Bildirimli İşlem Hatları.

İş Yükü

İş yükü, bir görevi veya görev grubunu gerçekleştirmek için gereken işleme yeteneği miktarıdır. Azure Databricks iki tür iş yükü tanımlar: veri mühendisliği (iş) ve veri analizi (çok amaçlı).

  • Veri mühendisliği (otomatik) iş yükü, Azure Databricks iş zamanlayıcısının her iş yükü için oluşturduğu bir iş kümesinde çalışır.
  • Veri analizi (Etkileşimli) iş yükü , çok amaçlı bir kümede çalışır. Etkileşimli iş yükleri genellikle azure databricks not defteri içinde komutlar çalıştırır. Ancak, var olan bir çok amaçlı kümede çalıştırmak da etkileşimli bir iş yükü olarak değerlendirilir.

Yürütme bağlamı

Desteklenen her programlama dili için okuma-değerlendirme-yazdırma döngüsü (REPL) ortamının durumu. Desteklenen diller Python, R, Scala ve SQL'tir.

Veri mühendisliği

Veri mühendisliği araçları veri bilimcileri, veri mühendisleri, veri analistleri ve makine öğrenmesi mühendisleri arasında işbirliğine yardımcı olun.

Çalışma alanı

Çalışma alanı, tüm Azure Databricks varlıklarınıza erişmek için bir ortamdır. Çalışma alanı nesneleri (not defterleri, kitaplıklar, panolar ve denemeler) klasörler halinde düzenler ve veri nesnelerine ve hesaplama kaynaklarına erişim sağlar.

Defter

Çalıştırılabilir komutlar, görselleştirmeler ve anlatı metni içerebilen veri bilimi ve makine öğrenmesi iş akışları oluşturmaya yönelik web tabanlı bir arabirim. Bkz. Databricks not defterleri.

Kitaplık

Kümenizde çalışan not defteri veya iş için kullanılabilen bir kod paketi. Databricks çalışma zamanları birçok kitaplık içerir ve kendi kitaplığınızı da yükleyebilirsiniz. Bkz. Kitaplıkları yükle.

Git klasörü (eski adı repos)

İçeriği bir uzak Git deposuyla eşitlenerek birlikte sürümlenen bir klasör. Databricks Git klasörleri , projeleriniz için kaynak ve sürüm denetimi sağlamak üzere Git ile tümleştirilir.

Yapay zeka ve makine öğrenmesi

Databricks, yapay zeka ve makine öğrenmesi uygulamaları geliştirmek ve dağıtmak için yönetilen hizmetlerle tümleşik bir uçtan uca ortam sağlar.

Mozaik yapay zeka

Databricks'in yapay zeka alanındaki en büyük buluşlarından sorumlu araştırmacı ve mühendislerden oluşan bir ekip olan Databricks Mozaik Yapay Zeka Araştırması'nın ürün ve hizmetlerinin markası. Mozaik yapay zeka ürünleri Databricks'teki ML ve AI özelliklerini içerir. Bkz . Mozaik Araştırma.

Makine öğrenmesi çalışma zamanı

Databricks, ML ve AI modelleri geliştirmenize yardımcı olmak için, en yaygın ML ve DL kitaplıkları dahil olmak üzere önceden oluşturulmuş makine öğrenmesi ve derin öğrenme altyapısı ile işlem oluşturmayı otomatik hale getiren bir Machine Learning için Databricks Çalışma Zamanı sağlar. Ayrıca sürücüler ve destekleyici kitaplıklar da dahil olmak üzere yerleşik, önceden yapılandırılmış GPU desteğine sahiptir. Databricks Runtime sürüm notları ve uyumluluğu hakkında en son çalışma zamanı sürümlerine ait bilgileri inceleyin.

Deneme

Makine öğrenmesi modelini eğitmak için bir MLflow koleksiyonu çalıştırılır . Bkz. MLflow denemeleriyle eğitim çalıştırmalarını düzenleme.

Özellikler

Özellikler, ML modellerinin önemli bir bileşenidir. Özellik deposu, kuruluşunuz genelinde özellik paylaşımını ve bulmayı sağlar ve aynı zamanda model eğitimi ve çıkarımı için aynı özellik hesaplama kodunun kullanılmasını sağlar. Bkz. Databricks Özellik Deposu.

Üretken yapay zeka modelleri

Databricks, aşağıdakiler dahil olmak üzere üretken yapay zeka modellerinin keşfini, geliştirilmesini ve dağıtımını destekler:

  • Çalışma alanında LLM'leri test edebileceğiniz, sorabileceğiniz ve karşılaştırabileceğiniz sohbet benzeri bir ortam olan yapay zeka oyun alanı. Bkz. AI Playground kullanarak LLM'lerle sohbet ve prototip oluşturma yapay zeka uygulamaları.
  • Sorgulayabileceğiniz yerleşik bir önceden yapılandırılmış temel model kümesi:
    • Belirteç başına ödeme temel modeli API'lerine bkz .
    • Tek bir tıklamayla hizmet veleyebileceğiniz temel modeller için bkz. [Önerilen] Unity Kataloğu'ndan temel modelleri dağıtma.
  • Üçüncü taraflarca barındırılan LLM'ler, dış modeller olarak adlandırılır. Bu modellerin olduğu gibi kullanılması amaçlanır.
  • Temel modeli özelleştirerek uygulamanızın performansını iyileştirme özellikleri (genellikle ince ayar olarak adlandırılır). Bkz Temel Model İnce Ayarlama.

Model kayıt sistemi

Databricks, Unity Kataloğu'nda MLflow Model Kayıt Defteri'nin barındırılan bir sürümünü sağlar. Unity Kataloğu'nda kayıtlı modeller merkezi erişim denetimini, kökeni ve çalışma alanları arası bulma ve erişimi devralır. Bkz. Unity Kataloğu'nda model yaşam döngüsünü yönetme.

Model servisi

Mozaik Yapay Zeka Modeli Sunma, yapay zeka modellerini dağıtmak, yönetmek ve sorgulamak için birleşik bir arabirim sağlar. Hizmet ettiğiniz her model, web veya istemci uygulamanızla tümleştirebileceğiniz bir REST API olarak kullanılabilir. Mozaik AI Model Sunma ile kendi modellerinizi, temel modellerinizi veya Databricks dışında barındırılan üçüncü taraf modellerinizi dağıtabilirsiniz. Bkz. Mozaik Yapay Zeka Modeli Sunma kullanarak modelleri dağıtma.

Veri ambarı oluşturma

Veri ambarı, iş içgörüleri ve raporlama için hızlı bir şekilde erişilebilir olması için birden çok kaynaktan veri toplamayı ve depolamayı ifade eder. Databricks SQL, veri ambarı özelliklerini ve performansını mevcut veri göllerinize getiren hizmet koleksiyonudur. Bkz. Veri ambarı mimarisi.

Sorgu

Sorgu, verilerinizle etkileşim kurmanızı sağlayan geçerli bir SQL deyimidir. Platform içi SQL düzenleyicisini kullanarak sorgu yazabilir veya SQL bağlayıcısı, sürücüsü veya API kullanarak bağlanabilirsiniz. Sorgularla çalışma hakkında daha fazla bilgi edinmek için bkz. Kaydedilen sorgulara erişme ve bu sorguları yönetme .

SQL ambarı

SQL sorgularını çalıştırdığınız bir hesaplama kaynağı. Üç tür SQL ambarı vardır: Klasik, Pro ve Sunucusuz. Azure Databricks, kullanılabilir durumda sunucusuz ambarların kullanılmasını önerir. Her ambar türü için kullanılabilir özellikleri karşılaştırmak için bkz. SQL ambar türleri.

Sorgu geçmişi

Yürütülen sorguların ve performans özelliklerinin listesi. Sorgu geçmişi, performans sorunlarını belirlemenize ve sorgu çalışma zamanlarını iyileştirmenize yardımcı olarak sorgu performansını izlemenize olanak tanır. Bkz. Sorgu geçmişi.

Görselleştirme

Sorgu çalıştırma sonucunun grafik sunusu. Bkz . Databricks not defterlerindeki görselleştirmeler ve SQL düzenleyicisi.

Pano

Veri görselleştirmeleri ve açıklama sunusu. Azure Databricks hesabınızdaki herkese otomatik olarak rapor göndermek için panoları kullanabilirsiniz. Doğal dil istemlerini temel alan görselleştirmeler oluşturmanıza yardımcı olması için Databricks Yardımcısı'nı kullanın. Bkz. Gösterge Tabloları. Not defterinden de bir pano oluşturabilirsiniz. Bkz. Not defterlerindeki panolar.

Önemli

Databricks, AI/BI panoları (eski adıyla Lakeview panoları) kullanılmasını önerir. Daha önce Databricks SQL panoları olarak adlandırılan panoların önceki sürümleri artık eski panolar olarak adlandırılıyor.

Destek sonu zaman çizelgesi:

  • 12 Ocak 2026: Eski panolara ve API'lere artık doğrudan erişilemiyor. Ancak bunları yine de yapay zeka/BI panolarına dönüştürebilirsiniz. Geçiş sayfası 2 Mart 2026'ya kadar kullanılabilir.

Geçiş aracını veya REST API'yi kullanarak eski panoları dönüştürün. AI/BI panosuna eski bir panoyu kopyalamak için yerleşik geçiş aracını kullanma talimatları için bkz . Bkz. REST API kullanarak pano oluşturma ve yönetme öğreticilerine yönelik panoları yönetmek için Azure Databricks API'lerini kullanma .