Azure'da toplu işlem teknolojisi seçme

2025-04-22

Büyük veri çözümleri genellikle genel veri işleme çözümüne katkıda bulunan ayrık toplu işleme görevlerinden oluşur. İçgörülere anında erişim gerektirmeyen iş yükleri için toplu işlem kullanabilirsiniz. Toplu işleme gerçek zamanlı işleme gereksinimlerini tamamlayabilir. Karmaşıklığı dengelemek ve genel uygulamanız için maliyeti azaltmak için toplu işlemeyi de kullanabilirsiniz.

Toplu işleme altyapılarının temel gereksinimi, büyük hacimli verileri işlemek için hesaplamaların ölçeğini genişletmektir. Gerçek zamanlı işlemenin aksine, toplu işlemede verinin alınması ile bir sonucun hesaplanması arasındaki bekleme süreleri dakika veya saat cinsinden olabilmektedir.

Toplu işleme için bir teknoloji seçin

Microsoft, toplu işlem yapmak için kullanabileceğiniz çeşitli hizmetler sunar.

Microsoft Fabric

Microsoft Fabric , kuruluşlar için hepsi bir arada analiz ve veri platformudur. Hizmet olarak yazılım sunumu, uçtan uca analiz çözümünüzü sağlama, yönetme ve yönetişim süreçlerinizi basitleştirir. Platform, veri taşıma, işleme, alma, dönüştürme ve raporlama işlemlerini gerçekleştirir. Toplu işleme için kullandığınız alt yapı özellikleri arasında veri mühendisliği, veri ambarları, veri gölleri ve Apache Spark işleme yer alır. Fabric'deki Azure Data Factory, göl evlerini de destekler. Geliştirmeyi basitleştirmek ve hızlandırmak için yapay zeka destekli Copilot'ı etkinleştirebilirsiniz.

Diller: R, Python, Java, Scala ve SQL
Güvenlik: Yönetilen sanal ağ ve OneLake rol tabanlı erişim denetimi (RBAC)
Birincil depolama: Kısayolları ve yansıtma seçeneklerini içeren OneLake
Spark: Önceden doldurulan başlangıç havuzu ve önceden tanımlanmış düğüm boyutlarına sahip özel spark havuzu

Azure Synapse Analytics

Azure Synapse Analytics , hem SQL hem de Spark teknolojilerini bir çalışma alanının tek bir yapısı altında bir araya getiren bir kurumsal analiz hizmetidir. Azure Synapse Analytics güvenliği, idareyi ve yönetimi basitleştirir. Her çalışma alanında uçtan uca iş akışları yazmak için kullanabileceğiniz tümleşik veri işlem hatları vardır. Ayrıca büyük ölçekli analizler için ayrılmış bir SQL havuzu, gölü doğrudan sorgulamak için kullanabileceğiniz sunucusuz bir SQL uç noktası ve dağıtılmış veri işleme için spark çalışma zamanı da sağlayabilirsiniz.

Diller: Python, Java, Scala ve SQL
Güvenlik: Azure Data Lake Storage'da yönetilen sanal ağ, RBAC ve erişim denetimi ve depolama erişim denetimi listeleri
Birincil depolama: Data Lake Storage ve diğer kaynaklarla entegre olur.
Spark: Önceden tanımlanmış düğüm boyutlarıyla özel Spark yapılandırma kurulumu

Azure Databricks

Azure Databricks , Spark tabanlı bir analiz platformudur. Açık kaynak Spark'ın üzerine kurulu zengin ve premium Spark özelliklerine sahiptir. Azure Databricks, Azure hizmetlerinin geri kalanıyla tümleşen bir Microsoft hizmetidir. Spark kümesi dağıtımları için ek yapılandırmalar içerir. Unity Kataloğu, Azure Databricks Spark nesnelerinin idaresini basitleştirmeye yardımcı olur.

Diller: R, Python, Java, Scala ve Spark SQL.
Güvenlik: Microsoft Entra Id ile kullanıcı kimlik doğrulaması.
Birincil depolama: Azure Blob Depolama, Data Lake Storage, Azure Synapse Analytics ve diğer hizmetlerle yerleşik tümleştirme. Daha fazla bilgi için bkz . Veri kaynakları.

Diğer avantajlar şunlardır:

İşbirliği ve veri keşfi için web tabanlı not defterleri .
Hızlı küme başlangıç süreleri, otomatik sonlandırma ve otomatik ölçeklendirme.
GPU özellikli kümeler için destek.

Anahtar seçim ölçütleri

Toplu işlemeye yönelik teknolojinizi seçmek için aşağıdaki soruları göz önünde bulundurun:

Yönetilen hizmet mi istiyorsunuz yoksa kendi sunucularınızı mı yönetmek istiyorsunuz?
Toplu işleme mantığını bildirimli veya kesin olarak yazmak istiyor musunuz?
Seri işlemleri kısa aralıklarla, toplu halde mi gerçekleştiriyorsunuz? Evet ise, bir kümeyi otomatik olarak sonlandırma olanağı sağlayan veya her toplu iş için fiyatlandırma modellerine sahip seçenekleri göz önünde bulundurun.
Başvuru verilerini aramak için toplu işlemle birlikte ilişkisel veri depolarını sorgulamanız mı gerekiyor? Evet ise, dış ilişkisel depoları sorgulama olanağı sağlayan seçenekleri göz önünde bulundurun.

Yetenek matrisi

Aşağıdaki tablolarda hizmetler arasındaki özelliklerdeki önemli farklar özetlenmektedir.

Genel özellikler

Yetenek	Kumaş	Azure Synapse Analytics	Azure Databricks
Hizmet olarak yazılım	Evet¹	Hayı	Hayı
Yönetilen hizmet	Hayı	Evet	Evet
İlişkisel veri deposu	Evet	Evet	Evet
Fiyatlandırma modeli	Kapasite birimleri	SQL havuzu veya küme çalışma saati	Azure Databricks birim ² ve küme saati

[1] Atanan Kumaş kapasitesi.

[2] Azure Databricks birimi saatte bir işleme özelliğidir.

Diğer özellikler

Yetenek	Kumaş	Azure Synapse Analytics	Azure Databricks
Otomatik ölçeklendirme	Hayı	Hayı	Evet
Ölçek genişletme ayrıntı seviyesi	Kumaş Başına SKU	Küme başına veya SQL havuzu başına	Küme başına
Verilerin bellek içi önbelleğe alınmasını sağlama	Hayı	Evet	Evet
Dış ilişkisel depolardan sorgu	Evet	Hayı	Evet
Kimlik Doğrulaması	Microsoft Entra Kimlik	SQL veya Microsoft Entra Kimliği	Microsoft Entra Kimlik
Denetim	Evet	Evet	Evet
Satır düzeyi güvenlik	Evet	Evet ¹	Evet
Güvenlik duvarlarını destekler	Evet	Evet	Evet
Dinamik veri maskeleme	Evet	Evet	Evet

[1] Yalnızca filtre koşulu. Daha fazla bilgi için bkz . Satır düzeyi güvenlik.

Katkıda Bulunanlar

Bu makale Microsoft tarafından yönetilir. Başlangıçta aşağıdaki katkıda bulunanlar tarafından yazılmıştır.

Asıl yazarlar:

Zoiner Tejada | CEO ve Mimar
Pratima Valavala | Temel Çözüm Mimarı

Genel olmayan LinkedIn profillerini görmek için LinkedIn'de oturum açın.

Aracılığıyla paylaş