Azure Synapse Apache Spark Havuzlarıyla veri mühendisliği gerçekleştirme

Orta
Data Engineer
Azure Synapse Analytics

Apache Spark, büyük veri analizi ve dönüştürme için yüksek oranda ölçeklenebilir bir dağıtılmış işleme çözümüdür. Spark havuzlarını kullanarak Azure Synapse Analytics'teki gücünden yararlanabilirsiniz.

Önkoşullar

Bu öğrenme yoluna başlamadan önce Azure Synapse Analytics hakkında bilgi sahibi olmanız gerekir. Öncelikle Azure Synapse Analytics'e Giriş modülünü tamamlamalısınız.

Bu öğrenme yolundaki modüller

Apache Spark, büyük ölçekli veri analizi için temel bir teknolojidir. Bir veri gölündeki verileri analiz etmek ve görselleştirmek için Azure Synapse Analytics'te Spark'ı kullanmayı öğrenin.

Veri mühendislerinin genellikle büyük hacimli verileri dönüştürmesi gerekir. Azure Synapse Analytics'teki Apache Spark havuzları, bu hedefe ulaşmak için kullanabilecekleri bir dağıtılmış işleme platformu sağlar.

Delta Lake, Azure Synapse Analytics'te bir veri gölü mimarisi uygulamak için kullanabileceğiniz spark için açık kaynak bir ilişkisel depolama alanıdır.