Azure'da veri analizi ve raporlama teknolojisi seçme
Büyük veri çözümlerinin çoğunun amacı analiz ve raporlama aracılığıyla veriler hakkında öngörüler sağlamaktır. Bu, önceden yapılandırılmış raporları ve görselleştirmeleri veya etkileşimli veri keşfini içerebilir.
Veri analizi teknolojisini seçerken seçenekleriniz nelerdir?
Gereksinimlerinize bağlı olarak Azure'da analiz, görselleştirme ve raporlama için çeşitli seçenekler vardır:
- Power BI
- Jupyter Notebook
- Zeppelin Not Defterleri
- Visual Studio Code'da Jupyter Not Defterleri (VS Code)
Power BI
Power BI , bir iş analizi araçları paketidir. Yüzlerce veri kaynağına bağlanabilir ve geçici analiz için kullanılabilir. Şu anda kullanılabilir olan veri kaynaklarının listesine bakın. Ek lisanslama gerektirmeden Power BI'ı kendi uygulamalarınızla tümleştirmek için Power BI Embedded'i kullanın.
Kuruluşlar rapor oluşturmak ve bunları kuruluşta yayımlamak için Power BI'ı kullanabilir. Herkes idare ve güvenlik yerleşik olarak kişiselleştirilmiş panolar oluşturabilir. Power BI, Power BI hizmeti oturum açan kullanıcıların kimliğini doğrulamak için Microsoft Entra Id kullanır ve kullanıcı kimlik doğrulaması gerektiren kaynaklara erişmeye çalıştığında Power BI oturum açma kimlik bilgilerini kullanır.
Jupyter Notebooks
Jupyter Notebooks, veri bilimcilerinin Python, Scala veya R kodu ve markdown metni içeren not defteri dosyaları oluşturmasına olanak tanıyan tarayıcı tabanlı bir kabuk sunarak kodu paylaşarak ve belgeleyerek ve sonuçları tek bir belgede belgeleyerek etkili bir işbirliği yapmanın etkili bir yoludur.
Spark veya Hadoop gibi çoğu HDInsight kümesi türü, verilerle etkileşimde bulunmaya ve işlenmek üzere iş göndermeye yönelik Jupyter not defterleriyle önceden yapılandırılmış olarak gelir. Kullandığınız HDInsight kümesinin türüne bağlı olarak, kodunuzu yorumlamak ve çalıştırmak için bir veya daha fazla çekirdek sağlanacaktır. Örneğin, HDInsight'ta Spark kümeleri, Spark altyapısını kullanarak Python veya Scala kodunu yürütmek için arasından seçim yapabileceğiniz Spark ile ilgili çekirdekler sağlar.
Jupyter not defterleri, Power BI gibi bir BI/raporlama aracıyla daha gelişmiş görselleştirmeler oluşturmadan önce verilerinizi analiz etmek, görselleştirmek ve işlemek için harika bir ortam sağlar.
Zeppelin Not Defterleri
Zeppelin Notebooks , işlevsellikte Jupyter'a benzer şekilde tarayıcı tabanlı bir kabuk için başka bir seçenektir. Bazı HDInsight kümeleri Zeppelin not defterleriyle önceden yapılandırılmış olarak gelir. Ancak, HDInsight Etkileşimli Sorgu (Hive LLAP) kümesi kullanıyorsanız, zeppelin şu anda etkileşimli Hive sorguları çalıştırmak için kullanabileceğiniz tek not defteri seçiminizdir. Ayrıca, etki alanına katılmış bir HDInsight kümesi kullanıyorsanız, not defterlerine ve temel hive tablolarına erişimi denetlemek için farklı kullanıcı oturum açma bilgileri atamanızı sağlayan tek tür Zeppelin not defterleridir.
VS Code'da Jupyter Not Defterleri
VS Code, yerel olarak kullanabileceğiniz veya uzak işlemle bağlanabileceğiniz ücretsiz bir kod düzenleyicisi ve geliştirme platformudur. Jupyter uzantısıyla birlikte, jupyter geliştirme için ek dil uzantılarıyla geliştirilebilen tam bir ortam sunar. Seçtiğiniz işlemi kullanabilme özelliğiyle sınıfının en iyisi, ücretsiz Bir Jupyter deneyimi istiyorsanız, bu harika bir seçenektir. VS Code kullanarak uzak ve kapsayıcılara karşı not defterleri geliştirebilir ve çalıştırabilirsiniz. Azure Notebooks'tan geçişi kolaylaştırmak için kapsayıcı görüntüsünün VS Code ile de kullanılabilmesini sağladık.
Jupyter (eski adıyla IPython Notebook), Markdown metniyle yürütülebilir Python kaynak kodunu not defteri adı verilen tek bir tuvalde kolayca birleştirmenizi sağlayan açık kaynaklı bir projedir. Visual Studio Code, Jupyter Notebooks ile yerel olarak ve Python kod dosyaları aracılığıyla çalışmayı destekler.
Anahtar seçim ölçütleri
Seçenekleri daraltmak için şu soruları yanıtlayarak başlayın:
Etki alanınıza yayılmış veriler için raporlar oluşturmak için merkezi bir yer sağlayarak çok sayıda veri kaynağına bağlanmanız mı gerekiyor? Bu durumda, 100'lere ait veri kaynaklarına bağlanmanızı sağlayan bir seçenek belirleyin.
Dinamik görselleştirmeleri bir dış web sitesine veya uygulamaya eklemek istiyor musunuz? Öyleyse, ekleme özellikleri sağlayan bir seçenek belirleyin.
Görselleştirmelerinizi ve raporlarınızı çevrimdışıyken tasarlamak istiyor musunuz? Evet ise, çevrimdışı özelliklere sahip bir seçenek belirleyin.
Büyük veya karmaşık yapay zeka modellerini eğitmek veya çok büyük veri kümeleriyle çalışmak için ağır işleme gücüne mi ihtiyacınız var? Evet ise, büyük bir veri kümesine bağlanabilecek bir seçenek belirleyin.
Yetenek matrisi
Aşağıdaki tablolarda, özelliklerdeki temel farklar özetlemektedir.
Genel özellikler
Özellik | Power BI | Jupyter Notebooks | Zeppelin Not Defterleri | VS Code'da Jupyter Not Defterleri |
---|---|---|---|---|
Gelişmiş işleme için büyük veri kümesine bağlanma | Yes | Evet | Evet | Hayır |
Yönetilen hizmet | Yes | Evet 1 | Evet 1 | Yes |
100'lere ait veri kaynaklarına bağlanma | Yes | Hayır | Hayır | Hayır |
Çevrimdışı özellikler | Evet 2 | Hayır | Hayır | Hayır |
Ekleme özellikleri | Yes | Hayır | Hayır | Hayır |
Otomatik veri yenileme | Yes | Hayır | Hayır | Hayır |
Çok sayıda açık kaynak paketine erişim | Hayır | Evet 3 | Evet 3 | Evet 4 |
Veri dönüştürme/temizleme seçenekleri | Power Query, R | Python, R, Julia ve Scala dahil 40 dil | Python, JDBC ve R dahil 20'den fazla yorumlayıcı | Python, F#, R |
Fiyatlandırma | Power BI Desktop (yazma) için ücretsiz, bkz. Barındırma seçenekleri için fiyatlandırma | Ücretsiz | Ücretsiz | Ücretsiz |
Çok kullanıcılı işbirliği | Evet | Evet (JupyterHub gibi çok kullanıcılı bir sunucuyla veya paylaşım yoluyla) | Yes | Evet (paylaşım yoluyla) |
[1] Yönetilen bir HDInsight kümesinin parçası olarak kullanıldığında.
[2] Power BI Desktop kullanımıyla.
[2] Topluluk tarafından katkıda bulunan paketler için Maven deposunda arama yapabilirsiniz.
[3] Python paketleri pip veya Conda kullanılarak yüklenebilir. R paketleri CRAN veya GitHub'dan yüklenebilir. F# içindeki paketler Paket bağımlılık yöneticisi kullanılarak nuget.org aracılığıyla yüklenebilir.
Katkıda Bulunanlar
Bu makale Microsoft tarafından yönetilir. Başlangıçta aşağıdaki katkıda bulunanlar tarafından yazılmıştır.
Asıl yazar:
- Zoiner Tejada | CEO ve Mimar
Sonraki adımlar
- Python için Jupyter not defterlerini kullanmaya başlama
- Notebooks
- Azure Data Factory ile Azure Databricks Notebooks'u çalıştırma
- Çalışma alanınızda Jupyter not defterlerini çalıştırma
- Power BI nedir?