Aracılığıyla paylaş


Azure Açık Veri Kümeleri nedir ve bunları nasıl kullanabilirsiniz?

Azure Açık Veri Kümeleri , daha doğru modeller için makine öğrenmesi çözümlerine senaryoya özgü özellikler eklemek için kullanabileceğiniz genel veri kümeleridir. Açık Veri Kümeleri Microsoft Azure'da buluttadır ve Azure Machine Learning ile tümleşiktir ve Azure Databricks ve Machine Learning Studio (klasik) tarafından kullanılabilir. Ayrıca api'ler aracılığıyla veri kümelerine erişebilir ve bunları Power BI ve Azure Data Factory gibi diğer ürünlerde kullanabilirsiniz.

Veri kümeleri, makine öğrenmesi modellerini eğitip tahmine dayalı çözümleri zenginleştirmenize yardımcı olan hava durumu, nüfus sayımı, tatiller, kamu güvenliği ve konum için genel etki alanı verilerini içerir. Genel veri kümelerinizi Azure Açık Veri Kümelerinde de paylaşabilirsiniz.

Azure Açık Veri Kümeleri bileşenleri

Seçilmiş, hazırlanmış veri kümeleri

Azure Açık Veri Kümeleri'ndeki seçilmiş açık genel veri kümeleri, makine öğrenmesi iş akışlarında kullanım için iyileştirilmiştir.

Kullanılabilir tüm veri kümelerini görmek için Azure Açık Veri Kümeleri Kataloğu'na gidin.

Veri bilimciler genellikle zamanlarının çoğunu gelişmiş analiz için verileri temizlemek ve hazırlamak için harcar. Açık Veri Kümeleri Azure buluta kopyalanır ve zaman kazanmak için önceden işlenir. Düzenli aralıklarla veriler, Ulusal Okyanus ve Atmosfer Yönetici(NOAA) ile FTP bağlantısı gibi kaynaklardan çekilir. Daha sonra veriler yapılandırılmış bir biçimde ayrıştırılır ve ardından Posta Kodu veya en yakın hava istasyonunun konumu gibi özelliklerle uygun şekilde zenginleştirilir.

Veri kümeleri Azure'da bulut işlem ile birlikte barındırılır ve bu da erişimi ve işlemeyi kolaylaştırır.

Aşağıda kullanılabilir veri kümeleri örnekleri verilmiştir.

Hava durumu verileri

Veri kümesi Notebooks Açıklama
NOAA Tümleşik Surface Verileri (ISD) Azure Notebooks
Azure Databricks
NOAA'dan Kuzey Amerika, Avrupa, Avustralya ve Asya'nın bazı bölgelerinde en iyi uzamsal kapsama sahip dünya çapında saatlik hava durumu verileri. Günlük olarak güncelleştirildi.
NOAA Genel Tahmin Sistemi (GFS) Azure Notebooks
Azure Databricks
NOAA'dan 15 günlük ABD saatlik hava durumu tahmini verileri. Günlük olarak güncelleştirildi.

Takvim verileri

Veri kümesi Notebooks Açıklama
Resmi Tatiller Azure Notebooks
Azure Databricks
1970 ile 2099 arasında 41 ülke veya bölgeyi kapsayan dünya çapında resmi tatil verileri. Ülke/bölge ve çoğu kişinin ücretli izinli olup olmadığını içerir.

Veri kümelerine erişim

Bir Azure hesabı kullanarak açık veri kümelerine kod aracılığıyla veya Azure hizmet arabiriminden erişebilirsiniz. Veriler, makine öğrenmesi çözümünüzde kullanılmak üzere Azure bulut bilişim kaynaklarıyla aynı konumda tutulur.

Açık Veri Kümeleri'ni Azure Machine Learning kullanıcı arabirimi ve SDK'sı aracılığıyla kullanabilirsiniz. Açık Veri Kümeleri ayrıca Azure Machine Learning ve Azure Databricks hizmetlerine veri bağlamak için kullanabileceğiniz Azure Notebooks ve Azure Databricks not defterleri sunar. Veri kümelerine Python SDK'sı üzerinden de erişim sağlanabilir.

Ancak Açık Veri Kümeleri'ne erişmek için bir Azure hesabına ihtiyacınız yoktur. Spark bulunan veya bulunmayan herhangi bir Python ortamından erişebilirsiniz.

Veri kümelerini isteme veya katkıda bulunma

İstediğiniz verileri bulamıyorsanız, bir veri kümesi istemek veya bir veri kümesine katkıda bulunmak için bize e-posta gönderin.

Sonraki adımlar