Genel kullanıma açık veri kümeleriyle makine öğrenmesi modellerinizin doğruluğunu geliştirin. Makine öğrenmesi projelerinde kullanıma hazır olan seçilmiş veri kümelerini kullanarak veri bulma ve hazırlama konusunda zaman kazanın.
Sarı taksi yolculuğu kayıtları teslim alma ve bırakma tarihlerini/saatlerini, teslim ve bırakma konumlarını, seyahat mesafelerini, listelenmiş tarifeleri, fiyat türlerini, ödeme türlerini ve sürücü tarafından bildirilen yolcu sayısını içerir.
Yeşil taksi yolculuğu kayıtları teslim alma ve bırakma tarihlerini/saatlerini, teslim ve bırakma konumlarını, seyahat mesafelerini, listelenmiş tarifeleri, fiyat türlerini, ödeme türlerini ve sürücü tarafından bildirilen yolcu sayısını içerir.
COVID-19 Data Lake koleksiyonu, COVID-19 ile ilgili olarak çeşitli kaynaklardan alınmış test ve hasta sonucu izleme verileri, sosyal mesafe ilkesi, hastane kapasitesi, hareketlilik gibi bilgileri içeren veri kümelerinin bir koleksiyondur.
COVID-19 ve koronavirüs ile ilgili bilimsel makalelere ait tam metinleri ve meta verileri makine tarafından okunabilecek şekilde iyileştirilmiş olarak içeren ve küresel araştırma topluluğunun kullanımına sunulan veri kümesi.
Genomiks Data Lake, ücretsiz olarak erişebileceğiniz ve genomiks analizi iş akışlarınızla uygulamalarınızla tümleştirebileceğiniz çeşitli genel veri kümeleri sağlar. Veri kümelerinde BAM, FASTA, VCF ve CSV dosya biçimlerindeki genom dizileri, değişkenlik bilgisi ve konu/örnek meta verileri bulunur.
ABD İşgücü İstatistikleri, ABD’deki yaş, cinsiyet, ırk ve etnik köken gruplarına göre İş Gücü İstatistiklerini, iş gücüne katılım oranlarını ve kurumsal olmayan sivil nüfus bilgilerini sunar. analiz eder.
Mevcut İstihdam İstatistikleri (CES) programı, ABD’deki tarım dışı istihdam, çalışma saatleri ve bordrolu çalışan kazançları hakkında ayrıntılı sektör tahminleri üretir.
Mevcut İstihdam İstatistikleri (CES) programı, ABD’deki tarım dışı istihdam, çalışma saatleri ve bordrolu çalışan kazançları hakkında ayrıntılı sektör tahminleri üretir.
ABD Yerel Bölge İşsizlik İstatistikleri veri kümeleri; ABD’deki Sayım bölgeleri ile bölümleri, Eyaletler, vilayetler, metropol alanları ve birçok şehir için aylık ve yıllık istihdam, işsizlik ve işgücü verilerini sağlar.
Tüketici Fiyat Endeksi (CPI), şehirli tüketicilerin tüketici ürün ve hizmetlerinden oluşan bir market arabası için ödediği fiyatta zaman içinde meydana gelen değişikliğin ölçümüdür.
2000 ve 2010 On Yıllık Sayımında her kullanılan her ABD vilayeti için cinsiyet ve ırka göre ABD nüfusu. Bu veri kümesinin kaynağı United States Census Bureau’dur.
2010 On Yıllık Sayımında her kullanılan her ABD posta kodu için cinsiyet ve ırka göre ABD nüfusu. Bu veri kümesinin kaynağı United States Census Bureau’dur.
Bu veri kümesi 2010’dan günümüze kadar tüm New York City 311 hizmet aramalarını içerir. ™Parquet biçiminde depolanır ve günlük olarak güncelleştirilir.
Bu veri kümesi, Dominick'in OJ veri kümesinden türetilir ve Azure Machine Learning üzerinde aynı anda binlerce modelin eğitmesini kolaylaştıran bir veri kümesi sağlama hedefiyle fazladan simülasyon verileri içerir.
El yazısı rakamlardan oluşan MNIST veritabanı, 60.000 örnekli bir eğitim kümesi ve 10.000 örnekli bir test kümesi içerir. Rakamlar normal boyuttadır ve sabit boyutlu bir görüntüde ortalanmıştır.
Microsoft Haber Veri Kümesi (MIND), haber önerisi araştırması için büyük ölçekli bir veri kümesidir. Haber önerisi için kıyaslama veri kümesi görevi görür ve haber önerisi ve öneren sistemlerde araştırmayı kolaylaştırır.