Aracılığıyla paylaş


Azure Açık Veri Kümeleri

Genel olarak kullanılabilir veri kümeleri ile makine öğrenimi modellerinizin doğruluğunu geliştirin. Veri bulma ve hazırlama konusunda zaman kazanmak için, makine öğrenmesi projelerine hazır seçilmiş veri kümelerini kullanın.

Ulaşım

Veri kümesi Açıklama
TartanAir: Airsim Benzetim Veri Kümesi Eşzamanlı Yerelleştirme ve Eşlemeyi (SLAM) çözmek için oluşturulan AirSim Otonom araç verileri.
NYC Taksi ve Limuzin Komisyonu - sarı taksi seyahat kayıtları Sarı taksi seyahati kayıtları teslim ve bırakma tarihlerini/saatlerini, teslim ve bırakma konumlarını, seyahat mesafelerini, listelenmiş ücretleri, fiyat türlerini, ödeme türlerini ve sürücü tarafından bildirilen yolcu sayısını içerir.
NYC Taksi ve Limuzin Komisyonu - yeşil taksi seyahat kayıtları Yeşil taksi seyahati kayıtları teslim ve bırakma tarihlerini/saatlerini, teslim ve bırakma konumlarını, seyahat mesafelerini, öğeli ücretleri, fiyat türlerini, ödeme türlerini ve sürücü tarafından bildirilen yolcu sayısını içerir.
NYC Taksi ve Limuzin Komisyonu - Kiralık Araç (FHV) seyahat kayıtları For-Hire Vehicle seyahat kayıtları, gönderim temel lisans numarası ile teslim tarihi, saati ve taksi bölgesi konum kimliğini içerir.

Sağlık ve genomiks

Veri kümesi Açıklama
COVID-19 Data Lake COVID-19 Data Lake koleksiyonu, COVID-19 ile ilgili olarak çeşitli kaynaklardan alınmış test ve hasta sonucu izleme verileri, sosyal mesafe ilkesi, hastane kapasitesi, hareketlilik gibi bilgileri içeren veri kümelerinin bir koleksiyondur.
COVID-19 Açık Araştırma Veri Kümesi COVID-19 ve koronavirüsle ilgili bilimsel makalelerin tam metin ve meta veri veri kümesi, makine okunabilirliği için iyileştirilmiştir ve küresel araştırma topluluğu tarafından kullanılabilir hale getirilmiştir.
Genomiks Data Lake Genomiks Data Lake, genomiks analizi iş akışlarınıza ve uygulamalarınıza tümleştirmeye hazır, ücretsiz olarak sunulan çeşitli genel veri kümeleri sağlar. Veri kümelerinde BAM, FASTA, VCF ve CSV dosya biçimlerindeki genom dizileri, değişkenlik bilgisi ve konu/örnek meta verileri bulunur.

İş gücü ve ekonomi

Veri kümesi Açıklama
ABD İş Gücü İstatistikleri ABD İş Gücü İstatistikleri, Birleşik Devletler yaş, cinsiyet, ırk ve etnik gruplara göre İş Gücü İstatistikleri, iş gücüne katılım oranları ve sivil fuhuşlu nüfus sağlar.
ABD’de Ulusal Çalışma Saatleri ve Kazançlar Mevcut İstihdam İstatistikleri (CES) programı, ABD’deki tarım dışı istihdam, çalışma saatleri ve bordrolu çalışan kazançları hakkında ayrıntılı sektör tahminleri üretir.
ABD Eyaletlerinde Çalışma Saatleri ve Kazançlar Mevcut İstihdam İstatistikleri (CES) programı, ABD’deki tarım dışı istihdam, çalışma saatleri ve bordrolu çalışan kazançları hakkında ayrıntılı sektör tahminleri üretir.
ABD Yerel Bölgelerde İşsizlik İstatistikleri ABD Yerel Bölge İşsizlik İstatistikleri veri kümeleri; ABD’deki Sayım bölgeleri ile bölümleri, Eyaletler, vilayetler, metropol alanları ve birçok şehir için aylık ve yıllık istihdam, işsizlik ve işgücü verilerini sağlar.
ABD Tüketici Fiyat Endeksi Tüketici Fiyat Endeksi (CPI), tüketici mal ve hizmetlerinin pazar sepeti için kentsel tüketicilerin ödediği fiyatlardaki zaman içindeki ortalama değişimi ölçer.
ABD Üretici Fiyat Endeksi - Endüstri Üretici Fiyat Endeksi (PPI), yerli üreticiler tarafından çıktıları için alınan satış fiyatlarındaki ortalama değişimi zaman içinde ölçer.
ABD Üretici Fiyat Endeksi - Emtia Üretici Fiyat Endeksi (PPI), yerli üreticilerin malları için aldıkları satış fiyatlarındaki ortalama değişimi zaman içinde ölçer.

Nüfus ve güvenlik

Veri kümesi Açıklama
Vilayete Göre ABD Nüfusu 2000 ve 2010 Decennial Census kaynaklarından her bir ABD ilçesi için cinsiyete ve ırka göre ABD nüfusu. Bu veri kümesinin kaynağı United States Census Bureau’dur.
Posta Koduna Göre ABD Nüfusu 2010 Decennial Census'dan alınan her BIR ABD posta kodu için cinsiyete ve ırka göre ABD nüfusu. Bu veri kümesinin kaynağı United States Census Bureau’dur.
Boston Safety Verileri Boston şehrinde bildirilen 311 aramaları hakkındaki verileri okuyun. Bu veri kümesi Parquet biçiminde depolanır ve günlük güncelleştirmeleri alır.
Chicago Güvenlik Verileri Chicago şehrinde bildirilen 311 aramaları hakkındaki verileri okuyun. Bu veri kümesi Parquet biçiminde depolanır ve günlük güncelleştirmeleri alır.
New York City Safety Data Bu veri kümesi 2010’dan günümüze kadar tüm New York City 311 hizmet aramalarını içerir. Bu veri kümesi Parquet biçiminde depolanır ve günlük güncelleştirmeleri alır.
San Francisco Güvenlik Verileri San Francisco’daki itfaiye hizmet çağrıları ve 311 olayları. Bu veri kümesi 2015’ten bugüne kadar birikmiş geçmiş kayıtları içerir.
Seattle Güvenlik Verileri Seattle İtfaiyesi 911 görev dağıtımları. Bu veri kümesi günlük olarak güncelleştirilir ve 2010’den günümüze kadar birikmiş geçmiş kayıtları içerir

Ek ve ortak veri kümeleri

Veri kümesi Açıklama
Diyabet 10 özelliğe sahip 442 örnek içeren Diabetes (Diyabet) adlı veri kümesi, makine öğrenmesi algoritmalarıyla çalışmaya başlamak için idealdir.
OJ Satış Simülasyon Verileri Bu veri kümesi, Dominick'in OJ veri kümesinden türetilir ve Azure Machine Learning'de binlerce modeli aynı anda eğitmeye olanak sağlayan bir veri kümesi sağlama hedefiyle ek simülasyon verileri içerir.
El yazısı basamakların MNIST veritabanı El yazısı rakamlardan oluşan MNIST veritabanı, 60.000 örnekli bir eğitim seti ve 10.000 örnekli bir test seti içerir. Basamaklar boyuta göre normalleştirilir ve sabit boyutlu bir görüntüde ortalanır.
Microsoft Haber öneri veri kümesi Microsoft Haber Veri Kümesi (MIND), haber önerisi araştırması için büyük ölçekli bir veri kümesidir. Haber önerisi için bir karşılaştırma veri kümesi görevi görür ve haber önerisi ve öneride bulunan sistemlerde araştırmayı kolaylaştırır.
Resmi tatiller 1970 ile 2099 yılları arasında 38 ülke veya bölgeyi kapsayan PyPI tatil paketi ve Wikipedia’dan alınan dünya genelindeki resmi tatil verileri.
Rusça açık konuşmayı metne dönüştürme Rusça Açık STT, Rusça dili için büyük ölçekli bir açık konuşma metin veri kümesidir