NYC Taksi ve Limuzin Komisyonu - yeşil taksi seyahat kayıtları
Yeşil taksi yolculuk kayıtları, yolcu alma ve bırakma tarihlerini/saatlerini, yolcu alma ve bırakma konumlarını, yolculuk mesafelerini, listeli tarifeleri, fiyat türlerini, ödeme türlerini ve sürücü tarafından bildirilen yolcu sayılarını yakalayan alanları içerir.
Not
Microsoft, Azure Open Datasets'i "olduğu gibi" sağlar. Microsoft, veri kümelerini kullanımınızla ilgili olarak açık veya zımni hiçbir garanti veya koşul sağlamaz. Yerel yasalarınız kapsamında izin verilen ölçüde, Microsoft veri kümelerini kullanımınızdan kaynaklanan doğrudan, sonuçsal, özel, dolaylı, arızi veya cezai dahil olmak üzere tüm zarar veya kayıplar için tüm sorumluluğu kabul etmez.
Bu veri kümesi Microsoft’un kaynak verileri aldığı orijinal hükümler kapsamında sağlanır. Veri kümesi Microsoft’tan alınan verileri içerebilir.
Birim ve saklama
Bu veri kümesi Parquet biçiminde depolanır. 2018 itibarıyla toplamda yaklaşık 80 M satır (2 GB) vardır.
Bu veri kümesi 2009 ile 2018 arasında birikmiş geçmiş kayıtları içermektedir. Belirli bir zaman aralığı içindeki verileri getirmek için SDK’mızdaki parametre ayarlarını kullanabilirsiniz.
Depolama konumu
Bu veri kümesi Doğu ABD Azure bölgesinde depolanır. Benzeşim için Doğu ABD’deki işlem kaynaklarının ayrılması önerilir.
Ek bilgi
NYC Taksi ve Limuzin Komisyonu (TLC):
Veriler Taksi ve Kiralık Taksi Yolcu Geliştirme Programları (TPEP/LPEP) kapsamında yetkilendirilmiş teknoloji sağlayıcıları tarafından toplanıp NYC Taksi ve Limuzin Komisyonu’na (TLC) sunulmuştur. Yolculuk veirleri TLC tarafından oluşturulmamıştır ve TLC bu verilerin doğruluğu hakkında bir taahhütte bulunmaz.
Özgün veri kümesi konumunu ve özgün kullanım koşullarını görüntüleyin.
Sütunlar
Veri Akışı Adı | Veri türü | Benzersiz | Değerler (örnek) | Açıklama |
---|---|---|---|---|
doLocationId | Dize | 264 | 74 42 | Taksimetrenin devre dışı olduğu DOLocationID TLC Taksi Bölgesi. |
dropoffLatitude | çift | 109,721 | 40.7743034362793 40.77431869506836 | 2016.07’den itibaren kullanım dışı bırakıldı |
dropoffLongitude | çift | 75,502 | -73.95272827148438 -73.95274353027344 | 2016.07’den itibaren kullanım dışı bırakıldı |
fazladan | çift | 202 | 0.5 1.0 | Çeşitli ekstralar ve ek ücretler. Şu anda buna yalnızca 0,50 ABD doları ve 1 ABD doları yoğun saat ve gecelik ücretler dahildir. |
fareAmount | çift | 10,367 | 6.0 5.5 | Ölçüm cihazı tarafından hesaplanan saat-mesafe tarifesi. |
improvementSurcharge | Dize | 92 | 0.3 0 | Bayrak indirildiği zaman çağrılan yolculuklarda değerlendirilen 0,30 ABD doları iyileştirme ek ücreti. İyileştirme ek ücreti 2015 yılında toplanmaya başlamıştır. |
lpepDropoffDatetime | timestamp | 58,100,713 | 2016-05-22 00:00:00 2016-05-09 00:00:00 | Ölçümün devre dışı olduğu tarih ve saat. |
lpepPickupDatetime | timestamp | 58,157,349 | 2013-10-22 12:40:36 2014-08-09 15:54:25 | Ölçümün devreye girdiği tarih ve saat. |
mtaTax | çift | 34 | 0.5 -0.5 | Kullanımdaki tarifeli fiyata göre otomatik olarak tetiklenen 0,50 ABD doları MTA vergisi. |
passengerCount | int | 10 | 1 2 | Araçtaki yolcu sayısı. Bu değer sürücü tarafından girilir. |
paymentType | int | 5 | 2 1 | Yolcunun seyahat ücretini nasıl ödediğini belirten sayısal kod. 1= Kredi kartı 2= Nakit 3= Ücret yok 4= Uyuşmazlık 5= Bilinmeyen 6= Geçersiz seyahat |
pickupLatitude | çift | 95,110 | 40.721351623535156 40.721336364746094 | 2016.07’den itibaren kullanım dışı bırakıldı |
pickupLongitude | çift | 55,722 | -73.84429931640625 -73.84429168701172 | 2016.07’den itibaren kullanım dışı bırakıldı |
puLocationId | Dize | 264 | 74 41 | Taksimetrenin devreye girdiği TLC Taksi Bölgesi. |
puMonth | int | 12 | 3 5 | |
puYear | int | 14 | 2015 2016 | |
rateCodeID | int | 7 | 1 5 | Yolculuğun sonunda geçerli olan son fiyat kodu. 1= Standart oran 2= JFK 3= Newark 4= Nassau veya Westchester 5= Anlaşmalı fare 6= Grup yolculuğu |
storeAndFwdFlag | Dize | 2 | N Y | Bu bayrak, aracın sunucuyla bağlantısı olmadığı için seyahat kaydının satıcıya gönderilmeden önce araç belleğinde tutulup tutulmadığını gösterir. Y= mağaza ve ileri yolculuk N= mağaza ve ileri yolculuk değil |
tipAmount | çift | 6,206 | 1.0 2.0 | Bahşiş tutarı – Kredi kartı bahşişleri için bu alan otomatik olarak doldurulur. Nakit bahşişler dahil değildir. |
tollsAmount | çift | 2,150 | 5.54 5.76 | Yolculukta ödenen tüm ücretlerin toplam tutarı. |
totalAmount | çift | 20,188 | 7.8 6.8 | Yolculardan alınan toplam ücret. Nakit bahşişler dahil değildir. |
tripDistance | çift | 7,060 | 0.9 1.0 | Taksimetrenin mil cinsinden bildirdiği geçen yolculuk mesafesi. |
tripType | int | 3 | 1 2 | Yolculuğun sokaktan çevirme veya kullanımdaki tarifeli fiyata göre otomatik olarak atanan ancak sürücü tarafından değiştirilebilen bir gönderme olduğunu gösteren kod. 1= Street-hail 2= Dispatch |
vendorID | int | 2 | 2 1 | Kaydı oluşturan LPEP sağlayıcısını gösteren kod. 1= Creative Mobile Technologies, LLC; 2= VeriFone Inc. |
Önizle
vendorID | lpepPickupDatetime | lpepDropoffDatetime | passengerCount | tripDistance | puLocationId | doLocationId | rateCodeID | storeAndFwdFlag | paymentType | fareAmount | fazladan | mtaTax | improvementSurcharge | tipAmount | tollsAmount | totalAmount | tripType | puYear | puMonth |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2 | 24.06.2081 17:40:37 | 24.06.2081 18:42:47 | 1 | 16.95 | 93 | 117 | 1 | N | 1 | 52 | 1 | 0,5 | 0.3 | 0 | 2.16 | 55.96 | 1 | 2081 | 6 |
2 | 28.11.2030 12:19:29 | 28.11.2030 12:25:37 | 1 | 1.08 | 42 | 247 | 1 | N | 2 | 6.5 | 0 | 0,5 | 0.3 | 0 | 0 | 7.3 | 1 | 2030 | 11 |
2 | 28.11.2030 12:14:50 | 28.11.2030 12:14:54 | 1 | 0.03 | 42 | 42 | 5 | N | 2 | 5 | 0 | 0 | 0 | 0 | 0 | 5 | 2 | 2030 | 11 |
2 | 14.11.2020 11:38:07 | 14/11/2020 11:42:22 | 1 | 0.63 | Kategori 129 | Kategori 129 | 1 | N | 2 | 4,5 | 1 | 0,5 | 0.3 | 0 | 0 | 6.3 | 1 | 2020 | 11 |
2 | 14.11.2020 09:55:36 | 14.11.2020 10:04:54 | 1 | 3.8 | Kategori 82 | 138 | 1 | N | 2 | 12.5 | 1 | 0,5 | 0.3 | 0 | 0 | 14.3 | 1 | 2020 | 11 |
2 | 26.08.2019 16:18:37 | 26.08.2019 16:19:35 | 1 | 0 | 264 | 264 | 1 | N | 2 | 1 | 0 | 0,5 | 0.3 | 0 | 0 | 1.8 | 1 | 2019 | 8 |
2 | 01.07.2019 08:28:33 | 01.07.2019 08:32:33 | 1 | 0.71 | 7 | 7 | 1 | N | 1 | 5 | 0 | 0,5 | 0.3 | 1.74 | 0 | 7.54 | 1 | 2019 | 7 |
2 | 01.07.2019 12:04:53 | 01.07.2019 12:21:56 | 1 | 2.71 | 223 | 145 | 1 | N | 2 | 13 | 0,5 | 0,5 | 0.3 | 0 | 0 | 14.3 | 1 | 2019 | 7 |
2 | 01.07.2019 12:04:11 | 01.07.2019 12:21:15 | 1 | 3,14 | 166 | 142 | 1 | N | 2 | 14.5 | 0,5 | 0,5 | 0.3 | 0 | 0 | 18.55 | 1 | 2019 | 7 |
2 | 01.07.2019 12:03:37 | 01.07.2019 12:09:27 | 1 | %0,78 | Kategori 74 | Kategori 74 | 1 | N | 1 | 6 | 0,5 | 0,5 | 0.3 | 1,46 | 0 | 8.76 | 1 | 2019 | 7 |
Veri erişimi
Azure Notebooks
# This is a package in preview.
from azureml.opendatasets import NycTlcGreen
from datetime import datetime
from dateutil import parser
end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcGreen(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_pandas_dataframe()
nyc_tlc_df.info()
Azure Databricks
# This is a package in preview.
# You need to pip install azureml-opendatasets in Databricks cluster. https://learn.microsoft.com/azure/data-explorer/connect-from-databricks#install-the-python-library-on-your-azure-databricks-cluster
from azureml.opendatasets import NycTlcGreen
from datetime import datetime
from dateutil import parser
end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcGreen(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_spark_dataframe()
display(nyc_tlc_df.limit(5))
Azure Synapse
# This is a package in preview.
from azureml.opendatasets import NycTlcGreen
from datetime import datetime
from dateutil import parser
end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcGreen(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_spark_dataframe()
# Display top 5 rows
display(nyc_tlc_df.limit(5))
# Display data statistic information
display(nyc_tlc_df, summary = True)
Sonraki adımlar
Açık Veri Kümeleri kataloğundaki diğer veri kümelerini görüntüleyin.