Aracılığıyla paylaş


NYC Taksi ve Limuzin Komisyonu - sarı taksi seyahat kayıtları

Sarı taksi yolculuk kayıtları yolcu alma ve bırakma tarihlerini/saatlerini, yolcu alma ve bırakma konumlarını, yolculuk mesafelerini, ayrıntılı tarifeleri, fiyat türlerini, ödeme türlerini ve sürücü tarafından bildirilen yolcu sayılarını yakalayan alanları içerir.

Not

Microsoft, Azure Open Datasets'i "olduğu gibi" sağlar. Microsoft, veri kümelerini kullanımınızla ilgili olarak açık veya zımni hiçbir garanti veya koşul sağlamaz. Yerel yasalarınız kapsamında izin verilen ölçüde, Microsoft veri kümelerini kullanımınızdan kaynaklanan doğrudan, sonuçsal, özel, dolaylı, arızi veya cezai dahil olmak üzere tüm zarar veya kayıplar için tüm sorumluluğu kabul etmez.

Bu veri kümesi Microsoft’un kaynak verileri aldığı orijinal hükümler kapsamında sağlanır. Veri kümesi Microsoft’tan alınan verileri içerebilir.

Birim ve saklama

Bu veri kümesi Parquet biçiminde depolanır. 2018 itibarıyla toplamda yaklaşık 1,5B satır (50 GB) vardır.

Bu veri kümesi 2009 ile 2018 arasında birikmiş geçmiş kayıtları içermektedir. Belirli bir zaman aralığı içindeki verileri getirmek için SDK’mızdaki parametre ayarlarını kullanabilirsiniz.

Depolama konumu

Bu veri kümesi Doğu ABD Azure bölgesinde depolanır. Benzeşim için Doğu ABD’deki işlem kaynaklarının ayrılması önerilir.

Ek bilgi

NYC Taksi ve Limuzin Komisyonu (TLC):

Veriler Taksi ve Kiralık Taksi Yolcu Geliştirme Programları (TPEP/LPEP) kapsamında yetkilendirilmiş teknoloji sağlayıcıları tarafından toplanıp NYC Taksi ve Limuzin Komisyonu’na (TLC) sunulmuştur. Yolculuk veirleri TLC tarafından oluşturulmamıştır ve TLC bu verilerin doğruluğu hakkında bir taahhütte bulunmaz.

Özgün veri kümesi konumunu ve özgün kullanım koşullarını görüntüleyin.

Sütunlar

Veri Akışı Adı Veri türü Benzersiz Değerler (örnek) Açıklama
doLocationId Dize 265 161 236 Taksimetrenin devre dışı olduğu TLC Taksi Bölgesi.
endLat çift 961,994 41.366138 40.75
endLon çift 1,144,935 -73.137393 -73.9824
fazladan çift 877 0.5 1.0 Çeşitli ekstralar ve ek ücretler. Şu anda buna yalnızca 0,50 ABD doları ve 1 ABD doları yoğun saat ve gecelik ücretler dahildir.
fareAmount çift 18,935 6.5 4.5 Ölçüm cihazı tarafından hesaplanan saat-mesafe tarifesi.
improvementSurcharge Dize 60 0.3 0 Bayrak indirildiği zaman yolculuklarda değerlendirilen 0,30 ABD doları iyileştirme ek ücreti. İyileştirme ek ücreti 2015 yılında toplanmaya başlamıştır.
mtaTax çift 360 0.5 -0.5 Kullanımdaki tarifeli fiyata göre otomatik olarak tetiklenen 0,50 ABD doları MTA vergisi.
passengerCount int 64 1 2 Araçtaki yolcu sayısı. Bu değer sürücü tarafından girilir.
paymentType Dize 6,282 CSH CRD Yolcunun seyahat ücretini nasıl ödediğini belirten sayısal kod. 1= Kredi kartı; 2= Nakit; 3= Ücret alınmaz; 4= Uyuşmazlık; 5= Bilinmiyor; 6= Geçersiz seyahat.
puLocationId Dize 266 237 161 Taksimetrenin devreye girdiği TLC Taksi Bölgesi.
puMonth int 12 3 5
puYear int 29 2012 2011
rateCodeId int 56 1 2 Yolculuğun sonunda geçerli olan son fiyat kodu. 1= Standart oran; 2= JFK; 3= Yeniark; 4= Nassau veya Westchester; 5= Anlaşmalı ücret; 6= Grup yolculuğu.
startLat çift 833,016 41.366138 40.7741
startLon çift 957,428 -73.137393 -73.9821
storeAndFwdFlag Dize 8 N 0 Bu bayrak, aracın sunucuyla bağlantısı olmadığı için seyahat kaydının satıcıya gönderilmeden önce araç belleğinde tutulup tutulmadığını gösterir. Y= mağaza ve ileri yolculuk; N= bir mağaza ve ileri yolculuk değil.
tipAmount çift 12,121 1.0 2.0 Kredi kartı bahşişleri için bu alan otomatik olarak doldurulur. Nakit bahşişler dahil değildir.
tollsAmount çift 6,634 5.33 4.8 Yolculukta ödenen tüm ücretlerin toplam tutarı.
totalAmount çift 39,707 7.0 7.8 Yolculardan alınan toplam ücret. Nakit bahşişler dahil değildir.
tpepDropoffDateTime timestamp 290,185,010 2010-11-07 01:29:00 2013-11-03 01:22:00 Ölçümün devre dışı olduğu tarih ve saat.
tpepPickupDateTime timestamp 289,948,585 2010-11-07 01:00:00 2009-11-01 01:05:00 Ölçümün devreye girdiği tarih ve saat.
tripDistance çift 14,003 1.0 0.9 Taksimetrenin mil cinsinden bildirdiği geçen yolculuk mesafesi.
vendorID Dize 7 VTS CMT Kaydı oluşturan TPEP sağlayıcısını gösteren kod. 1= Creative Mobile Technologies, LLC; 2= VeriFone Inc.
vendorID int 2 2 1 Kaydı oluşturan LPEP sağlayıcısını gösteren kod. 1= Creative Mobile Technologies, LLC; 2= VeriFone Inc.

Önizle

vendorID tpepPickupDateTime tpepDropoffDateTime passengerCount tripDistance puLocationId doLocationId rateCodeId storeAndFwdFlag paymentType fareAmount fazladan mtaTax improvementSurcharge tipAmount tollsAmount totalAmount puYear puMonth
2 24/1/2088 12:25:39 24.01.2088 07:28:25 1 4.05 24 162 1 N 2 14.5 0 0,5 0.3 0 0 15.3 2088 1
2 24/1/2088 12:15:42 24/1/2088 12:19:46 1 0.63 41 166 1 N 2 4,5 0 0,5 0.3 0 0 5.3 2088 1
2 4/11/2084 12:32:24 4/11/2084 12:47:41 1 1.34 238 236 1 N 2 10 0 0,5 0.3 0 0 10.8 2084 11
2 4/11/2084 12:25:53 PM 4/11/2084 12:29:00 1 0.32 238 238 1 N 2 4 0 0,5 0.3 0 0 4.8 2084 11
2 4/11/2084 12:08:33 4/11/2084 12:22:24 PM 1 1.85 236 238 1 N 2 10 0 0,5 0.3 0 0 10.8 2084 11
2 4/11/2084 11:41:35 4/11/2084 11:59:41 1 1.65 68 237 1 N 2 12.5 0 0,5 0.3 0 0 13.3 2084 11
2 4/11/2084 11:27:28 4/11/2084 11:39:52 1 1.07 170 68 1 N 2 9 0 0,5 0.3 0 0 9.8 2084 11
2 4/11/2084 11:19:06 4/11/2084 11:26:44 1 1.3 107 170 1 N 2 7.5 0 0,5 0.3 0 0 8.3 2084 11
2 4/11/2084 11:02:59 4/11/2084 11:15:51 1 1.85 113 137 1 N 2 10 0 0,5 0.3 0 0 10.8 2084 11
2 4/11/2084 10:46:05 4/11/2084 10:50:09 1 0,62 231 231 1 N 2 4,5 0 0,5 0.3 0 0 5.3 2084 11

Veri erişimi

Azure Notebooks

# This is a package in preview.
from azureml.opendatasets import NycTlcYellow

from datetime import datetime
from dateutil import parser


end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcYellow(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_pandas_dataframe()

nyc_tlc_df.info()

Azure Databricks

# This is a package in preview.
# You need to pip install azureml-opendatasets in Databricks cluster. https://learn.microsoft.com/azure/data-explorer/connect-from-databricks#install-the-python-library-on-your-azure-databricks-cluster
from azureml.opendatasets import NycTlcYellow

from datetime import datetime
from dateutil import parser


end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcYellow(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_spark_dataframe()

display(nyc_tlc_df.limit(5))

Azure Synapse

# This is a package in preview.
from azureml.opendatasets import NycTlcYellow

from datetime import datetime
from dateutil import parser

end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcYellow(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_spark_dataframe()

# Display top 5 rows
display(nyc_tlc_df.limit(5))

Sonraki adımlar

Açık Veri Kümeleri kataloğundaki diğer veri kümelerini görüntüleyin.