NYC Taksi ve Limuzin Komisyonu - Kiralık Araç (FHV) seyahat kayıtları

Kiralık Araç (“FHV”) yolculuk kayıtları, gönderen merkez lisans numarasını ve çıkış tarihi, saati ile taksi bölgesi konum kimliğini içerir (şekil dosyası aşağıdadır). Bu kayıtlar, merkezler tarafından gönderilen FHV Yolculuk Kayıtlarından oluşturulur.

Dekont

Microsoft, Azure Open Datasets'i "olduğu gibi" sağlar. Microsoft, veri kümelerini kullanımınızla ilgili olarak açık veya zımni hiçbir garanti veya koşul sağlamaz. Yerel yasalarınız kapsamında izin verilen ölçüde, Microsoft veri kümelerini kullanımınızdan kaynaklanan doğrudan, sonuçsal, özel, dolaylı, arızi veya cezai dahil olmak üzere tüm zarar veya kayıplar için tüm sorumluluğu kabul etmez.

Bu veri kümesi Microsoft’un kaynak verileri aldığı orijinal hükümler kapsamında sağlanır. Veri kümesi Microsoft’tan alınan verileri içerebilir.

Birim ve saklama

Bu veri kümesi Parquet biçiminde depolanır. 2018 itibarıyla yaklaşık 500 M satır (5 GB) vardır.

Bu veri kümesi 2009 ile 2018 arasında birikmiş geçmiş kayıtları içermektedir. Belirli bir zaman aralığı içindeki verileri getirmek için SDK’mızdaki parametre ayarlarını kullanabilirsiniz.

Depolama konumu

Bu veri kümesi Doğu ABD Azure bölgesinde depolanır. Benzeşim için Doğu ABD’deki işlem kaynaklarının ayrılması önerilir.

Ek bilgi

NYC Taksi ve Limuzin Komisyonu (TLC):

Veriler Taksi ve Kiralık Taksi Yolcu Geliştirme Programları (TPEP/LPEP) kapsamında yetkilendirilmiş teknoloji sağlayıcıları tarafından toplanıp NYC Taksi ve Limuzin Komisyonu’na (TLC) sunulmuştur. Yolculuk veirleri TLC tarafından oluşturulmamıştır ve TLC bu verilerin doğruluğu hakkında bir taahhütte bulunmaz.

Özgün veri kümesi konumunu ve özgün kullanım koşullarını görüntüleyin.

Sütunlar

Adı Veri türü Benzersiz Değerler (örnek) Açıklama
dispatchBaseNum Dize 1,144 B02510 B02764 Yolculuğun başladığı merkezin TLC Merkezi Lisans Numarası
doLocationId Dize 267 265 132 Yolculuğun sona erdiği TLC Taksi Bölgesi.
dropOffDateTime timestamp 57,110,352 2017-07-31 23:59:00 2017-10-15 00:44:34 Yolculuk bitiş tarihi ve saati.
pickupDateTime timestamp 111,270,396 2016-08-16 00:00:00 2016-08-17 00:00:00 Yolculuk başlangıç tarihi ve saati.
puLocationId Dize 266 79 161 Yolculuğun başladığı TLC Taksi Bölgesi.
puMonth int 12 1 12
puYear int 5 2018 2017
srFlag Dize 44 1 2 Yolculuğun Yüksek Hacimli bir FHV şirketi (örneğin, Uber Havuzu, Lyft Line) tarafından sunulan paylaşılan bir yolculuk zincirinin parçası olup olmadığını gösterir. Ortak yolculuklar için değer 1’dir. Ortak olmayan yolculuklar için bu alan null değerini alır. NOT: Çoğu Yüksek Hacimli FHV şirketi için, yolculuk boyunca yalnızca istenen ve başka bir paylaşılan yolculuk isteğiyle eşleşen paylaşılan yolculuklar işaretlenir. Ancak, Lyft (merkez lisans numaraları B02510 + B02844) ayrıca ortak bir yolculuğun istendiği fakat yolcuğu paylaşmak için başka bir yolcunun eşleştirilemediği yolculukları da işaretler. Bu nedenle, bu iki merkezde SR_Flag=1 değerine sahip olan yolculuk kayıtları YA bir ortak yolculuk zincirindeki birinci yolculuğu YA DA ortak yolculuğun istendiği ancak hiçbir zaman eşleştirmenin yapılamadığı bir yolculuğu ifade edebilir. Kullanıcılar Lyft tarafından tamamlanan başarılı ortak yolculuk sayısının fazla olmasını öngörmelidir.

Önizle

dispatchBaseNum pickupDateTime dropOffDateTime puLocationId doLocationId srFlag puYear puMonth
B03157 30.06.2019 23:59:57 01.07.2019 12:07:21 264 null null 2019 6
B01667 30.06.2019 23:59:56 01.07.2019 12:28:06 264 null null 2019 6
B02849 30.06.2019 23:59:55 01.07.2019 12:14:10 264 null null 2019 6
B02249 30.06.2019 23:59:53 01.07.2019 12:15:53 264 null null 2019 6
B00887 30.06.2019 23:59:48 01.07.2019 12:29:29 264 null null 2019 6
B01626 30.06.2019 23:59:45 01.07.2019 12:18:20 264 null null 2019 6
B01259 30.06.2019 23:59:44 01.07.2019 12:03:15 264 null null 2019 6
B01145 30.06.2019 23:59:43 01.07.2019 12:11:15 264 null null 2019 6
B00887 30.06.2019 23:59:42 01.07.2019 12:34:21 264 null null 2019 6
B00821 30.06.2019 23:59:40 01.07.2019 12:02:57 264 null null 2019 6

Veri erişimi

Azure Notebooks

# This is a package in preview.
from azureml.opendatasets import NycTlcFhv

from datetime import datetime
from dateutil import parser


end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcFhv(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_pandas_dataframe()

nyc_tlc_df.info()

Azure Databricks

# This is a package in preview.
# You need to pip install azureml-opendatasets in Databricks cluster. https://learn.microsoft.com/azure/data-explorer/connect-from-databricks#install-the-python-library-on-your-azure-databricks-cluster
from azureml.opendatasets import NycTlcFhv

from datetime import datetime
from dateutil import parser


end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcFhv(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_spark_dataframe()

display(nyc_tlc_df.limit(5))

Azure Synapse

# This is a package in preview.
from azureml.opendatasets import NycTlcFhv

from datetime import datetime
from dateutil import parser


end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcFhv(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_spark_dataframe()

# Display top 5 rows
display(nyc_tlc_df.limit(5))

Sonraki adımlar

Açık Veri Kümeleri kataloğundaki diğer veri kümelerini görüntüleyin.