NYC Taksi ve Limuzin Komisyonu - Kiralık Araç (FHV) seyahat kayıtları
Kiralık Araç (“FHV”) yolculuk kayıtları, gönderen merkez lisans numarasını ve çıkış tarihi, saati ile taksi bölgesi konum kimliğini içerir (şekil dosyası aşağıdadır). Bu kayıtlar, merkezler tarafından gönderilen FHV Yolculuk Kayıtlarından oluşturulur.
Not
Microsoft, Azure Open Datasets'i "olduğu gibi" sağlar. Microsoft, veri kümelerini kullanımınızla ilgili olarak açık veya zımni hiçbir garanti veya koşul sağlamaz. Yerel yasalarınız kapsamında izin verilen ölçüde, Microsoft veri kümelerini kullanımınızdan kaynaklanan doğrudan, sonuçsal, özel, dolaylı, arızi veya cezai dahil olmak üzere tüm zarar veya kayıplar için tüm sorumluluğu kabul etmez.
Bu veri kümesi Microsoft’un kaynak verileri aldığı orijinal hükümler kapsamında sağlanır. Veri kümesi Microsoft’tan alınan verileri içerebilir.
Birim ve saklama
Bu veri kümesi Parquet biçiminde depolanır. 2018 itibarıyla yaklaşık 500 M satır (5 GB) vardır.
Bu veri kümesi 2009 ile 2018 arasında birikmiş geçmiş kayıtları içermektedir. Belirli bir zaman aralığı içindeki verileri getirmek için SDK’mızdaki parametre ayarlarını kullanabilirsiniz.
Depolama konumu
Bu veri kümesi Doğu ABD Azure bölgesinde depolanır. Benzeşim için Doğu ABD’deki işlem kaynaklarının ayrılması önerilir.
Ek bilgi
NYC Taksi ve Limuzin Komisyonu (TLC):
Veriler Taksi ve Kiralık Taksi Yolcu Geliştirme Programları (TPEP/LPEP) kapsamında yetkilendirilmiş teknoloji sağlayıcıları tarafından toplanıp NYC Taksi ve Limuzin Komisyonu’na (TLC) sunulmuştur. Yolculuk veirleri TLC tarafından oluşturulmamıştır ve TLC bu verilerin doğruluğu hakkında bir taahhütte bulunmaz.
Özgün veri kümesi konumunu ve özgün kullanım koşullarını görüntüleyin.
Sütunlar
Veri Akışı Adı | Veri türü | Benzersiz | Değerler (örnek) | Açıklama |
---|---|---|---|---|
dispatchBaseNum | Dize | 1,144 | B02510 B02764 | Yolculuğun başladığı merkezin TLC Merkezi Lisans Numarası |
doLocationId | Dize | 267 | 265 132 | Yolculuğun sona erdiği TLC Taksi Bölgesi. |
dropOffDateTime | timestamp | 57,110,352 | 2017-07-31 23:59:00 2017-10-15 00:44:34 | Yolculuk bitiş tarihi ve saati. |
pickupDateTime | timestamp | 111,270,396 | 2016-08-16 00:00:00 2016-08-17 00:00:00 | Yolculuk başlangıç tarihi ve saati. |
puLocationId | Dize | 266 | 79 161 | Yolculuğun başladığı TLC Taksi Bölgesi. |
puMonth | int | 12 | 1 12 | |
puYear | int | 5 | 2018 2017 | |
srFlag | Dize | 44 | 1 2 | Yolculuğun Yüksek Hacimli bir FHV şirketi (örneğin, Uber Havuzu, Lyft Line) tarafından sunulan paylaşılan bir yolculuk zincirinin parçası olup olmadığını gösterir. Ortak yolculuklar için değer 1’dir. Ortak olmayan yolculuklar için bu alan null değerini alır. NOT: Çoğu Yüksek Hacimli FHV şirketi için, yolculuk boyunca yalnızca istenen ve başka bir paylaşılan yolculuk isteğiyle eşleşen paylaşılan yolculuklar işaretlenir. Ancak, Lyft (merkez lisans numaraları B02510 + B02844) ayrıca ortak bir yolculuğun istendiği fakat yolcuğu paylaşmak için başka bir yolcunun eşleştirilemediği yolculukları da işaretler. Bu nedenle, bu iki merkezde SR_Flag=1 değerine sahip olan yolculuk kayıtları YA bir ortak yolculuk zincirindeki birinci yolculuğu YA DA ortak yolculuğun istendiği ancak hiçbir zaman eşleştirmenin yapılamadığı bir yolculuğu ifade edebilir. Kullanıcılar Lyft tarafından tamamlanan başarılı ortak yolculuk sayısının fazla olmasını öngörmelidir. |
Önizle
dispatchBaseNum | pickupDateTime | dropOffDateTime | puLocationId | doLocationId | srFlag | puYear | puMonth |
---|---|---|---|---|---|---|---|
B03157 | 30.06.2019 23:59:57 | 01.07.2019 12:07:21 | 264 | null | null | 2019 | 6 |
B01667 | 30.06.2019 23:59:56 | 01.07.2019 12:28:06 | 264 | null | null | 2019 | 6 |
B02849 | 30.06.2019 23:59:55 | 01.07.2019 12:14:10 | 264 | null | null | 2019 | 6 |
B02249 | 30.06.2019 23:59:53 | 01.07.2019 12:15:53 | 264 | null | null | 2019 | 6 |
B00887 | 30.06.2019 23:59:48 | 01.07.2019 12:29:29 | 264 | null | null | 2019 | 6 |
B01626 | 30.06.2019 23:59:45 | 01.07.2019 12:18:20 | 264 | null | null | 2019 | 6 |
B01259 | 30.06.2019 23:59:44 | 01.07.2019 12:03:15 | 264 | null | null | 2019 | 6 |
B01145 | 30.06.2019 23:59:43 | 01.07.2019 12:11:15 | 264 | null | null | 2019 | 6 |
B00887 | 30.06.2019 23:59:42 | 01.07.2019 12:34:21 | 264 | null | null | 2019 | 6 |
B00821 | 30.06.2019 23:59:40 | 01.07.2019 12:02:57 | 264 | null | null | 2019 | 6 |
Veri erişimi
Azure Notebooks
# This is a package in preview.
from azureml.opendatasets import NycTlcFhv
from datetime import datetime
from dateutil import parser
end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcFhv(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_pandas_dataframe()
nyc_tlc_df.info()
Azure Databricks
# This is a package in preview.
# You need to pip install azureml-opendatasets in Databricks cluster. https://learn.microsoft.com/azure/data-explorer/connect-from-databricks#install-the-python-library-on-your-azure-databricks-cluster
from azureml.opendatasets import NycTlcFhv
from datetime import datetime
from dateutil import parser
end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcFhv(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_spark_dataframe()
display(nyc_tlc_df.limit(5))
Azure Synapse
# This is a package in preview.
from azureml.opendatasets import NycTlcFhv
from datetime import datetime
from dateutil import parser
end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcFhv(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_spark_dataframe()
# Display top 5 rows
display(nyc_tlc_df.limit(5))
Sonraki adımlar
Açık Veri Kümeleri kataloğundaki diğer veri kümelerini görüntüleyin.