NYC Taxi &Limuzin Bizottság - sárga taxi utazás rekordok

A sárga taxis utazások rekordjai az utasfelvétel és -kiadás dátumát és idejét, a felvétel és -kiadás helyét, az út hosszát, a tételes viteldíjakat, a díjszabás típusát, a fizetési módot, valamint a sofőr által bejelentett utasszámot tartalmazzák.

Megjegyzés:

A Microsoft az Azure Open Datasets szolgáltatást "adott módon" biztosítja. A Microsoft nem vállal kifejezett vagy vélelmezett garanciát vagy feltételeket az adathalmazok Ön általi használatára vonatkozóan. A microsoft a helyi jogszabályok által megengedett mértékben kizár minden felelősséget az adathalmazok használatából eredő károkért vagy veszteségekért, beleértve a közvetlen, következményi, különleges, közvetett, incidenses vagy büntető jellegű károkat is.

Az adatkészletet a Microsoft forrásadataihoz tartozó eredeti feltételek szerint szolgáltatjuk. A készlet tartalmazhat Microsofttól származó adatokat.

Kötet és megőrzés

Az adatkészlet Parketta formátumban van tárolva. 2018-ban összesen körülbelül 1,5B sor (50 GB) található.

Az adatkészlet 2009. és 2018. között összegyűjtött adatokat tartalmaz. Adott időtartomány adatainak beolvasásához az általunk biztosított SDK paraméterbeállításait használhatja.

Tárolási hely

Az adatkészlet tárolási helye a Kelet-USA Azure-régió. Az affinitás érdekében Kelet-USA régión belüli számítási erőforrások lefoglalását javasoljuk.

További információk

NYC Taxi and Limousine Commission (TLC):

Az adatokat a Taxicab & Livery Passenger Enhancement Programs (TPEP/LPEP) keretében technológiai szolgáltatók szolgáltatták az NYC Taxi and Limousine Commission (TLC) számára. Az utazások adatait nem a TLC hozta létre, amely így nem is vállal felelősséget ezek pontosságáért.

Tekintse meg az eredeti adatkészlet helyét és az eredeti használati feltételeket.

Oszlopok

Név Adattípus Egyedi Values (sample) Leírás
doLocationId sztring 265 161 236 A taxióra kikapcsolásának TLC taxizónája.
endLat double 961,994 41.366138 40.75
endLon double 1,144,935 -73.137393 -73.9824
Extra double 877 0.5 1.0 Egyéb pótdíjak. Ez jelenleg csak a 0,50, illetve 1 USD-s csúcsidős és éjszakai díjakat tartalmazza.
viteldíjAmount double 18,935 6.5 4.5 Az óra által mért díj az idő és a megtett út függvényében.
improvementSurcharge sztring 60 0.3 0 0,30 USD-s pótdíj az utasfelvételnél. A pótdíjat 2015-ben vezették be.
mtaTax double 360 0.5 -0.5 Az ár 0,50 USD MTA- (városi közlekedési hatósági) adót tartalmaz, amely a mért díjnak megfelelően automatikusan hozzáadódik az összeghez.
passengerCount egész 64 1 2 A járműben tartózkodó utasok száma. Az értéket a sofőr adja meg.
paymentType sztring 6,282 CSH CRD Numerikus kód, amely azt jelzi, hogy az utas hogyan fizetett az útért. 1 = Hitelkártya; 2 = Készpénz; 3 = Díjmentes; 4 = Vita; 5 = Ismeretlen; 6 = Érvénytelenített utazás.
puLocationId sztring 266 237 161 A taxióra indításának TLC-taxizónája.
puMonth egész 12 3 5
puYear egész 29 2012 2011
rateCodeId egész 56 1 2 A végösszeg az utazás végén. 1 = Standard ráta; 2 = JFK; 3 = Newark; 4 = Nassau vagy Westchester; 5 = Tárgyalásos viteldíj; 6 = Csoportos utazás.
startLat double 833,016 41.366138 40.7741
startLon double 957,428 -73.137393 -73.9821
storeAndFwdFlag sztring 8 N 0 Ez a jelző azt jelzi, hogy az utazási rekord a jármű memóriájában volt-e tárolva, mielőtt elküldené a szállítónak, más néven "tároló és továbbítás" néven, mivel a járműnek nem volt kapcsolata a kiszolgálóval. Y = tárolás és továbbítás; N = nem egy üzlet és egy előre utazás.
tipAmount double 12,121 1.0 2.0 Ez a mező automatikusan kitöltésre kerül hitelkártyás borravaló-fizetésnél. A készpénzben fizetett borravalókat nem tartalmazza.
tollsAmount double 6,634 5.33 4.8 Az utazás során fizetett összes úthasználati díj összege.
totalAmount double 39,707 7.0 7.8 Az utasok által térítendő teljes összeg. Nem tartalmazza a készpénzben fizetett borravalók összegét.
tpepDropoffDateTime timestamp 290,185,010 2010-11-07 01:29:00 2013-11-03 01:22:00 Az óra leállításának dátuma és ideje.
tpepPickupDateTime timestamp 289,948,585 2010-11-07 01:00:00 2009-11-01 01:05:00 Az óra indításának dátuma és ideje.
tripDistance double 14,003 1.0 0.9 A utazás során megtett távolság mérföldben a taxióra adatai alapján.
vendorID sztring 7 VTS CMT A rekordot szolgáltató TPEP-szolgáltató kódja. 1 = Creative Mobile Technologies, LLC; 2= VeriFone Inc.
vendorID egész 2 2 1 A rekordot szolgáltató LPEP-szolgáltató kódja. 1 = Creative Mobile Technologies, LLC; 2= VeriFone Inc.

Előnézet megtekintése

vendorID tpepPickupDateTime tpepDropoffDateTime passengerCount tripDistance puLocationId doLocationId rateCodeId storeAndFwdFlag paymentType viteldíjAmount Extra mtaTax improvementSurcharge tipAmount tollsAmount totalAmount puYear puMonth
2 2088.01.24. 12:25:39 2088. 01. 24. 07:28:25 1 4.05 24 162 1 N 2 14,5 0 0,5 0.3 0 0 15,3 2088 1
2 2088.01.24. 12:15:42 2088. 01. 24. 12:19:46 1 0.63 41 166 1 N 2 4,5 0 0,5 0.3 0 0 5.3 2088 1
2 2084.04.11. 12:32:24 2084.04.11. 12:47:41 1 1.34 238 236 1 N 2 10 0 0,5 0.3 0 0 10.8 2084 11
2 2084.04.11. 12:25:53 2084.04.11. 12:29:00 1 0.32 238 238 1 N 2 4 0 0,5 0.3 0 0 4.8 2084 11
2 2084.04.11. 12:08:33 2084.04.11. 12:22:24 1 1.85 236 238 1 N 2 10 0 0,5 0.3 0 0 10.8 2084 11
2 2084.04.11. 11:41:35 2084.04.11. 11:59:41 1 1.65 68 237 1 N 2 12.5 0 0,5 0.3 0 0 13.3 2084 11
2 2084.04.11. 11:27:28 2084.04.11. 11:39:52 1 1.07 170 68 1 N 2 9 0 0,5 0.3 0 0 9.8 2084 11
2 2084.04.11. 11:19:06 2084.04.11. 11:26:44 1 1.3 107 170 1 N 2 7,5 0 0,5 0.3 0 0 8.3 2084 11
2 2084.04.11. 11:02:59 2084.04.11. 11:15:51 1 1.85 113 137 1 N 2 10 0 0,5 0.3 0 0 10.8 2084 11
2 2084.04.11. 10:46:05 2084.04.11. 10:50:09 1 0,62 231 231 1 N 2 4,5 0 0,5 0.3 0 0 5.3 2084 11

Az adatok elérése

Azure Notebooks

# This is a package in preview.
from azureml.opendatasets import NycTlcYellow

from datetime import datetime
from dateutil import parser


end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcYellow(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_pandas_dataframe()

nyc_tlc_df.info()

Azure Databricks

# This is a package in preview.
# You need to pip install azureml-opendatasets in Databricks cluster. https://learn.microsoft.com/azure/data-explorer/connect-from-databricks#install-the-python-library-on-your-azure-databricks-cluster
from azureml.opendatasets import NycTlcYellow

from datetime import datetime
from dateutil import parser


end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcYellow(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_spark_dataframe()

display(nyc_tlc_df.limit(5))

Azure Synapse

# This is a package in preview.
from azureml.opendatasets import NycTlcYellow

from datetime import datetime
from dateutil import parser

end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcYellow(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_spark_dataframe()

# Display top 5 rows
display(nyc_tlc_df.limit(5))

További lépések

Tekintse meg a többi adathalmazt az Open Datasets katalógusban.