NYC Taxi & Limousine Bizottság - zöld taxi út rekordok

A zöld taxis utazások rekordjai az utasfelvétel és -kiadás dátumát és idejét, a felvétel és -kiadás helyét, az út hosszát, a tételes viteldíjakat, a díjszabás típusát, a fizetési módot, valamint a sofőr által bejelentett utasszámot tartalmazzák.

Megjegyzés

A Microsoft "adott módon" biztosítja az Azure Open Datasets szolgáltatást. A Microsoft nem vállal kifejezett vagy vélelmezett garanciát vagy feltételeket az adathalmazok Ön általi használatára vonatkozóan. A helyi jogszabályok által megengedett mértékig a Microsoft kizár minden felelősséget az adathalmazok használatából eredő károkért vagy veszteségekért, beleértve a közvetlen, következményi, különleges, közvetett, járulékos vagy büntető jellegű károkat is.

Az adatkészletet a Microsoft forrásadataihoz tartozó eredeti feltételek szerint szolgáltatjuk. A készlet tartalmazhat Microsofttól származó adatokat.

Kötet és megőrzés

Az adatkészlet Parketta formátumban van tárolva. 2018-ban összesen körülbelül 80 M sor (2 GB) van.

Az adatkészlet 2009. és 2018. között összegyűjtött adatokat tartalmaz. Adott időtartomány adatainak beolvasásához az általunk biztosított SDK paraméterbeállításait használhatja.

Tárolási hely

Az adatkészlet tárolási helye a Kelet-USA Azure-régió. Az affinitás érdekében a Kelet-USA régión belüli számítási erőforrások lefoglalását javasoljuk.

További információ

NYC Taxi and Limousine Commission (TLC):

Az adatokat a Taxicab & Livery Passenger Enhancement Programs (TPEP/LPEP) keretében engedélyezett technológiai szolgáltatók gyűjtötték és szolgáltatták a NYC Taxi és Limousine Bizottság (TLC) részére. Az utazások adatait nem a TLC hozta létre, amely így nem is vállal felelősséget ezek pontosságáért.

Tekintse meg az adathalmaz eredeti helyét és az eredeti használati feltételeket.

Oszlopok

Name Adattípus Egyedi Értékek (minta) Description
doLocationId sztring 264 74 42 A taxióra kikapcsolásának DOLocationID TLC taxizónája.
dropoffLatitude double 109,721 40.7743034362793 40.77431869506836 2016 júliusától elavult
dropoffLongitude double 75,502 -73.95272827148438 -73.95274353027344 2016 júliusától elavult
Extra double 202 0.5 1.0 Egyéb pótdíjak. Ez jelenleg csak a 0,50, illetve 1 USD-s csúcsidős és éjszakai díjakat tartalmazza.
viteldíjAmount double 10,367 6.0 5.5 Az óra által mért díj az idő és a megtett út függvényében.
improvementSurcharge sztring 92 0.3 0 0,30 USD-s pótdíj leintéses utasfelvételnél. A pótdíjat 2015-ben vezették be.
lpepDropoffDatetime időbélyeg 58,100,713 2016-05-22 00:00:00 2016-05-09 00:00:00 Az óra leállításának dátuma és ideje.
lpepPickupDatetime időbélyeg 58,157,349 2013-10-22 12:40:36 2014-08-09 15:54:25 Az óra indításának dátuma és ideje.
mtaTax double 34 0.5 -0.5 Az ár 0,50 USD MTA- (városi közlekedési hatósági) adót tartalmaz, amely a mért díjnak megfelelően automatikusan hozzáadódik az összeghez.
passengerCount int 10 1 2 A járműben tartózkodó utasok száma. Az értéket a sofőr adja meg.
paymentType int 5 2 1 Numerikus kód, amely azt jelzi, hogy az utas hogyan fizetett az útért. 1= Hitelkártya 2= Készpénz 3= Díjmentes 4= Vita 5= Ismeretlen 6 = Érvénytelenített utazás
pickupLatitude double 95,110 40.721351623535156 40.721336364746094 2016 júliusától elavult
pickupLongitude double 55,722 -73.84429931640625 -73.84429168701172 2016 júliusától elavult
puLocationId sztring 264 74 41 A taxióra indításának TLC-taxizónája.
puMonth int 12 3 5
puYear int 14 2015 2016
rateCodeID int 7 1 5 Az utazás végén érvényben lévő utolsó díjszabás-azonosító. 1= Standard díj 2= JFK 3= Newark 4= Nassau vagy Westchester 5= Tárgyalásos viteldíj 6 = Csoportos utazás
storeAndFwdFlag sztring 2 N Y Ez a jelző azt jelzi, hogy az utazási rekord a jármű memóriájában volt-e tárolva, mielőtt elküldené a szállítónak, más néven "store and forward" néven is, mivel a járműnek nem volt kapcsolata a kiszolgálóval. Y = store and forward trip N = nem üzlet és előre utazás
tipAmount double 6,206 1.0 2.0 Borravaló összege – Ez a mező automatikusan kitöltésre kerül hitelkártyás borravaló-fizetésnél. A készpénzben fizetett borravalókat nem tartalmazza.
tollsAmount double 2,150 5.54 5.76 Az utazás során fizetett összes úthasználati díj összege.
totalAmount double 20,188 7.8 6.8 Az utasok által térítendő teljes összeg. Nem tartalmazza a készpénzben fizetett borravalók összegét.
tripDistance double 7,060 0.9 1.0 A utazás során megtett távolság mérföldben a taxióra adatai alapján.
tripType int 3 1 2 Kód amely azt jelzi, hogy az utazás utcai leintés volt-e, vagy kiosztott, amelyet a rendszer automatikusan rendel hozzá a taxióra által alkalmazott díj alapján, de amelyet a sofőr megváltoztathat. 1 = Utca-jégeső 2 = Dispatch
vendorID int 2 2 1 A rekordot szolgáltató LPEP-szolgáltató kódja. 1 = Creative Mobile Technologies, LLC; 2= VeriFone Inc.

Előnézet

vendorID lpepPickupDatetime lpepDropoffDatetime passengerCount tripDistance puLocationId doLocationId rateCodeID storeAndFwdFlag paymentType viteldíjAmount Extra mtaTax improvementSurcharge tipAmount tollsAmount totalAmount tripType puYear puMonth
2 2081.06.24. 17:40:37 2081.06.24. 18:42:47 1 16.95 93 117 1 N 1 52 1 0,5 0.3 0 2.16 55.96 1 2081 6
2 2030.11.28. 12:19:29 2030.11.28. 12:25:37 1 1.08 42 247 1 N 2 6.5 0 0,5 0.3 0 0 7.3 1 2030 11
2 2030.11.28. 12:14:50 2030.11.28. 12:14:54 1 0.03 42 42 5 N 2 5 0 0 0 0 0 5 2 2030 11
2 2020. 11. 14. 11:38:07 2020. 11. 14. 11:42:22 1 0.63 129 129 1 N 2 4,5 1 0,5 0.3 0 0 6.3 1 2020 11
2 2020.11.14. 9:55:36 2020. 11. 14. 10:04:54 1 3,8 82 138 1 N 2 12.5 1 0,5 0.3 0 0 14,3 1 2020 11
2 2019.08.26. 16:18:37 2019.08.26. 16:19:35 1 0 264 264 1 N 2 1 0 0,5 0.3 0 0 1.8 1 2019 8
2 2019.07.01. 8:28:33 2019.07.01. 8:32:33 1 0.71 7 7 1 N 1 5 0 0,5 0.3 1.74 0 7.54 1 2019 7
2 2019.07.01. 12:04:53 2019.07.01. 12:21:56 1 2.71 223 145 1 N 2 13 0,5 0,5 0.3 0 0 14,3 1 2019 7
2 2019.07.01. 12:04:11 2019.07.01. 12:21:15 1 3.14 166 142 1 N 2 14,5 0,5 0,5 0.3 0 0 18.55 1 2019 7
2 2019.07.01. 12:03:37 2019.07.01. 12:09:27 1 0,78 74 74 1 N 1 6 0,5 0,5 0.3 1.46 0 8.76 1 2019 7

Az adatok elérése

Azure Notebooks

# This is a package in preview.
from azureml.opendatasets import NycTlcGreen

from datetime import datetime
from dateutil import parser


end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcGreen(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_pandas_dataframe()

nyc_tlc_df.info()

Azure Databricks

# This is a package in preview.
# You need to pip install azureml-opendatasets in Databricks cluster. https://docs.microsoft.com/en-us/azure/data-explorer/connect-from-databricks#install-the-python-library-on-your-azure-databricks-cluster
from azureml.opendatasets import NycTlcGreen

from datetime import datetime
from dateutil import parser


end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcGreen(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_spark_dataframe()

display(nyc_tlc_df.limit(5))

Azure Synapse

# This is a package in preview.
from azureml.opendatasets import NycTlcGreen

from datetime import datetime
from dateutil import parser


end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcGreen(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_spark_dataframe()

# Display top 5 rows
display(nyc_tlc_df.limit(5))

# Display data statistic information
display(nyc_tlc_df, summary = True)

Következő lépések

A többi adathalmaz megtekintése az Open Datasets katalógusban.