NYC Taxi &Limuzin Bizottság - zöld taxi utazás rekordok
A zöld taxis utazások rekordjai az utasfelvétel és -kiadás dátumát és idejét, a felvétel és -kiadás helyét, az út hosszát, a tételes viteldíjakat, a díjszabás típusát, a fizetési módot, valamint a sofőr által bejelentett utasszámot tartalmazzák.
Feljegyzés
A Microsoft az Azure Open Datasets szolgáltatást "adott módon" biztosítja. A Microsoft nem vállal kifejezett vagy vélelmezett garanciát vagy feltételeket az adathalmazok Ön általi használatára vonatkozóan. A microsoft a helyi jogszabályok által megengedett mértékben kizár minden felelősséget az adathalmazok használatából eredő károkért vagy veszteségekért, beleértve a közvetlen, következményi, különleges, közvetett, incidenses vagy büntető jellegű károkat is.
Az adatkészletet a Microsoft forrásadataihoz tartozó eredeti feltételek szerint szolgáltatjuk. A készlet tartalmazhat Microsofttól származó adatokat.
Kötet és megőrzés
Az adatkészlet Parketta formátumban van tárolva. 2018-ban összesen körülbelül 80 M sor (2 GB) van.
Az adatkészlet 2009. és 2018. között összegyűjtött adatokat tartalmaz. Adott időtartomány adatainak beolvasásához az általunk biztosított SDK paraméterbeállításait használhatja.
Tárolási hely
Az adatkészlet tárolási helye a Kelet-USA Azure-régió. Az affinitás érdekében Kelet-USA régión belüli számítási erőforrások lefoglalását javasoljuk.
További információk
NYC Taxi and Limousine Commission (TLC):
Az adatokat a Taxicab & Livery Passenger Enhancement Programs (TPEP/LPEP) keretében technológiai szolgáltatók szolgáltatták az NYC Taxi and Limousine Commission (TLC) számára. Az utazások adatait nem a TLC hozta létre, amely így nem is vállal felelősséget ezek pontosságáért.
Tekintse meg az eredeti adatkészlet helyét és az eredeti használati feltételeket.
Oszlopok
Név | Adattípus | Egyedi | Values (sample) | Leírás |
---|---|---|---|---|
doLocationId | húr | 264 | 74 42 | A taxióra kikapcsolásának DOLocationID TLC taxizónája. |
dropoffLatitude | double | 109,721 | 40.7743034362793 40.77431869506836 | 2016 júliusától elavult |
dropoffLongitude | double | 75,502 | -73.95272827148438 -73.95274353027344 | 2016 júliusától elavult |
többlet | double | 202 | 0.5 1.0 | Egyéb pótdíjak. Ez jelenleg csak a 0,50, illetve 1 USD-s csúcsidős és éjszakai díjakat tartalmazza. |
viteldíjAmount | double | 10,367 | 6.0 5.5 | Az óra által mért díj az idő és a megtett út függvényében. |
improvementSurcharge | húr | 92 | 0.3 0 | 0,30 USD-s pótdíj leintéses utasfelvételnél. A pótdíjat 2015-ben vezették be. |
lpepDropoffDatetime | időbélyeg | 58,100,713 | 2016-05-22 00:00:00 2016-05-09 00:00:00 | Az óra leállításának dátuma és ideje. |
lpepPickupDatetime | időbélyeg | 58,157,349 | 2013-10-22 12:40:36 2014-08-09 15:54:25 | Az óra indításának dátuma és ideje. |
mtaTax | double | 34 | 0.5 -0.5 | Az ár 0,50 USD MTA- (városi közlekedési hatósági) adót tartalmaz, amely a mért díjnak megfelelően automatikusan hozzáadódik az összeghez. |
passengerCount | egész | 10 | 1 2 | A járműben tartózkodó utasok száma. Az értéket a sofőr adja meg. |
paymentType | egész | 5 | 2 1 | Numerikus kód, amely azt jelzi, hogy az utas hogyan fizetett az útért. 1= Hitelkártya 2= Készpénz 3= Díjmentes 4= Vita 5= Ismeretlen 6= Érvénytelenített utazás |
pickupLatitude | double | 95,110 | 40.721351623535156 40.721336364746094 | 2016 júliusától elavult |
pickupLongitude | double | 55,722 | -73.84429931640625 -73.84429168701172 | 2016 júliusától elavult |
puLocationId | húr | 264 | 74 41 | A taxióra indításának TLC-taxizónája. |
puMonth | egész | 12 | 3 5 | |
puYear | egész | 14 | 2015 2016 | |
rateCodeID | egész | 7 | 1 5 | A végösszeg az utazás végén. 1= Standard tarifa 2= JFK 3= Newark 4= Nassau vagy Westchester 5= Tárgyalásos viteldíj 6 = Csoportos utazás |
storeAndFwdFlag | húr | 2 | N Y | Ez a jelző azt jelzi, hogy az utazási rekord a jármű memóriájában volt-e tárolva, mielőtt elküldené a szállítónak, más néven "tároló és továbbítás" néven, mivel a járműnek nem volt kapcsolata a kiszolgálóval. Y = az N= nem áruházi és előreúti utazás |
tipAmount | double | 6,206 | 1.0 2.0 | Borravaló összege – Ez a mező automatikusan kitöltésre kerül hitelkártyás borravaló-fizetésnél. A készpénzben fizetett borravalókat nem tartalmazza. |
tollsAmount | double | 2,150 | 5.54 5.76 | Az utazás során fizetett összes úthasználati díj összege. |
totalAmount | double | 20,188 | 7.8 6.8 | Az utasok által térítendő teljes összeg. Nem tartalmazza a készpénzben fizetett borravalók összegét. |
tripDistance | double | 7,060 | 0.9 1.0 | A utazás során megtett távolság mérföldben a taxióra adatai alapján. |
tripType | egész | 3 | 1 2 | Kód amely azt jelzi, hogy az utazás utcai leintés volt-e, vagy kiosztott, amelyet a rendszer automatikusan rendel hozzá a taxióra által alkalmazott díj alapján, de amelyet a sofőr megváltoztathat. 1= Utcai jégeső 2= Diszpécser |
vendorID | egész | 2 | 2 1 | A rekordot szolgáltató LPEP-szolgáltató kódja. 1 = Creative Mobile Technologies, LLC; 2= VeriFone Inc. |
Előnézet
vendorID | lpepPickupDatetime | lpepDropoffDatetime | passengerCount | tripDistance | puLocationId | doLocationId | rateCodeID | storeAndFwdFlag | paymentType | viteldíjAmount | többlet | mtaTax | improvementSurcharge | tipAmount | tollsAmount | totalAmount | tripType | puYear | puMonth |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2 | 2081.06.24. 17:40:37 | 2081.06.24. 18:42:47 | 0 | 16.95 | 93 | 117 | 0 | N | 0 | 52 | 0 | 0,5 | 0.3 | 0 | 2.16 | 55.96 | 0 | 2081 | 6 |
2 | 2030. 11. 28. 12:19:29 | 2030.11.28. 12:25:37 | 0 | 1,08 | 42 | 247 | 0 | N | 2 | 6.5 | 0 | 0,5 | 0.3 | 0 | 0 | 7.3 | 0 | 2030 | 11 |
2 | 2030. 11. 28. 12:14:50 | 2030. 11. 28. 12:14:54 | 0 | 0.03 | 42 | 42 | 5 | N | 2 | 5 | 0 | 0 | 0 | 0 | 0 | 5 | 2 | 2030 | 11 |
2 | 2020. 11. 14. 11:38:07 | 2020. 11. 14. 11:42:22 | 0 | 0.63 | 129 | 129 | 0 | N | 2 | 4,5 | 0 | 0,5 | 0.3 | 0 | 0 | 6.3 | 0 | 2020 | 11 |
2 | 2020. 11. 14. 9:55:36 | 2020. 11. 14. 10:04:54 | 0 | 3,8 | 82 | 138 | 0 | N | 2 | 12.5 | 0 | 0,5 | 0.3 | 0 | 0 | 14,3 | 0 | 2020 | 11 |
2 | 2019. 08. 26. 16:18:37 | 2019. 08. 26. 16:19:35 | 0 | 0 | 264 | 264 | 0 | N | 2 | 0 | 0 | 0,5 | 0.3 | 0 | 0 | 1.8 | 0 | 2019 | 8 |
2 | 2019.07.01. 8:28:33 | 2019. 07. 01. 08:32:33 | 0 | 0,71 | 7 | 7 | 0 | N | 0 | 5 | 0 | 0,5 | 0.3 | 1.74 | 0 | 7.54 | 0 | 2019 | 7 |
2 | 2019.07.01. 12:04:53 | 2019.07.01. 12:21:56 | 0 | 2.71 | 223 | 145 | 0 | N | 2 | 13 | 0,5 | 0,5 | 0.3 | 0 | 0 | 14,3 | 0 | 2019 | 7 |
2 | 2019.07.01. 12:04:11 | 2019.07.01. 12:21:15 | 0 | 3,14 | 166 | 142 | 0 | N | 2 | 14,5 | 0,5 | 0,5 | 0.3 | 0 | 0 | 18.55 | 0 | 2019 | 7 |
2 | 2019.07.01. 12:03:37 | 2019.07.01. 12:09:27 | 0 | 0,78 | 74 | 74 | 0 | N | 0 | 6 | 0,5 | 0,5 | 0.3 | 1,46 | 0 | 8.76 | 0 | 2019 | 7 |
Az adatok elérése
Azure Notebooks
# This is a package in preview.
from azureml.opendatasets import NycTlcGreen
from datetime import datetime
from dateutil import parser
end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcGreen(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_pandas_dataframe()
nyc_tlc_df.info()
Azure Databricks
# This is a package in preview.
# You need to pip install azureml-opendatasets in Databricks cluster. https://learn.microsoft.com/azure/data-explorer/connect-from-databricks#install-the-python-library-on-your-azure-databricks-cluster
from azureml.opendatasets import NycTlcGreen
from datetime import datetime
from dateutil import parser
end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcGreen(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_spark_dataframe()
display(nyc_tlc_df.limit(5))
Azure Synapse
# This is a package in preview.
from azureml.opendatasets import NycTlcGreen
from datetime import datetime
from dateutil import parser
end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcGreen(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_spark_dataframe()
# Display top 5 rows
display(nyc_tlc_df.limit(5))
# Display data statistic information
display(nyc_tlc_df, summary = True)
Következő lépések
Tekintse meg a többi adathalmazt az Open Datasets katalógusban.