紐約市保管庫資料
從 2010 年至今所有的紐約市 311 服務要求。
注意
Microsoft 會以「如目前」為基礎提供 Azure 開放資料集。 Microsoft 不會就您使用資料集做出任何明示或默示擔保或條件。 根據當地法律所允許的範圍,Microsoft 會免除因使用資料集而產生的任何損害或損失的所有責任,包括直接、衍生、特殊、間接、附帶或懲罰性。
此資料集是根據 Microsoft 接收來源資料的原始條款所提供。 資料集可能包含源自 Microsoft 的資料。
磁片區和保留期
此資料集以 Parquet 格式儲存, 它每天更新,截至 2019 年,總共包含大約 1200 萬個數據列(500 MB)。
此資料集包含從 2010 年累積至今的歷史記錄。 在我們的 SDK 中,您可以使用參數設定來擷取特定時間範圍內的資料。
儲存位置
此資料集儲存於美國東部 Azure 區域。 建議您在美國東部配置計算資源,以確保同質性。
其他資訊
此資料集來自紐約市政府,如需詳細資訊,請參閱 紐約市網站 。 請參閱此資料集 的條款。
資料行
名稱 | 資料類型 | 唯一 | Values (sample) | 描述 |
---|---|---|---|---|
address | string | 1,536,593 | 655 東 230 街 78-15 帕森斯大道 | 提交者提供的事件地址門牌號碼。 |
category | string | 446 | 噪音 - 住宅熱/熱水 | 這是階層的第一層,可識別事件或條件的主題(投訴類型)。 它可能會有對應的子類別 (描述項),也可能獨立存在。 |
dataSubtype | string | 1 | 311_All | 「311_All」 |
dataType | string | 1 | 安全性 | 「保管庫ty」 |
dateTime | timestamp | 17,332,609 | 2013-01-24 00:00:00 2015-01-08 00:00:00 | 已建立日期服務要求。 |
緯度 | double | 1,513,691 | 40.89187241649303 40.72195913199264 | 事件位置的地理緯度。 |
經度 | double | 1,513,713 | -73.86016845296459 -73.80969682426189 | 事件位置的地理經度。 |
status | 字串 | 13 | 已關閉擱置中 | 已提交的服務要求狀態。 |
子類別 | string | 1,716 | 響亮的音樂/派對整個建築 | 這與類別 (投訴類型) 相關,並提供與事件或狀況相關的詳細資料。 其值取決於投訴類型,而且在服務要求中並非一律為必要項。 |
預覽
dataType | dataSubtype | dateTime | category | 子類別 | status | address | 緯度 | 經度 | 來源 | extendedProperties |
---|---|---|---|---|---|---|---|---|---|---|
安全性 | 311_All | 2021/4/25 上午 2:05:05 | 噪音 - 街道/人行道 | 響亮的音樂/派對 | 進行中 | 2766 巴斯大道 | 40.5906129741766 | -73.9847949011337 | null | |
安全性 | 311_All | 2021/4/25 上午 2:04:33 | 雜訊 - 商業 | 響亮的音樂/派對 | 進行中 | 1033 韋伯斯特大道 | 40.8285784533256 | -73.9117746958432 | null | |
安全性 | 311_All | 2021/4/25 上午 2:04:27 | 噪音 - 住宅 | 響亮的音樂/派對 | 進行中 | 620 西 141 街 | 40.8241726554395 | -73.9530069547366 | null | |
安全性 | 311_All | 2021/4/25 上午 2:04:04 | 噪音 - 住宅 | 響亮的音樂/派對 | 進行中 | 1647 64 街 | 40.6218907202382 | -73.9931125332078 | null | |
安全性 | 311_All | 2021/4/25 上午 2:04:01 | 噪音 - 住宅 | 響亮的音樂/派對 | 進行中 | 30 萊諾克斯大道 | 40.7991622274945 | -73.9517496365803 | null | |
安全性 | 311_All | 2021/4/25 上午 2:03:40 | 非法停車 | 雙重停駐封鎖交通 | 進行中 | 304 西 148 街 | 40.8248229687124 | -73.940696262361 | null | |
安全性 | 311_All | 2021/4/25 上午 2:03:31 | 噪音 - 街道/人行道 | 響亮的音樂/派對 | 進行中 | ADEE AVENUE | 40.8708386263454 | -73.8382363208686 | null | |
安全性 | 311_All | 2021/4/25 上午 2:03:18 | 噪音 - 住宅 | 響亮的音樂/派對 | 進行中 | 340 常綠大道 | 40.6947512704197 | -73.9248330229197 | null | |
安全性 | 311_All | 2021/4/25 上午 2:03:13 | 噪音 - 住宅 | 砰砰/磅 | 進行中 | 25 雷姆森街 | 40.6948938116483 | -73.9973494607802 | null |
資料存取
Azure Notebooks
# This is a package in preview.
from azureml.opendatasets import SanFranciscoSafety
from datetime import datetime
from dateutil import parser
end_date = parser.parse('2016-01-01')
start_date = parser.parse('2015-05-01')
safety = SanFranciscoSafety(start_date=start_date, end_date=end_date)
safety = safety.to_pandas_dataframe()
safety.info()
Azure Databricks
# This is a package in preview.
# You need to pip install azureml-opendatasets in Databricks cluster. https://learn.microsoft.com/azure/data-explorer/connect-from-databricks#install-the-python-library-on-your-azure-databricks-cluster
from azureml.opendatasets import SanFranciscoSafety
from datetime import datetime
from dateutil import parser
end_date = parser.parse('2016-01-01')
start_date = parser.parse('2015-05-01')
safety = SanFranciscoSafety(start_date=start_date, end_date=end_date)
safety = safety.to_spark_dataframe()
display(safety.limit(5))
Azure Synapse
# This is a package in preview.
from azureml.opendatasets import SanFranciscoSafety
from datetime import datetime
from dateutil import parser
end_date = parser.parse('2016-01-01')
start_date = parser.parse('2015-05-01')
safety = SanFranciscoSafety(start_date=start_date, end_date=end_date)
safety = safety.to_spark_dataframe()
# Display top 5 rows
display(safety.limit(5))
範例
下一步
檢視開放式資料集目錄中 的其餘資料集 。