你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

纽约市安全数据

从 2010 年至今,纽约市的所有 311 服务请求。

注意

Microsoft 按“原样”提供 Azure 开放数据集。 Microsoft 对数据集的使用不提供任何担保(明示或暗示)、保证或条件。 在当地法律允许的范围内,Microsoft 对使用数据集而导致的任何损害或损失不承担任何责任,包括直接、必然、特殊、间接、偶发或惩罚性损害或损失。

此数据集是根据 Microsoft 接收源数据的原始条款提供的。 数据集可能包含来自 Microsoft 的数据。

数量和保留期

此数据集以 Parquet 格式存储。 每天更新,截至 2019 年总共包括约 1200 万行 (500 MB)。

此数据集包含从 2010 年至今累积的历史记录。 可使用我们的 SDK 中的参数设置来提取特定时间范围内的数据。

存储位置

此数据集存储在美国东部 Azure 区域。 建议将计算资源分配到美国东部地区,以实现相关性。

其他信息

此数据集来源于纽约市政府,有关详细信息,请参阅纽约市网站。 请参阅此数据集的条款

名称 数据类型 唯一 值(示例) 说明
address string 1,536,593 655 EAST 230 STREET 78-15 PARSONS BOULEVARD 提交者提供的事件地址门牌号。
category 字符串 446 噪声 - 住宅 暖气/热水 这是标识事件或条件主题(投诉类型)的层次结构的第一级别。 它可能具有相应子类别(描述符),也可能是独立的。
dataSubtype 字符串 1 311_All “311_All”
dataType 字符串 1 安全 “安全”
dateTime timestamp 17,332,609 2013-01-24 00:00:00 2015-01-08 00:00:00 日期服务请求已创建。
latitude Double 1,513,691 40.89187241649303 40.72195913199264 基于地理位置的事件位置纬度。
longitude Double 1,513,713 -73.86016845296459 -73.80969682426189 基于地理位置的事件位置经度。
状态 字符串 13 待关闭 服务请求的状态已提交。
子类别 string 1,716 大声的音乐/聚会 整个大楼 这与类别(投诉类型)相关联,并提供有关事件或状况的更多详细信息。 其值取决于投诉类型,并且在服务请求中并不总是必需的。

预览

dataType dataSubtype dateTime category 子类别 状态 address latitude longitude source extendedProperties
安全 311_All 4/25/2021 2:05:05 AM 噪音 - 街道/人行道 大声的音乐/聚会 正在进行 2766 BATH AVENUE 40.5906129741766 -73.9847949011337 null
安全 311_All 4/25/2021 2:04:33 AM 噪声 - 商业 大声的音乐/聚会 正在进行 1033 WEBSTER AVENUE 40.8285784533256 -73.9117746958432 null
安全 311_All 4/25/2021 2:04:27 AM 噪声 - 住宅 大声的音乐/聚会 正在进行 620 WEST 141 STREET 40.8241726554395 -73.9530069547366 null
安全 311_All 4/25/2021 2:04:04 AM 噪声 - 住宅 大声的音乐/聚会 正在进行 1647 64 STREET 40.6218907202382 -73.9931125332078 null
安全 311_All 4/25/2021 2:04:01 AM 噪声 - 住宅 大声的音乐/聚会 正在进行 30 LENOX AVENUE 40.7991622274945 -73.9517496365803 null
安全 311_All 4/25/2021 2:03:40 AM 非法停车 平行停车阻挡交通 正在进行 304 WEST 148 STREET 40.8248229687124 -73.940696262361 null
安全 311_All 4/25/2021 2:03:31 AM 噪音 - 街道/人行道 大声的音乐/聚会 正在进行 ADEE AVENUE 40.8708386263454 -73.8382363208686 null
安全 311_All 4/25/2021 2:03:18 AM 噪声 - 住宅 大声的音乐/聚会 正在进行 340 EVERGREEN AVENUE 40.6947512704197 -73.9248330229197 null
安全 311_All 4/25/2021 2:03:13 AM 噪声 - 住宅 撞击/敲击 正在进行 25 REMSEN STREET 40.6948938116483 -73.9973494607802 null

数据访问

Azure Notebooks

# This is a package in preview.
from azureml.opendatasets import SanFranciscoSafety

from datetime import datetime
from dateutil import parser


end_date = parser.parse('2016-01-01')
start_date = parser.parse('2015-05-01')
safety = SanFranciscoSafety(start_date=start_date, end_date=end_date)
safety = safety.to_pandas_dataframe()
safety.info()

Azure Databricks

# This is a package in preview.
# You need to pip install azureml-opendatasets in Databricks cluster. https://learn.microsoft.com/azure/data-explorer/connect-from-databricks#install-the-python-library-on-your-azure-databricks-cluster
from azureml.opendatasets import SanFranciscoSafety

from datetime import datetime
from dateutil import parser


end_date = parser.parse('2016-01-01')
start_date = parser.parse('2015-05-01')
safety = SanFranciscoSafety(start_date=start_date, end_date=end_date)
safety = safety.to_spark_dataframe()
display(safety.limit(5))

Azure Synapse

# This is a package in preview.
from azureml.opendatasets import SanFranciscoSafety

from datetime import datetime
from dateutil import parser


end_date = parser.parse('2016-01-01')
start_date = parser.parse('2015-05-01')
safety = SanFranciscoSafety(start_date=start_date, end_date=end_date)
safety = safety.to_spark_dataframe()
# Display top 5 rows
display(safety.limit(5))

示例

后续步骤

查看开放数据集目录中的其余数据集。