你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

旧金山安全数据

旧金山市消防部门呼叫服务和 311 事件。

注意

Microsoft 按“原样”提供 Azure 开放数据集。 Microsoft 对数据集的使用不提供任何担保(明示或暗示)、保证或条件。 在当地法律允许的范围内,Microsoft 对使用数据集而导致的任何损害或损失不承担任何责任,包括直接、必然、特殊、间接、偶发或惩罚性损害或损失。

此数据集是根据 Microsoft 接收源数据的原始条款提供的。 数据集可能包含来自 Microsoft 的数据。

消防呼叫服务包括所有消防单位对呼叫的响应。 每个记录都包括呼叫号码、事件编号、地址、消防单位标识符、呼叫类型和处理情况。 其中还包括所有相关的时间间隔。 因为此数据集基于响应,并且由于大多数呼叫涉及多个单位,所以每个呼叫号码都有多个记录。 地址与街区号、交叉点或电话亭关联,而不与特定地址关联。

311 案例包括与某个地点或景物(例如,公园、街道或建筑物)相关的案例,于 2008 年 7 月 1 日之后创建。 不包括用户记录的与其自身需求相关的案例。 例如,财产或商业税务问题、停车许可请求等。 有关详细信息,请参阅计划链接

数量和保留期

此数据集以 Parquet 格式存储。 每天更新一次,截至 2019 年约有 600 万行 (400 MB)。

此数据集包含从 2015 年至今累积的历史记录。 可使用我们的 SDK 中的参数设置来提取特定时间范围内的数据。

存储位置

此数据集存储在美国东部 Azure 区域。 建议将计算资源分配到美国东部地区,以实现相关性。

名称 数据类型 唯一 值(示例) 说明
address string 280,652 Not associated with a specific address 0 Block of 6TH ST 事件地址(注意:为保护呼叫者的隐私,地址和位置泛化为街道的中间街区、交叉点或最近的电话亭位置)。
category string 108 Street and Sidewalk Cleaning Potentially Life-Threatening 311 服务请求类型或 911 火灾报警呼叫类型组的人类可读名称。
dataSubtype 字符串 2 911_Fire 311_All “911_Fire”或“311_All”。
dataType 字符串 1 安全 “安全”
dateTime timestamp 6,496,563 2020-10-19 12:28:08 2020-07-28 06:40:26 发出服务请求或收到火灾报警的日期和时间。
latitude Double 1,615,369 37.777624238929 37.786117211838 位置纬度,采用 WGS84 投影。
longitude Double 1,554,612 -122.39998111124 -122.419854245692 位置经度,采用 WGS84 投影。
source 字符串 9 Phone Mobile/Open311 服务请求接收机制或路径;通常是“手机”、“短信”、“网站”、“移动应用”、“Twitter”等,但术语可能因系统而异。
状态 字符串 3 Closed Open 服务请求当前状态的单字指示符。 (注意:GeoReport V2 仅允许“待处理”和“已结案”)
子类别 string 1,270 Medical Incident Bulky Items 311 事件的服务请求子类型或 911 火灾报警的呼叫类型的人类可读名称。

预览

dataType dataSubtype dateTime category 子类别 状态 address latitude longitude source extendedProperties
安全 911_Fire 4/26/2021 2:56:13 AM 不会造成人身伤害 医疗事故 Null 700 Block of GEARY ST 37.7863607914647 -122.415616900246 null
安全 911_Fire 4/26/2021 2:56:13 AM 不会造成人身伤害 医疗事故 Null 700 Block of GEARY ST 37.7863607914647 -122.415616900246 null
安全 911_Fire 4/26/2021 2:54:03 AM 不会造成人身伤害 医疗事故 Null 0 Block of ESSEX ST 37.7860048266229 -122.395077258809 null
安全 911_Fire 4/26/2021 2:54:03 AM 不会造成人身伤害 医疗事故 Null 0 Block of ESSEX ST 37.7860048266229 -122.395077258809 null
安全 911_Fire 4/26/2021 2:52:17 AM 不会造成人身伤害 医疗事故 Null 700 Block of 29TH AVE 37.7751770865322 -122.488604397217 null
安全 911_Fire 4/26/2021 2:50:28 AM 可能会造成人身伤害 医疗事故 Null 1000 Block of GEARY ST 37.7857350982044 -122.420555240691 null
安全 911_Fire 4/26/2021 2:50:28 AM 可能会造成人身伤害 医疗事故 Null 1000 Block of GEARY ST 37.7857350982044 -122.420555240691 null
安全 911_Fire 4/26/2021 2:33:52 AM 不会造成人身伤害 医疗事故 Null 100 Block of BELVEDERE ST 37.767791696654 -122.449332294394 null
安全 911_Fire 4/26/2021 2:33:52 AM 不会造成人身伤害 医疗事故 Null 100 Block of BELVEDERE ST 37.767791696654 -122.449332294394 null
安全 911_Fire 4/26/2021 2:33:51 AM 可能会造成人身伤害 医疗事故 Null 100 Block of 6TH ST 37.7807920802756 -122.408385745499 null

数据访问

Azure Notebooks

# This is a package in preview.
from azureml.opendatasets import NycSafety

from datetime import datetime
from dateutil import parser


end_date = parser.parse('2016-01-01')
start_date = parser.parse('2015-05-01')
safety = NycSafety(start_date=start_date, end_date=end_date)
safety = safety.to_pandas_dataframe()
safety.info()

Azure Databricks

# This is a package in preview.
# You need to pip install azureml-opendatasets in Databricks cluster. https://learn.microsoft.com/azure/data-explorer/connect-from-databricks#install-the-python-library-on-your-azure-databricks-cluster
from azureml.opendatasets import NycSafety

from datetime import datetime
from dateutil import parser


end_date = parser.parse('2016-01-01')
start_date = parser.parse('2015-05-01')
safety = NycSafety(start_date=start_date, end_date=end_date)
safety = safety.to_spark_dataframe()
display(safety.limit(5))

Azure Synapse

# This is a package in preview.
from azureml.opendatasets import NycSafety

from datetime import datetime
from dateutil import parser

end_date = parser.parse('2016-01-01')
start_date = parser.parse('2015-05-01')
safety = NycSafety(start_date=start_date, end_date=end_date)
safety = safety.to_spark_dataframe()
# Display top 5 rows
display(safety.limit(5))

示例

后续步骤

查看开放数据集目录中的其余数据集。