舊金山安全資料
舊金山的消防部門服務通話和 311 案件。
注意
Microsoft 依「現況」提供 Azure 開放資料集。 針對 貴用戶對資料集的使用方式,Microsoft 不提供任何明示或默示的擔保、保證或條件。 在 貴用戶當地法律允許的範圍內,針對因使用資料集而導致的任何直接性、衍生性、特殊性、間接性、附隨性或懲罰性損害或損失,Microsoft 概不承擔任何責任。
此資料集是根據 Microsoft 接收來源資料的原始條款所提供。 資料集可能包含源自 Microsoft 的資料。
消防通話服務包括回應通話的所有消防單位。 每筆記錄都包含通話號碼、事件號碼、地址、單位識別碼、通話類型和處置方式, 亦包括所有相關的時間間隔。 由於這份資料集是以回應為基礎,且大多數通話都涉及多個單位,因此每個通話號碼均有多筆記錄。 地址會與街區編號、十字路口或信箱建立關聯,而非與特定地址相關聯。
311 案例包含與地點或事物相關聯 (例如公園、街道或建築物),且於 2008 年 7 月 1 日之後建立的案例。 系統會排除使用者記錄自己需求的相關案例。 例如,財產或營業稅問題、停車許可要求等等。 如需詳細資訊,請參閱程式連結。
資料量與保留期
此資料集以 Parquet 格式儲存, 並每天更新一次,到 2019 年為止共包含約 600 萬個資料列 (400MB)。
此資料集包含從 2015 年累積至今的歷史記錄。 在我們的 SDK 中,您可以使用參數設定來擷取特定時間範圍內的資料。
儲存位置
此資料集儲存於美國東部 Azure 區域。 建議您在美國東部配置計算資源,以確保同質性。
相關資料集
資料行
名稱 | 資料類型 | 唯一 | Values (sample) | 描述 |
---|---|---|---|---|
address | 字串 | 280,652 | 未與特定位址 6 號街 0 區相關聯 | 事件的地址 (附註:地址和位置會概括表示成街道區間、十字路口或最接近的電話亭位置,以保護來電者的隱私權)。 |
category | 字串 | 108 | 街道和人行道清除可能有生命威脅 | 人類可讀的 311 案件服務要求類型名稱,或 911 消防通話的通話類型群組名稱。 |
dataSubtype | 字串 | 2 | 911_Fire 311_All | “911_Fire” 或 “311_All”。 |
dataType | 字串 | 1 | 安全性 | 「安全性」 |
dateTime | timestamp | 6,496,563 | 2020-10-19 12:28:08 2020-07-28 06:40:26 | 服務要求建立的日期和時間,或收到消防通話的時間。 |
緯度 | double | 1,615,369 | 37.777624238929 37.786117211838 | 使用 WGS84 投影的位置緯度。 |
經度 | double | 1,554,612 | -122.39998111124 -122.419854245692 | 使用 WGS84 投影的位置經度。 |
來源 | 字串 | 9 | 電話行動/Open311 | 接收服務要求的機制或路徑;通常是 “Phone”、“Text/SMS”、“Website”、“Mobile App”、“X” 等等,但字詞可能會因系統而異。 |
status | 字串 | 3 | 已結案未結案 | 服務要求目前狀態的單一字詞指標。 (附註:GeoReport V2 僅允許使用 “open” (未結案) 和 “closed” (已結案)) |
子類別 | 字串 | 1,270 | 醫療事件大量項目 | 人類可讀的 311 案件服務要求子類型名稱,或 911 消防通話的通話類型名稱。 |
預覽
dataType | dataSubtype | dateTime | category | 子類別 | status | address | 緯度 | 經度 | 來源 | extendedProperties |
---|---|---|---|---|---|---|---|---|---|---|
安全性 | 911_Fire | 2021/4/26 上午 2:56:13 | 非生命威脅 | 醫療事件 | null | GEARY 街 700 區 | 37.7863607914647 | -122.415616900246 | null | |
安全性 | 911_Fire | 2021/4/26 上午 2:56:13 | 非生命威脅 | 醫療事件 | null | GEARY 街 700 區 | 37.7863607914647 | -122.415616900246 | null | |
安全性 | 911_Fire | 2021/4/26 上午 2:54:03 | 非生命威脅 | 醫療事件 | null | ESSEX 街 0 區 | 37.7860048266229 | -122.395077258809 | null | |
安全性 | 911_Fire | 2021/4/26 上午 2:54:03 | 非生命威脅 | 醫療事件 | null | ESSEX 街 0 區 | 37.7860048266229 | -122.395077258809 | null | |
安全性 | 911_Fire | 2021/4/26 上午 2:52:17 | 非生命威脅 | 醫療事件 | null | 第 29 大道 700 區 | 37.7751770865322 | -122.488604397217 | null | |
安全性 | 911_Fire | 2021/4/26 上午 2:50:28 | 可能生命威脅 | 醫療事件 | null | GEARY 街 1000 區 | 37.7857350982044 | -122.420555240691 | null | |
安全性 | 911_Fire | 2021/4/26 上午 2:50:28 | 可能生命威脅 | 醫療事件 | null | GEARY 街 1000 區 | 37.7857350982044 | -122.420555240691 | null | |
安全性 | 911_Fire | 2021/4/26 上午 2:33:52 | 非生命威脅 | 醫療事件 | null | BELVEDERE 街 100 區 | 37.767791696654 | -122.449332294394 | null | |
安全性 | 911_Fire | 2021/4/26 上午 2:33:52 | 非生命威脅 | 醫療事件 | null | BELVEDERE 街 100 區 | 37.767791696654 | -122.449332294394 | null | |
安全性 | 911_Fire | 2021/4/26 上午 2:33:51 | 可能生命威脅 | 醫療事件 | null | 6 號街 100 區 | 37.7807920802756 | -122.408385745499 | null |
資料存取
Azure Notebooks
# This is a package in preview.
from azureml.opendatasets import NycSafety
from datetime import datetime
from dateutil import parser
end_date = parser.parse('2016-01-01')
start_date = parser.parse('2015-05-01')
safety = NycSafety(start_date=start_date, end_date=end_date)
safety = safety.to_pandas_dataframe()
safety.info()
Azure Databricks
# This is a package in preview.
# You need to pip install azureml-opendatasets in Databricks cluster. https://learn.microsoft.com/azure/data-explorer/connect-from-databricks#install-the-python-library-on-your-azure-databricks-cluster
from azureml.opendatasets import NycSafety
from datetime import datetime
from dateutil import parser
end_date = parser.parse('2016-01-01')
start_date = parser.parse('2015-05-01')
safety = NycSafety(start_date=start_date, end_date=end_date)
safety = safety.to_spark_dataframe()
display(safety.limit(5))
Azure Synapse
# This is a package in preview.
from azureml.opendatasets import NycSafety
from datetime import datetime
from dateutil import parser
end_date = parser.parse('2016-01-01')
start_date = parser.parse('2015-05-01')
safety = NycSafety(start_date=start_date, end_date=end_date)
safety = safety.to_spark_dataframe()
# Display top 5 rows
display(safety.limit(5))
範例
- 請參閱 GitHub 上的城市安全性分析範例。
下一步
檢視開放資料集目錄中的其餘資料集。