뉴욕시 안전 데이터

2010년부터 현재까지의 모든 뉴욕시 311 서비스 요청입니다.

참고

Microsoft는 Azure Open Datasets를 “있는 그대로” 제공합니다. Microsoft는 귀하의 데이터 세트 사용과 관련하여 어떠한 명시적이거나 묵시적인 보증, 보장 또는 조건을 제공하지 않습니다. 귀하가 거주하는 지역의 법규가 허용하는 범위 내에서 Microsoft는 귀하의 데이터 세트 사용으로 인해 발생하는 일체의 직접적, 결과적, 특별, 간접적, 부수적 또는 징벌적 손해 또는 손실을 비롯한 모든 손해 또는 손실에 대한 모든 책임을 부인합니다.

이 데이터 세트는 Microsoft가 원본 데이터를 받은 원래 사용 약관에 따라 제공됩니다. 데이터 세트에는 Microsoft가 제공한 데이터가 포함될 수 있습니다.

볼륨 및 보존

이 데이터 세트는 Parquet 형식으로 저장됩니다. 이 데이터 세트는 매일 업데이트되며, 2019년 기준 총 약 1,200만 개의 행(500MB)을 포함합니다.

이 데이터 세트는 2010년부터 현재까지 누적된 기록 레코드를 포함합니다. SDK의 매개 변수 설정을 사용하여 특정 시간 범위의 데이터를 가져올 수 있습니다.

스토리지 위치

이 데이터 세트는 미국 동부 Azure 지역에 저장됩니다. 선호도를 위해 미국 동부에 컴퓨팅 리소스를 할당하는 것이 좋습니다.

추가 정보

이 데이터 세트는 뉴욕시 정부 기관에서 제공됩니다. 자세한 내용은 뉴욕사 웹 사이트를 참조하세요. 이 데이터 세트 약관을 참조하세요.

이름 데이터 형식 고유한 값(샘플) Description
address 문자열 1,536,593 655 EAST 230 STREET 78-15 PARSONS BOULEVARD 제출자가 제공한 사건 주소의 번지입니다.
category 문자열 446 Noise - Residential HEAT/HOT WATER 사건 또는 조건(불만 유형)의 주제를 식별하는 계층 구조의 첫 번째 수준입니다. 해당 하위 범주(설명자)를 포함하거나 독립 실행형일 수 있습니다.
dataSubtype 문자열 1 311_All “311_All”
dataType 문자열 1 안전 “Safety”
dateTime timestamp 17,332,609 2013-01-24 00:00:00 2015-01-08 00:00:00 날짜 서비스 요청이 생성되었습니다.
latitude double 1,513,691 40.89187241649303 40.72195913199264 사건 위치의 지역 기반 위도입니다.
longitude double 1,513,713 -73.86016845296459 -73.80969682426189 사건 위치의 지역 기반 경도입니다.
상태 문자열 13 마감 보류 중 제출된 서비스 요청의 상태입니다.
subcategory 문자열 1,716 Loud Music/Party ENTIRE BUILDING 범주(불만 유형)와 연결되며 사건 또는 조건에 대한 추가 정보를 제공합니다. 해당 값은 불만 유형에 따라 달라지며 항상 서비스 요청에 필요하지는 않습니다.

미리 보기

dataType dataSubtype dateTime category subcategory 상태 address latitude longitude source extendedProperties
안전 311_All 4/25/2021 2:05:05 AM Noise - Street/Sidewalk Loud Music/Party 진행 중 2766 BATH AVENUE 40.5906129741766 -73.9847949011337 null
안전 311_All 4/25/2021 2:04:33 AM Noise - Commercial Loud Music/Party 진행 중 1033 WEBSTER AVENUE 40.8285784533256 -73.9117746958432 null
안전 311_All 4/25/2021 2:04:27 AM Noise - Residential Loud Music/Party 진행 중 620 WEST 141 STREET 40.8241726554395 -73.9530069547366 null
안전 311_All 4/25/2021 2:04:04 AM Noise - Residential Loud Music/Party 진행 중 1647 64 STREET 40.6218907202382 -73.9931125332078 null
안전 311_All 4/25/2021 2:04:01 AM Noise - Residential Loud Music/Party 진행 중 30 LENOX AVENUE 40.7991622274945 -73.9517496365803 null
안전 311_All 4/25/2021 2:03:40 AM Illegal Parking Double Parked Blocking Traffic 진행 중 304 WEST 148 STREET 40.8248229687124 -73.940696262361 null
안전 311_All 4/25/2021 2:03:31 AM Noise - Street/Sidewalk Loud Music/Party 진행 중 ADEE AVENUE 40.8708386263454 -73.8382363208686 null
안전 311_All 4/25/2021 2:03:18 AM Noise - Residential Loud Music/Party 진행 중 340 EVERGREEN AVENUE 40.6947512704197 -73.9248330229197 null
안전 311_All 4/25/2021 2:03:13 AM Noise - Residential Banging/Pounding 진행 중 25 REMSEN STREET 40.6948938116483 -73.9973494607802 null

데이터 액세스

Azure Notebooks

# This is a package in preview.
from azureml.opendatasets import SanFranciscoSafety

from datetime import datetime
from dateutil import parser


end_date = parser.parse('2016-01-01')
start_date = parser.parse('2015-05-01')
safety = SanFranciscoSafety(start_date=start_date, end_date=end_date)
safety = safety.to_pandas_dataframe()
safety.info()

Azure Databricks

# This is a package in preview.
# You need to pip install azureml-opendatasets in Databricks cluster. https://docs.microsoft.com/en-us/azure/data-explorer/connect-from-databricks#install-the-python-library-on-your-azure-databricks-cluster
from azureml.opendatasets import SanFranciscoSafety

from datetime import datetime
from dateutil import parser


end_date = parser.parse('2016-01-01')
start_date = parser.parse('2015-05-01')
safety = SanFranciscoSafety(start_date=start_date, end_date=end_date)
safety = safety.to_spark_dataframe()
display(safety.limit(5))

Azure Synapse

# This is a package in preview.
from azureml.opendatasets import SanFranciscoSafety

from datetime import datetime
from dateutil import parser


end_date = parser.parse('2016-01-01')
start_date = parser.parse('2015-05-01')
safety = SanFranciscoSafety(start_date=start_date, end_date=end_date)
safety = safety.to_spark_dataframe()
# Display top 5 rows
display(safety.limit(5))

다음 단계

Open Datasets 카탈로그에서 나머지 데이터 세트를 봅니다.