San Francisco Sejf ty Data

Volání o zásah hasičů a případy 311 v San Francisku.

Poznámka:

Microsoft poskytuje datové sady Azure Open Datasets na bázi "tak, jak je". Společnost Microsoft neposkytuje žádné záruky, výslovné ani předpokládané záruky ani podmínky týkající se vašeho používání datových sad. V rozsahu povoleném vaším místním zákonem společnost Microsoft odmítá veškerou odpovědnost za případné škody nebo ztráty, včetně přímých, následných, zvláštních, nepřímých, náhodných nebo represivních, vyplývajících z vašeho používání datových sad.

Na tuto datovou sadu se vztahují původní podmínky, které Microsoft přijal se zdrojovými daty. Datová sada může obsahovat data pocházející z Microsoftu.

Volání o zásah hasičů zahrnují všechny reakce hasičských jednotek na volání. Každý záznam obsahuje číslo volání, číslo incidentu, adresu, identifikátor jednotky, typ volání a povahu volání. K dispozici jsou také všechny relevantní časové intervaly. Vzhledem k tomu, že je tato datová sada založená na reakcích a většina volání zahrnovala několik jednotek, pro každé číslo volání existuje několik záznamů. Adresy jsou spojené s číslem bloku, průsečíkem nebo polem volání, nikoli s konkrétní adresou.

311 Případy zahrnují případy spojené s místem nebo věcí (například parky, ulice nebo budovy) a vytvořené po 1. červenci 2008. Případy, které uživatel zaprotokoluje o svých vlastních potřebách, jsou vyloučeny. Například otázky týkající se nemovitostí nebo obchodní daně, žádosti o parkovací povolení atd. Další informace najdete v odkazu na program.

Objem a uchovávání

Tato datová sada se uchovává ve formátu Parquet. Aktualizuje se každý den o přibližně 6M řádků (400 MB) od roku 2019.

Tato datová sada obsahuje historické záznamy shromážděné od roku 2015 až do současnosti. Pomocí nastavení parametrů v naší sadě SDK můžete načíst data v určitém časovém rozsahu.

Umístění úložiště

Tato datová sada se uchovává v oblasti Azure Východní USA. Kvůli přidružení se doporučuje přidělovat výpočetní prostředky v oblasti Východní USA.

Sloupce

Name Datový typ Jedinečný Values (sample) Popis
adresa string 280,652 Nepřidružuje se ke konkrétní adrese 0 Bloku 6TH ST. Adresa incidentu (poznámka: adresa a umístění zobecněné na střední blok ulice, průsečíku nebo nejbližšího místa call boxu pro ochranu osobních údajů volajícího).
category string 108 Ulice a chodník čištění potenciálně vyhrožující život Lidsky čitelný název typu žádosti o služby 311 nebo skupiny typů volání v případě volání hasičů na lince 911
dataSubtype string 2 911_Fire 311_All "911_Fire" nebo "311_All".
Datatype string 0 Bezpečnost "Sejf ty"
data a času. časové razítko 6,496,563 2020-10-19 12:28:08 2020-07-28 06:40:26 Datum a čas vytvoření žádosti o služby nebo zavolání hasičů.
zeměpisná šířka double 1,615,369 37.777624238929 37.786117211838 Zeměpisná šířka místa v zobrazení WGS84
longitude double 1,554,612 -122.39998111124 -122.419854245692 Zeměpisná délka místa v zobrazení WGS84
zdroj string 9 Telefon Mobile/Open311 Mechanismus nebo cesta, podle kterého byla přijata žádost o služby; obvykle "Telefon", "Text/SMS", "Web", "Mobilní aplikace", "Twitter" atd. Ale termíny se mohou lišit podle systému.
stav string 3 Zavřené otevřené Jednoslovný indikátor aktuálního stavu žádosti o služby. (Poznámka: GeoReport V2 povoluje "otevřít" a "uzavřeno")
Podkategorie string 1,270 Hromadné položky lékařského incidentu Lidsky čitelný název podtypu žádosti o služby pro případy 311 nebo typu volání v případě volání hasičů na lince 911

Ukázková

Datatype dataSubtype data a času. category Podkategorie stav adresa zeměpisná šířka longitude zdroj extendedProperties
Bezpečnost 911_Fire 26.4.2021 2:56:13 Neoživožující život Lékařský incident null 700 Blok GEARY ST 37.7863607914647 -122.415616900246 null
Bezpečnost 911_Fire 26.4.2021 2:56:13 Neoživožující život Lékařský incident null 700 Blok GEARY ST 37.7863607914647 -122.415616900246 null
Bezpečnost 911_Fire 26.4.2021 2:54:03 Neoživožující život Lékařský incident null 0 Blok ESSEX ST 37.7860048266229 -122.395077258809 null
Bezpečnost 911_Fire 26.4.2021 2:54:03 Neoživožující život Lékařský incident null 0 Blok ESSEX ST 37.7860048266229 -122.395077258809 null
Bezpečnost 911_Fire 26.4.2021 2:52:17 Neoživožující život Lékařský incident null 700 Blok 29TH AVE 37.7751770865322 -122.488604397217 null
Bezpečnost 911_Fire 26.4.2021 2:50:28 Potenciálně život vyhrožující Lékařský incident null 1000 Blok GEARY ST 37.7857350982044 -122.420555240691 null
Bezpečnost 911_Fire 26.4.2021 2:50:28 Potenciálně život vyhrožující Lékařský incident null 1000 Blok GEARY ST 37.7857350982044 -122.420555240691 null
Bezpečnost 911_Fire 26.4.2021 2:33:52 Neoživožující život Lékařský incident null 100 Blok BELVEDERE ST 37.767791696654 -122.449332294394 null
Bezpečnost 911_Fire 26.4.2021 2:33:52 Neoživožující život Lékařský incident null 100 Blok BELVEDERE ST 37.767791696654 -122.449332294394 null
Bezpečnost 911_Fire 26.4.2021 2:33:51 Potenciálně život vyhrožující Lékařský incident null 100 Blok 6TH ST 37.7807920802756 -122.408385745499 null

Přístup k datům

Azure Notebooks

# This is a package in preview.
from azureml.opendatasets import NycSafety

from datetime import datetime
from dateutil import parser


end_date = parser.parse('2016-01-01')
start_date = parser.parse('2015-05-01')
safety = NycSafety(start_date=start_date, end_date=end_date)
safety = safety.to_pandas_dataframe()
safety.info()

Azure Databricks

# This is a package in preview.
# You need to pip install azureml-opendatasets in Databricks cluster. https://learn.microsoft.com/azure/data-explorer/connect-from-databricks#install-the-python-library-on-your-azure-databricks-cluster
from azureml.opendatasets import NycSafety

from datetime import datetime
from dateutil import parser


end_date = parser.parse('2016-01-01')
start_date = parser.parse('2015-05-01')
safety = NycSafety(start_date=start_date, end_date=end_date)
safety = safety.to_spark_dataframe()
display(safety.limit(5))

Azure Synapse

# This is a package in preview.
from azureml.opendatasets import NycSafety

from datetime import datetime
from dateutil import parser

end_date = parser.parse('2016-01-01')
start_date = parser.parse('2015-05-01')
safety = NycSafety(start_date=start_date, end_date=end_date)
safety = safety.to_spark_dataframe()
# Display top 5 rows
display(safety.limit(5))

Příklady

Další kroky

Prohlédněte si zbývající datové sady v katalogu Open Datasets.