你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

按县划分的美国人口

源自 2000 年和 2010 年人口普查(每十年一次)的每个美国县按性别和人种划分的美国人口。

此数据集来源于美国人口普查局的十年人口普查数据集 API。 要了解与使用此数据集相关的条款和条件,请查看服务条款政策与声明

注意

Microsoft 按“原样”提供 Azure 开放数据集。 Microsoft 对数据集的使用不提供任何担保(明示或暗示)、保证或条件。 在当地法律允许的范围内,Microsoft 对使用数据集而导致的任何损害或损失不承担任何责任,包括直接、必然、特殊、间接、偶发或惩罚性损害或损失。

此数据集是根据 Microsoft 接收源数据的原始条款提供的。 数据集可能包含来自 Microsoft 的数据。

数量和保留期

此数据集以 Parquet 格式存储,包含 2000 年和 2010 年的数据。

存储位置

此数据集存储在美国东部 Azure 区域。 建议将计算资源分配到美国东部地区,以实现相关性。

名称 数据类型 唯一 值(示例) 说明
countyName string 1,960 Washington County Jefferson County 县名。
decennialTime 字符串 2 2010 2000 人口普查发生的时间(每十年一次),例如 2010、2000。
maxAge int 23 9 66 年龄范围的最大值。 如果为 Null,则为所有年龄,或者年龄范围没有上限,例如年龄 > 85。
minAge int 23 35 67 年龄范围的最小值。 如果为 Null,则为所有年龄。
填充 (population) int 47,229 1 2 此段的人口。
race 字符串 8 ASIAN ALONE TWO OR MORE RACES 人口普查数据中的人种类别。 如果为 Null,则为所有人种。
sex 字符串 3 Male Female 男性或女性。 如果为 Null,则性别不限。
stateName string 52 Texas Georgia 美国各州名称。
year int 2 2010 2000 年份(以十年为单位,整数)。

预览

decennialTime stateName countyName 填充 (population) race sex minAge maxAge year
2010 Texas Crockett County 123 仅白人 5 9 2010
2010 Texas Crockett County 1 仅亚洲人 67 69 2010
2010 Texas Crockett County 111 仅白人 55 59 2010
2010 Texas Crockett County 64 TWO OR MORE RACES Null 2010
2010 Texas Crockett County 18 Null 85 2010
2010 Texas Crockett County 16 AMERICAN INDIAN AND ALASKA NATIVE ALONE 2010
2010 Texas Crockett County 7 仅白人 21 21 2010
2010 Texas Crockett County 45 Null 85 2010
2010 Texas Crockett County 0 NATIVE HAWAIIAN AND OTHER PACIFIC ISLANDER ALONE 67 69 2010

数据访问

Azure Notebooks

# This is a package in preview.
from azureml.opendatasets import UsPopulationCounty

population = UsPopulationCounty()
population_df = population.to_pandas_dataframe()
population_df.info()

Azure Databricks

# This is a package in preview.
from azureml.opendatasets import UsPopulationCounty

population = UsPopulationCounty()
population_df = population.to_spark_dataframe()
display(population_df.limit(5))

Azure Synapse

# This is a package in preview.
from azureml.opendatasets import UsPopulationCounty

population = UsPopulationCounty()
population_df = population.to_spark_dataframe()
# Display top 5 rows
display(population_df.limit(5))

后续步骤

查看开放数据集目录中的其余数据集。