Amerikaanse bevolking, gerangschikt op district
De bevolking van de Verenigde Staten, gerangschikt op geslacht en ras voor elk Amerikaanse district. Informatie afkomstig uit de volkstellingen van 2000 en 2010.
Deze gegevensset is afkomstig van Verenigde Staten Census Bureau's Decennial Census Dataset API's. Lees de Servicevoorwaarden en Beleidsregels en opmerkingen voor de voorwaarden met betrekking tot het gebruik van deze gegevensset.
Notitie
Microsoft biedt Azure Open Datasets op basis van 'zoals is'. Microsoft geeft geen garanties, uitdrukkelijk of impliciet, garanties of voorwaarden met betrekking tot uw gebruik van de gegevenssets. Voor zover toegestaan volgens uw lokale wetgeving, wijst Microsoft alle aansprakelijkheid af voor eventuele schade of verliezen, waaronder directe, gevolgschade, speciale, indirecte, incidentele of strafbare gegevenssets, die het gevolg zijn van uw gebruik van de gegevenssets.
Deze gegevensset wordt geleverd onder de oorspronkelijke voorwaarden dat Microsoft de brongegevens heeft ontvangen. De gegevensset kan gegevens bevatten die afkomstig zijn van Microsoft.
Volume en retentie
Deze gegevensset wordt in Parquet-indeling opgeslagen en bevat gegevens voor de jaren 2000 en 2010.
Opslaglocatie
Deze gegevensset wordt opgeslagen in de Azure-regio US - oost. Het wordt aanbevolen om rekenresources in US - oost toe te wijzen voor affiniteit.
Gerelateerde gegevenssets
Kolommen
Naam | Gegevenstype | Uniek | Waarden (voorbeeld) | Beschrijving |
---|---|---|---|---|
countyName | tekenreeks | 1,960 | Washington County Seattle County | De naam van het district. |
decennialTime | tekenreeks | 2 | 2010 2000 | De tijd van de decennial census is gebeurd, bijvoorbeeld 2010, 2000. |
maxAge | int | 23 | 9 66 | Het maximum in het leeftijdsbereik. Als de waarde null is, geldt dit voor alle leeftijden of het leeftijdsbereik heeft geen bovengrens, bijvoorbeeld leeftijd > 85. |
minAge | int | 23 | 35 67 | Het minimum in het leeftijdsbereik. Als deze waarde null is, zijn alle leeftijden op het item van toepassing. |
population | int | 47,229 | 1 2 | De invulling van dit segment. |
ras | tekenreeks | 8 | AZIATISCHE ALLEEN TWEE OF MEER RASSEN | De categorie Ras in de volkstellingsgegevens. Als deze waarde null is, zijn alle rassen op het item van toepassing. |
geslacht | tekenreeks | 3 | Mannelijk vrouwtje | Man of vrouw. Als deze waarde null is, is elk geslacht op het item van toepassing. |
stateName | tekenreeks | 52 | Texas Georgia | De naam van de staat in de Verenigde Staten. |
jaar | int | 2 | 2010 2000 | Jaar (positief geheel getal) van decimale tijd. |
Preview uitvoeren
decennialTime | stateName | countyName | population | ras | geslacht | minAge | maxAge | jaar |
---|---|---|---|---|---|---|---|---|
2010 | Texas | Crockett County | 123 | ALLEEN WIT | Mannelijk | 5 | 9 | 2010 |
2010 | Texas | Crockett County | 1 | ALLEEN AZIATISCH | Vrouwelijk | 67 | 69 | 2010 |
2010 | Texas | Crockett County | 111 | ALLEEN WIT | Vrouwelijk | 55 | 59 | 2010 |
2010 | Texas | Crockett County | 64 | TWEE OF MEER RACES | Nul | 2010 | ||
2010 | Texas | Crockett County | 18 | Nul | Mannelijk | 85 | 2010 | |
2010 | Texas | Crockett County | 16 | AMERIKAANS INDIAAS EN ALASKA NATIVE ALLEEN | Vrouwelijk | 2010 | ||
2010 | Texas | Crockett County | 7 | ALLEEN WIT | Mannelijk | 21 | 21 | 2010 |
2010 | Texas | Crockett County | 45 | Nul | Vrouwelijk | 85 | 2010 | |
2010 | Texas | Crockett County | 0 | NATIVE HAWAIIAN EN ANDERE PACIFIC ISLANDER ALLEEN | Vrouwelijk | 67 | 69 | 2010 |
Toegang tot gegevens
Azure Notebooks
# This is a package in preview.
from azureml.opendatasets import UsPopulationCounty
population = UsPopulationCounty()
population_df = population.to_pandas_dataframe()
population_df.info()
Azure Databricks
# This is a package in preview.
from azureml.opendatasets import UsPopulationCounty
population = UsPopulationCounty()
population_df = population.to_spark_dataframe()
display(population_df.limit(5))
Azure Synapse
# This is a package in preview.
from azureml.opendatasets import UsPopulationCounty
population = UsPopulationCounty()
population_df = population.to_spark_dataframe()
# Display top 5 rows
display(population_df.limit(5))
Volgende stappen
Bekijk de rest van de gegevenssets in de catalogus Open Datasets.