Příklady poznámkových bloků Jupyter ukazují, jak rozšířit data pomocí otevřených datových sad

Ukázkové poznámkové bloky Jupyter pro Azure Open Datasets ukazují, jak načíst otevřené datové sady a použít je k obohacení ukázkových dat. Mezi techniky patří použití Apache Sparku a Pandasu ke zpracování dat.

Důležité

Při práci v prostředí bez Sparku umožňuje funkce Open Datasets stahovat s určitými třídami jenom jeden měsíc dat, aby se zabránilo chybě MemoryError u velkých datových sad.

Načtení dat integrované databáze Surface (ISD) NOAA

Poznámkový blok Popis
Načtení dat o počasí za poslední měsíc do datového rámce Pandas Zjistěte, jak načíst historická data o počasí do svého oblíbeného datového rámce Pandas.
Načtení dat o počasí za poslední měsíc do datového rámce Sparku Zjistěte, jak načíst historická data o počasí do svého oblíbeného datového rámce Sparku.

Spojení ukázkových dat pomocí dat NOAA ISD

Poznámkový blok Popis
Spojení ukázkových dat s daty o počasí – Pandas Připojte se k 1měsíční ukázkové datové sadě s umístěními senzorů se čtením počasí v datovém rámci Pandas.
Spojení ukázkových dat s daty o počasí – Spark Připojte ukázkovou datovou sadu umístění senzorů se čtením počasí v datovém rámci Sparku.

Připojení k datům taxislužby NYC pomocí dat NOAA ISD

Poznámkový blok Popis
Data o jízdě taxíkem rozšířená o údaje o počasí - Pandas Načtěte data zelené taxi NYC (více než 1 měsíc) a obohaťte je o data o počasí v datovém rámci Pandas. Tento příklad přepíše metodu get_pandas_limit a vyrovnává výkon načítání dat s množstvím dat.
Data o jízdě taxíkem rozšířená o data o počasí – Spark Načtěte data zelené taxi NYC a obohaťte je o data o počasí v datovém rámci Sparku.

Další kroky