Příklady poznámkových bloků Jupyter ukazují, jak rozšířit data pomocí otevřených datových sad
Ukázkové poznámkové bloky Jupyter pro Azure Open Datasets ukazují, jak načíst otevřené datové sady a použít je k obohacení ukázkových dat. Mezi techniky patří použití Apache Sparku a Pandasu ke zpracování dat.
Důležité
Při práci v prostředí bez Sparku umožňuje funkce Open Datasets stahovat s určitými třídami jenom jeden měsíc dat, aby se zabránilo chybě MemoryError u velkých datových sad.
Načtení dat integrované databáze Surface (ISD) NOAA
Poznámkový blok | Popis |
---|---|
Načtení dat o počasí za poslední měsíc do datového rámce Pandas | Zjistěte, jak načíst historická data o počasí do svého oblíbeného datového rámce Pandas. |
Načtení dat o počasí za poslední měsíc do datového rámce Sparku | Zjistěte, jak načíst historická data o počasí do svého oblíbeného datového rámce Sparku. |
Spojení ukázkových dat pomocí dat NOAA ISD
Poznámkový blok | Popis |
---|---|
Spojení ukázkových dat s daty o počasí – Pandas | Připojte se k 1měsíční ukázkové datové sadě s umístěními senzorů se čtením počasí v datovém rámci Pandas. |
Spojení ukázkových dat s daty o počasí – Spark | Připojte ukázkovou datovou sadu umístění senzorů se čtením počasí v datovém rámci Sparku. |
Připojení k datům taxislužby NYC pomocí dat NOAA ISD
Poznámkový blok | Popis |
---|---|
Data o jízdě taxíkem rozšířená o údaje o počasí - Pandas | Načtěte data zelené taxi NYC (více než 1 měsíc) a obohaťte je o data o počasí v datovém rámci Pandas. Tento příklad přepíše metodu get_pandas_limit a vyrovnává výkon načítání dat s množstvím dat. |
Data o jízdě taxíkem rozšířená o data o počasí – Spark | Načtěte data zelené taxi NYC a obohaťte je o data o počasí v datovém rámci Sparku. |