A Jupyter-jegyzetfüzetek például azt mutatják be, hogyan bővítheti az adatokat nyílt adatkészletekkel
Cikk
Az Azure Open Dataset-hez készült Jupyter-jegyzetfüzetek példa bemutatják, hogyan tölthető be a megnyitott adathalmazok, és hogyan bővíthetőek a bemutatóadatok. A technikák közé tartozik az Apache Spark és a Pandas használata az adatok feldolgozásához.
Fontos
Ha nem Spark-környezetben dolgozik, az Open Datasets lehetővé teszi, hogy egyszerre csak egy hónapnyi adatot töltsön le bizonyos osztályokban, így elkerülhetők a memóriahiba a nagy adathalmazokkal.
Töltse be a NYC zöld taxiadatait (több mint egy hónap), és gazdagítsa azokat időjárási adatokkal egy Pandas-adatkeretben. Ez a példa felülbírálja a metódust get_pandas_limit , és az adatbetöltés teljesítményét az adatok mennyiségével egyensúlyozza.
Kezelheti az adatok betöltését és előkészítését, a modellek betanítását és üzembe helyezését, valamint a gépi tanulási megoldások monitorozását a Python, az Azure Machine Learning és az MLflow használatával.