június 2019.
Ezek a funkciók és az Azure Databricks platform fejlesztései 2019 júniusában jelentek meg.
Feljegyzés
A kiadások szakaszosak. Előfordulhat, hogy az Azure Databricks-fiók csak a kezdeti kiadási dátum után egy héttel frissül.
Az Lsv2-példánytámogatás általánosan elérhető
2019. június 24– 26.: 2.100-es verzió
Az Azure Databricks mostantól teljes mértékben támogatja az Lsv2 virtuálisgép-sorozatot a nagy átviteli sebességű és magas IOPS-számítási feladatokhoz.
Az RStudio integrációja nem korlátozódik csak magas párhuzamosságú fürtökre
2019. június 6– 11.: 2.99-es verzió
Most már engedélyezheti az RStudio Servert az Azure Databricks standard fürtjeiben a már támogatott magas egyidejűségi fürtök mellett. A fürtmódtól függetlenül az RStudio Server integrációja továbbra is megköveteli a fürt automatikus leállításának letiltását. Lásd: RStudio az Azure Databricksben.
MLflow 1.0
2019. június 3.
Az MLflow egy nyílt forráskód platform a teljes gépi tanulási életciklus kezeléséhez. Az MLflow segítségével az adattudósok nyomon követhetik és megoszthatják a kísérleteket helyileg vagy a felhőben, modelleket csomagolhatnak és oszthatnak meg keretrendszereken keresztül, és gyakorlatilag bárhol üzembe helyezhetik a modelleket.
Örömmel jelentjük be az MLflow 1.0 mai kiadását. Az 1.0-s kiadás nemcsak az API-k fejlettségét és stabilitását jelzi, hanem számos gyakran kért funkciót és fejlesztést is hozzáad:
- A parancssori felület át lett szervezve, és dedikált parancsokkal rendelkezik az összetevők, modellek, adatbázis (a nyomkövetési adatbázis) és a kiszolgáló (a követő kiszolgáló) számára.
- A nyomkövetési kiszolgáló keresése támogatja a
SQL WHERE
záradék egyszerűsített verzióját. A futtatási metrikák és paramok támogatása mellett a keresés is bővült néhány futtatási attribútum, valamint a felhasználói és rendszercímkék támogatásához. - Támogatja az x koordinátákat a Tracking API-ban. Az MLflow felhasználói felület vizualizációs összetevői mostantól a metrikák ábrázolását is támogatják a megadott x-koordináta-értékek alapján.
- Hozzáad egy
runs/log-batch
REST API-végpontot, valamint Python-, R- és Java-metódusokat több metrikák, paraméterek és címkék naplózásához egyetlen API-kéréssel. - A nyomon követés érdekében az MLflow 1.0-ügyfél mostantól támogatott Windows rendszeren.
- Támogatja a HDFS-t összetevőtár-háttérrendszerként.
- Hozzáad egy parancsot egy Olyan Docker-tároló létrehozásához, amelynek alapértelmezett belépési pontja a megadott MLflow Python-függvénymodellt szolgálja ki a tároló 8080-s portján.
- Kísérleti ONNX-modell-ízt ad hozzá.
Az MLflow Change naplóban megtekintheti a módosítások teljes listáját.
Databricks Runtime 5.4 for Machine Learning
2019. június 3.
A Databricks Runtime 5.4 ML a Databricks Runtime 5.4 (EoS) platformra épül. Számos népszerű gépi tanulási kódtárat tartalmaz, köztük a TensorFlow, a PyTorch, a Keras és az XGBoost, és elosztott TensorFlow-képzést biztosít a Horovod használatával.
A következő új funkciókat tartalmazza:
- MLlib-integráció az MLflow-val (nyilvános előzetes verzió).
- Hyperopt előre telepített új SparkTrials-osztálysal (nyilvános előzetes verzió).
- A Horovodból a Spark-illesztőcsomópontra küldött HorovodRunner-kimenet mostantól látható a jegyzetfüzetcellákban.
- Előre telepített XGBoost Python-csomag.
További részletekért lásd: Databricks Runtime 5.4 for ML (EoS).
Databricks Runtime 5.4
2019. június 3.
A Databricks Runtime 5.4 már elérhető. A Databricks Runtime 5.4 tartalmazza az Apache Spark 2.4.2-t, a frissített Python-, R-, Java- és Scala-kódtárakat, valamint az alábbi új funkciókat:
- Delta Lake on Databricks hozzáadja az automatikus optimalizálás (nyilvános előzetes verzió)
- Kedvenc IDE- és jegyzetfüzet-kiszolgáló használata a Databricks Connect használatával
- Általánosan elérhető kódtár-segédprogramok
- Bináris fájl adatforrása
További részletekért lásd: Databricks Runtime 5.4 (EoS).