Megosztás a következőn keresztül:


június 2019.

Ezek a funkciók és az Azure Databricks platform fejlesztései 2019 júniusában jelentek meg.

Feljegyzés

A kiadások szakaszosak. Előfordulhat, hogy az Azure Databricks-fiók csak a kezdeti kiadási dátum után egy héttel frissül.

Az Lsv2-példánytámogatás általánosan elérhető

2019. június 24– 26.: 2.100-es verzió

Az Azure Databricks mostantól teljes mértékben támogatja az Lsv2 virtuálisgép-sorozatot a nagy átviteli sebességű és magas IOPS-számítási feladatokhoz.

Az RStudio integrációja nem korlátozódik csak magas párhuzamosságú fürtökre

2019. június 6– 11.: 2.99-es verzió

Most már engedélyezheti az RStudio Servert az Azure Databricks standard fürtjeiben a már támogatott magas egyidejűségi fürtök mellett. A fürtmódtól függetlenül az RStudio Server integrációja továbbra is megköveteli a fürt automatikus leállításának letiltását. Lásd: RStudio az Azure Databricksben.

MLflow 1.0

2019. június 3.

Az MLflow egy nyílt forráskód platform a teljes gépi tanulási életciklus kezeléséhez. Az MLflow segítségével az adattudósok nyomon követhetik és megoszthatják a kísérleteket helyileg vagy a felhőben, modelleket csomagolhatnak és oszthatnak meg keretrendszereken keresztül, és gyakorlatilag bárhol üzembe helyezhetik a modelleket.

Örömmel jelentjük be az MLflow 1.0 mai kiadását. Az 1.0-s kiadás nemcsak az API-k fejlettségét és stabilitását jelzi, hanem számos gyakran kért funkciót és fejlesztést is hozzáad:

  • A parancssori felület át lett szervezve, és dedikált parancsokkal rendelkezik az összetevők, modellek, adatbázis (a nyomkövetési adatbázis) és a kiszolgáló (a követő kiszolgáló) számára.
  • A nyomkövetési kiszolgáló keresése támogatja a SQL WHERE záradék egyszerűsített verzióját. A futtatási metrikák és paramok támogatása mellett a keresés is bővült néhány futtatási attribútum, valamint a felhasználói és rendszercímkék támogatásához.
  • Támogatja az x koordinátákat a Tracking API-ban. Az MLflow felhasználói felület vizualizációs összetevői mostantól a metrikák ábrázolását is támogatják a megadott x-koordináta-értékek alapján.
  • Hozzáad egy runs/log-batch REST API-végpontot, valamint Python-, R- és Java-metódusokat több metrikák, paraméterek és címkék naplózásához egyetlen API-kéréssel.
  • A nyomon követés érdekében az MLflow 1.0-ügyfél mostantól támogatott Windows rendszeren.
  • Támogatja a HDFS-t összetevőtár-háttérrendszerként.
  • Hozzáad egy parancsot egy Olyan Docker-tároló létrehozásához, amelynek alapértelmezett belépési pontja a megadott MLflow Python-függvénymodellt szolgálja ki a tároló 8080-s portján.
  • Kísérleti ONNX-modell-ízt ad hozzá.

Az MLflow Change naplóban megtekintheti a módosítások teljes listáját.

Databricks Runtime 5.4 for Machine Learning

2019. június 3.

A Databricks Runtime 5.4 ML a Databricks Runtime 5.4 (EoS) platformra épül. Számos népszerű gépi tanulási kódtárat tartalmaz, köztük a TensorFlow, a PyTorch, a Keras és az XGBoost, és elosztott TensorFlow-képzést biztosít a Horovod használatával.

A következő új funkciókat tartalmazza:

  • MLlib-integráció az MLflow-val (nyilvános előzetes verzió).
  • Hyperopt előre telepített új SparkTrials-osztálysal (nyilvános előzetes verzió).
  • A Horovodból a Spark-illesztőcsomópontra küldött HorovodRunner-kimenet mostantól látható a jegyzetfüzetcellákban.
  • Előre telepített XGBoost Python-csomag.

További részletekért lásd: Databricks Runtime 5.4 for ML (EoS).

Databricks Runtime 5.4

2019. június 3.

A Databricks Runtime 5.4 már elérhető. A Databricks Runtime 5.4 tartalmazza az Apache Spark 2.4.2-t, a frissített Python-, R-, Java- és Scala-kódtárakat, valamint az alábbi új funkciókat:

  • Delta Lake on Databricks hozzáadja az automatikus optimalizálás (nyilvános előzetes verzió)
  • Kedvenc IDE- és jegyzetfüzet-kiszolgáló használata a Databricks Connect használatával
  • Általánosan elérhető kódtár-segédprogramok
  • Bináris fájl adatforrása

További részletekért lásd: Databricks Runtime 5.4 (EoS).