2019. július

Ezek a funkciók és az Azure Databricks platform fejlesztései 2019 júliusában jelentek meg.

Megjegyzés

A kiadások szakaszosak. Előfordulhat, hogy az Azure Databricks-fiók csak a kezdeti kiadás dátuma után egy héttel frissül.

Hamarosan elérhető: A Databricks 6.0 nem támogatja a Python 2-t

A 2020-ra bejelentett Python 2 hamarosan véget ér, a Databricks Runtime 6.0 nem támogatja a Python 2-t. A Databricks Runtime korábbi verziói továbbra is támogatják a Python 2-t. A Databricks Runtime 6.0-s verzióját várhatóan 2019 későbbi részében fogjuk kiadni.

A Databricks Runtime verziójának előzetes betöltése tétlen készletpéldányokon

2019. július 30. – 2019. augusztus 6.: 2.103-es verzió

Most felgyorsíthatja a készlet által támogatott fürtindításokat, ha kiválaszt egy Databricks Runtime-verziót, amelyet a készlet üresjárati példányaiba szeretne betölteni. A Készlet felhasználói felületén lévő mező neve Előre betöltött Spark-verzió.

Előre betöltött Spark-verzió

Az egyéni fürtcímkék és a készletcímkék együtt jobban játszanak

2019. július 30. – 2019. augusztus 6.: 2.103-es verzió

A hónap elején az Azure Databricks bevezette a készleteket, amelyek tétlen példányok készletei segítenek a fürtök gyors elindításában. Az eredeti kiadásban a készletalapú fürtök örökölték az alapértelmezett és az egyéni címkéket a készlet konfigurációjából, és ezeket a címkéket nem lehetett módosítani a fürt szintjén. Most már konfigurálhatja a készlet által támogatott fürtökre jellemző egyéni címkéket, és ez a fürt minden egyéni címkét alkalmaz, függetlenül attól, hogy a készlettől örökölt vagy kifejezetten az adott fürthöz van rendelve. Nem adhat hozzá fürtspecifikus egyéni címkét ugyanazzal a kulcsnévvel, mint egy készlettől örökölt egyéni címke (vagyis nem bírálhatja felül a készlettől örökölt egyéni címkét). Részletekért lásd: Készletcímkék.

Az MLflow 1.1 számos felhasználói felületet és API-fejlesztést biztosít

2019. július 30. – 2019. augusztus 6.: 2.103-es verzió

Az MLflow 1.1 számos új funkciót vezet be a felhasználói felület és az API használhatóságának javítása érdekében:

  • A futtatások áttekintő felhasználói felülete mostantól lehetővé teszi több oldalnyi futtatás tallózását, ha a futtatások száma meghaladja a 100-t. A 100. futtatás után kattintson a Továbbiak betöltése gombra a következő 100 futtatás betöltéséhez.

    Lapozott futtatások

  • A compare futtatási felhasználói felület mostantól párhuzamos koordináták ábrázolására szolgál. A diagram lehetővé teszi a paraméterek és metrikák n dimenziós készlete közötti kapcsolatok megfigyelését. Az összes futtatás egy metrika értéke (például pontosság) alapján színkódolt vonalként jelenik meg, és megjeleníti az egyes futtatások paraméterértékeit.

    Párhuzamos koordináták ábrázolása

  • Most hozzáadhat és szerkeszthet címkéket a futtatás áttekintő felhasználói felületén, és megtekintheti a címkéket a kísérlet keresési nézetében.

  • Az új MLflowContext API-val a Python API-hoz hasonló módon hozhat létre és naplózhat futtatásokat. Ez az API ellentétben áll a meglévő alacsony szintű MlflowClient API-val, amely egyszerűen burkolja a REST API-kat.

  • Mostantól törölheti a címkéket az MLflow-futtatásokból a DeleteTag API használatával.

Részletekért tekintse meg az MLflow 1.1 blogbejegyzést. A funkciók és javítások teljes listáját az MLflow változásnaplójában találja.

A pandas DataFrame-kijelző ugyanúgy jelenik meg, mint a Jupyterben

2019. július 30. – 2019. augusztus 6.: 2.103-es verzió

Most, amikor meghív egy pandas DataFrame-et, ugyanúgy jelenik meg, mint a Jupyterben.

Pandas DataFrame megjelenítése

Új régiók

2019. július 30.

Az Azure Databricks a következő további régiókban érhető el:

  • Korea középső régiója
  • Dél-Afrika északi régiója

Databricks Runtime 5.5 a Condával (bétaverzió)

2019. július 23.

Fontos

A Databricks Runtime és a Conda bétaverzióban érhető el. A támogatott környezetek tartalma megváltozhat a következő bétaverziós kiadásokban. A módosítások közé tartozhat a csomagok vagy a telepített csomagok verzióinak listája. A Databricks Runtime 5.5 és a Conda a Databricks Runtime 5.5 LTS (nem támogatott) szolgáltatásra épül.

A Databricks Runtime 5.5 és a Conda kiadás új, jegyzetfüzet-hatókörű kódtár API-t ad hozzá, amely támogatja a jegyzetfüzet Conda-környezetének YAML-specifikációval való frissítését (lásd a Conda dokumentációját).

Tekintse meg a Databricks Runtime 5.5 és a Conda (nem támogatott) kiadási megjegyzéseit.

Metaadattár-kapcsolati korlát frissítve

2019. július 16– 23.: 2.102-es verzió

Az új Azure Databricks-munkaterületek eastus, eastus2, centralus, westus, westus2, westeurope és northeurope területén magasabb metaadattár-kapcsolati korláttal rendelkeznek, mint 250. A meglévő munkaterületek továbbra is megszakítás nélkül használják az aktuális metaadattárat, és továbbra is 100-ra korlátozzák a kapcsolati korlátot.

Készletek engedélyeinek beállítása (nyilvános előzetes verzió)

2019. július 16– 23.: 2.102-es verzió

A készlet felhasználói felülete mostantól támogatja annak beállítását, hogy ki kezelheti a készleteket, és ki csatolhat fürtöket a készletekhez.

Részletekért lásd: Készlethozzáférés-vezérlés.

Databricks Runtime 5.5 for Machine Learning

Július 15., 2019

A Databricks Runtime 5.5 ML a Databricks Runtime 5.5 LTS (nem támogatott) szolgáltatásra épül. Számos népszerű gépi tanulási kódtárat tartalmaz, köztük a TensorFlow, a PyTorch, a Keras és az XGBoost, valamint elosztott TensorFlow-betanítást biztosít a Horovod használatával.

Ez a kiadás a következő új funkciókat és fejlesztéseket tartalmazza:

  • Az MLflow 1.0 Python-csomag hozzáadva
  • Frissített gépi tanulási kódtárak
    • A TensorFlow 1.12.0-ról 1.13.1-es verzióra frissült
    • A PyTorch 0.4.1-ről 1.1.0-ra frissült
    • scikit-learn frissítve 0.19.1-ről 0.20.3-ra
  • Egycsomópontos művelet a HorovodRunnerhez

Részletekért lásd: Databricks Runtime 5.5 LTS for ML (Nem támogatott).

Databricks Runtime 5.5

Július 15., 2019

A Databricks Runtime 5.5 már elérhető. A Databricks Runtime 5.5 tartalmazza az Apache Spark 2.4.3-at, a frissített Python-, R-, Java- és Scala-kódtárakat, valamint az alábbi új funkciókat:

  • Delta Lake az Azure Databricks automatikus optimalizálása – GA
  • A Delta Lake az Azure Databricksben javította az összesítő lekérdezések minimális, maximális és darabszámú teljesítményét
  • Gyorsabb modellkövetkeztetési folyamatok a továbbfejlesztett bináris fájladatforrással és a pandas UDF skaláris iterátorával (nyilvános előzetes verzió)
  • Secrets API R-jegyzetfüzetekben

Részletekért lásd: Databricks Runtime 5.5 LTS (Nem támogatott).

Példánykészlet készenléti állapotban tartása a gyors fürtindításhoz (nyilvános előzetes verzió)

2019. július 9– 11.: 2.101-es verzió

A fürt kezdési idejének csökkentése érdekében az Azure Databricks mostantól támogatja a fürtök egy előre meghatározott üresjárati példánykészlethez való csatolását. Készlethez csatolva a fürt lefoglalja az illesztő- és munkavégző csomópontokat a készletből. Ha a készlet nem rendelkezik elegendő üresjárati erőforrással a fürt kérésének teljesítéséhez, a készlet úgy bővül, hogy új példányokat foglal le a felhőszolgáltatótól. Egy csatolt fürt leállásakor a rendszer visszaadja az általa használt példányokat a készletnek, és egy másik fürt újra felhasználhatja.

Az Azure Databricks nem számít fel dbU-kat, amíg a példányok tétlenek a készletben. A példányszolgáltató számlázása érvényes. Lásd a díjszabást.

További részletekért lásd: Készlet létrehozása.

Ganglia-metrikák

2019. július 9– 11.: 2.101-es verzió

A Ganglia egy skálázható elosztott monitorozási rendszer, amely mostantól elérhető az Azure Databricks-fürtökön. A Ganglia-metrikák segítenek a fürt teljesítményének és állapotának monitorozásában. A Ganglia-metrikákat a fürt részletei oldalon érheti el:

Ganglia-metrikák lap

A metrikák használatával és konfigurálásával kapcsolatos részletekért lásd: Ganglia-metrikák.

Globális sorozat színe

2019. július 9– 11.: 2.101-es verzió

Most már megadhatja, hogy a sorozatok színei konzisztensek legyenek a jegyzetfüzet összes diagramjában. Lásd: Színkonzisztencia a diagramok között.

Globális sorozat színe