2019. július
Ezek a funkciók és az Azure Databricks platform fejlesztései 2019 júliusában jelentek meg.
Megjegyzés
A kiadások szakaszosak. Előfordulhat, hogy az Azure Databricks-fiók csak a kezdeti kiadás dátuma után egy héttel frissül.
Hamarosan elérhető: A Databricks 6.0 nem támogatja a Python 2-t
A 2020-ra bejelentett Python 2 hamarosan véget ér, a Databricks Runtime 6.0 nem támogatja a Python 2-t. A Databricks Runtime korábbi verziói továbbra is támogatják a Python 2-t. A Databricks Runtime 6.0-s verzióját várhatóan 2019 későbbi részében fogjuk kiadni.
A Databricks Runtime verziójának előzetes betöltése tétlen készletpéldányokon
2019. július 30. – 2019. augusztus 6.: 2.103-es verzió
Most felgyorsíthatja a készlet által támogatott fürtindításokat, ha kiválaszt egy Databricks Runtime-verziót, amelyet a készlet üresjárati példányaiba szeretne betölteni. A Készlet felhasználói felületén lévő mező neve Előre betöltött Spark-verzió.
Az egyéni fürtcímkék és a készletcímkék együtt jobban játszanak
2019. július 30. – 2019. augusztus 6.: 2.103-es verzió
A hónap elején az Azure Databricks bevezette a készleteket, amelyek tétlen példányok készletei segítenek a fürtök gyors elindításában. Az eredeti kiadásban a készletalapú fürtök örökölték az alapértelmezett és az egyéni címkéket a készlet konfigurációjából, és ezeket a címkéket nem lehetett módosítani a fürt szintjén. Most már konfigurálhatja a készlet által támogatott fürtökre jellemző egyéni címkéket, és ez a fürt minden egyéni címkét alkalmaz, függetlenül attól, hogy a készlettől örökölt vagy kifejezetten az adott fürthöz van rendelve. Nem adhat hozzá fürtspecifikus egyéni címkét ugyanazzal a kulcsnévvel, mint egy készlettől örökölt egyéni címke (vagyis nem bírálhatja felül a készlettől örökölt egyéni címkét). Részletekért lásd: Készletcímkék.
Az MLflow 1.1 számos felhasználói felületet és API-fejlesztést biztosít
2019. július 30. – 2019. augusztus 6.: 2.103-es verzió
Az MLflow 1.1 számos új funkciót vezet be a felhasználói felület és az API használhatóságának javítása érdekében:
A futtatások áttekintő felhasználói felülete mostantól lehetővé teszi több oldalnyi futtatás tallózását, ha a futtatások száma meghaladja a 100-t. A 100. futtatás után kattintson a Továbbiak betöltése gombra a következő 100 futtatás betöltéséhez.
A compare futtatási felhasználói felület mostantól párhuzamos koordináták ábrázolására szolgál. A diagram lehetővé teszi a paraméterek és metrikák n dimenziós készlete közötti kapcsolatok megfigyelését. Az összes futtatás egy metrika értéke (például pontosság) alapján színkódolt vonalként jelenik meg, és megjeleníti az egyes futtatások paraméterértékeit.
Most hozzáadhat és szerkeszthet címkéket a futtatás áttekintő felhasználói felületén, és megtekintheti a címkéket a kísérlet keresési nézetében.
Az új MLflowContext API-val a Python API-hoz hasonló módon hozhat létre és naplózhat futtatásokat. Ez az API ellentétben áll a meglévő alacsony szintű
MlflowClient
API-val, amely egyszerűen burkolja a REST API-kat.Mostantól törölheti a címkéket az MLflow-futtatásokból a DeleteTag API használatával.
Részletekért tekintse meg az MLflow 1.1 blogbejegyzést. A funkciók és javítások teljes listáját az MLflow változásnaplójában találja.
A pandas DataFrame-kijelző ugyanúgy jelenik meg, mint a Jupyterben
2019. július 30. – 2019. augusztus 6.: 2.103-es verzió
Most, amikor meghív egy pandas DataFrame-et, ugyanúgy jelenik meg, mint a Jupyterben.
Új régiók
2019. július 30.
Az Azure Databricks a következő további régiókban érhető el:
- Korea középső régiója
- Dél-Afrika északi régiója
Databricks Runtime 5.5 a Condával (bétaverzió)
2019. július 23.
Fontos
A Databricks Runtime és a Conda bétaverzióban érhető el. A támogatott környezetek tartalma megváltozhat a következő bétaverziós kiadásokban. A módosítások közé tartozhat a csomagok vagy a telepített csomagok verzióinak listája. A Databricks Runtime 5.5 és a Conda a Databricks Runtime 5.5 LTS (nem támogatott) szolgáltatásra épül.
A Databricks Runtime 5.5 és a Conda kiadás új, jegyzetfüzet-hatókörű kódtár API-t ad hozzá, amely támogatja a jegyzetfüzet Conda-környezetének YAML-specifikációval való frissítését (lásd a Conda dokumentációját).
Tekintse meg a Databricks Runtime 5.5 és a Conda (nem támogatott) kiadási megjegyzéseit.
Metaadattár-kapcsolati korlát frissítve
2019. július 16– 23.: 2.102-es verzió
Az új Azure Databricks-munkaterületek eastus, eastus2, centralus, westus, westus2, westeurope és northeurope területén magasabb metaadattár-kapcsolati korláttal rendelkeznek, mint 250. A meglévő munkaterületek továbbra is megszakítás nélkül használják az aktuális metaadattárat, és továbbra is 100-ra korlátozzák a kapcsolati korlátot.
Készletek engedélyeinek beállítása (nyilvános előzetes verzió)
2019. július 16– 23.: 2.102-es verzió
A készlet felhasználói felülete mostantól támogatja annak beállítását, hogy ki kezelheti a készleteket, és ki csatolhat fürtöket a készletekhez.
Részletekért lásd: Készlethozzáférés-vezérlés.
Databricks Runtime 5.5 for Machine Learning
Július 15., 2019
A Databricks Runtime 5.5 ML a Databricks Runtime 5.5 LTS (nem támogatott) szolgáltatásra épül. Számos népszerű gépi tanulási kódtárat tartalmaz, köztük a TensorFlow, a PyTorch, a Keras és az XGBoost, valamint elosztott TensorFlow-betanítást biztosít a Horovod használatával.
Ez a kiadás a következő új funkciókat és fejlesztéseket tartalmazza:
- Az MLflow 1.0 Python-csomag hozzáadva
- Frissített gépi tanulási kódtárak
- A TensorFlow 1.12.0-ról 1.13.1-es verzióra frissült
- A PyTorch 0.4.1-ről 1.1.0-ra frissült
- scikit-learn frissítve 0.19.1-ről 0.20.3-ra
- Egycsomópontos művelet a HorovodRunnerhez
Részletekért lásd: Databricks Runtime 5.5 LTS for ML (Nem támogatott).
Databricks Runtime 5.5
Július 15., 2019
A Databricks Runtime 5.5 már elérhető. A Databricks Runtime 5.5 tartalmazza az Apache Spark 2.4.3-at, a frissített Python-, R-, Java- és Scala-kódtárakat, valamint az alábbi új funkciókat:
- Delta Lake az Azure Databricks automatikus optimalizálása – GA
- A Delta Lake az Azure Databricksben javította az összesítő lekérdezések minimális, maximális és darabszámú teljesítményét
- Gyorsabb modellkövetkeztetési folyamatok a továbbfejlesztett bináris fájladatforrással és a pandas UDF skaláris iterátorával (nyilvános előzetes verzió)
- Secrets API R-jegyzetfüzetekben
Részletekért lásd: Databricks Runtime 5.5 LTS (Nem támogatott).
Példánykészlet készenléti állapotban tartása a gyors fürtindításhoz (nyilvános előzetes verzió)
2019. július 9– 11.: 2.101-es verzió
A fürt kezdési idejének csökkentése érdekében az Azure Databricks mostantól támogatja a fürtök egy előre meghatározott üresjárati példánykészlethez való csatolását. Készlethez csatolva a fürt lefoglalja az illesztő- és munkavégző csomópontokat a készletből. Ha a készlet nem rendelkezik elegendő üresjárati erőforrással a fürt kérésének teljesítéséhez, a készlet úgy bővül, hogy új példányokat foglal le a felhőszolgáltatótól. Egy csatolt fürt leállásakor a rendszer visszaadja az általa használt példányokat a készletnek, és egy másik fürt újra felhasználhatja.
Az Azure Databricks nem számít fel dbU-kat, amíg a példányok tétlenek a készletben. A példányszolgáltató számlázása érvényes. Lásd a díjszabást.
További részletekért lásd: Készlet létrehozása.
Ganglia-metrikák
2019. július 9– 11.: 2.101-es verzió
A Ganglia egy skálázható elosztott monitorozási rendszer, amely mostantól elérhető az Azure Databricks-fürtökön. A Ganglia-metrikák segítenek a fürt teljesítményének és állapotának monitorozásában. A Ganglia-metrikákat a fürt részletei oldalon érheti el:
A metrikák használatával és konfigurálásával kapcsolatos részletekért lásd: Ganglia-metrikák.
Globális sorozat színe
2019. július 9– 11.: 2.101-es verzió
Most már megadhatja, hogy a sorozatok színei konzisztensek legyenek a jegyzetfüzet összes diagramjában. Lásd: Színkonzisztencia a diagramok között.