május 2020.
Ezek a funkciók és az Azure Databricks platform fejlesztései 2020 májusában jelentek meg.
Feljegyzés
A kiadások szakaszosak. Előfordulhat, hogy az Azure Databricks-fiók csak a kezdeti kiadási dátum után egy héttel frissül.
Easv4 sorozatú virtuális gépek (bétaverzió)
2020. május 29.
Az Azure Databricks mostantól bétaverziós támogatást biztosít az Easv4 sorozatú virtuális gépekhez, amelyek prémium SSD-t használnak, és 3,35 GHz-es maximális gyakoriságot érhetnek el. Ezek a példánytípusok optimalizálhatják a számítási feladatok teljesítményét a memóriaigényes vállalati alkalmazásokhoz.
Databricks Runtime 6.6 for Genomics GA
2020. május 26.
A Databricks Runtime 6.6 for Genomics a Databricks Runtime 6.6-ra épül, és a következő új funkciókat tartalmazza:
- GFF3 olvasó
- Egyéni referencia genom támogatása
- Mintafolyamatonkénti időtúllépések
- BAM exportálási lehetőség
- Jegyzékblobok
Databricks Runtime 6.6 ML GA
2020. május 26.
A Databricks Runtime 6.6 ML a Databricks Runtime 6.6-ra épül, és a következő új funkciókat tartalmazza:
- Frissített mlflow: 1.7.0-ról 1.8.0-ra
További információkért tekintse meg a Databricks Runtime 6.6 ML (nem támogatott) kiadási megjegyzéseit.
Databricks Runtime 6.6 GA
2020. május 26.
A Databricks Runtime 6.6 számos könyvtárfrissítést és új funkciót kínál, köztük az alábbi Delta Lake-funkciókat:
- Mostantól a művelettel automatikusan fejlesztheti a tábla sémáját
merge
. Ez olyan helyzetekben hasznos, amikor az adatokat táblázattá szeretné alakítani, és az adatok sémája idővel változik. Ahelyett, hogy a sémamódosításokat észleli és alkalmazza a frissítés előtt, egyidejűleg fejlesztheti a sémát,merge
és továbbfejlesztheti a módosításokat. Lásd a Delta Lake-egyesítés automatikus sémafejlődését. - Az olyan egyesítési műveletek teljesítménye, amelyek csak egyező záradékokkal rendelkeznek, azaz csak
update
delete
és műveletekkel rendelkeznek, és nincsinsert
művelet, javult. - A Hive metaadattárban hivatkozott parquet táblák mostantól Delta Lake-re konvertálhatók a táblaazonosítók használatával
CONVERT TO DELTA
.
További információkért tekintse meg a Databricks Runtime 6.6 (nem támogatott) kiadási megjegyzéseit.
DBFS REST API – a Delete végpont méretkorlátja
2020. május 21–28.: 3.20-os verzió
Ha nagy számú fájlt töröl rekurzív módon a DBFS API használatával, a törlési művelet lépésekben történik. A hívás körülbelül 45 év után ad vissza egy választ egy hibaüzenettel, amely arra kéri, hogy hívja meg újra a törlési műveletet, amíg a címtárstruktúra teljesen nem törlődik. Példa:
{
"error_code":"PARTIAL_DELETE","message":"The requested operation has deleted 324 files. There are more files remaining. You must make another request to delete more."
}
Sok, az MLlflow-ban regisztrált modell egyszerű megtekintése
2020. május 21–28.: 3.20-os verzió
Az MLflow modellregisztrációs adatbázisa mostantól támogatja a kiszolgálóoldali keresést és a regisztrált modellek lapozását, így a nagy számú modellel rendelkező szervezetek hatékonyan végezhetik el a listázást és a keresést. A korábbiakhoz hasonlóan név alapján is kereshet modelleket, és a találatokat név vagy az utolsó frissítés időpontja szerint rendezheti. Ha azonban sok modellel rendelkezik, a lapok sokkal gyorsabban töltődnek be, és a keresés a modellek legfrissebb nézetét fogja lekérni.
Az összes fürtre való telepítésre konfigurált kódtárak telepítése nem történik meg a Databricks Runtime 7.0-s vagy újabb verzióját futtató fürtökön
2020. május 21–28.: 3.20-os verzió
A Databricks Runtime 7.0-s és újabb verzióiban az Apache Spark mögöttes verziója a Scala 2.12-t használja. Mivel a Scala 2.11-ben lefordított kódtárak váratlan módon letilthatják a Databricks Runtime 7.0-fürtöket, a Databricks Runtime 7.0-s vagy újabb verzióját futtató fürtök nem telepítik az összes fürtre telepített kódtárakat. A fürttárak lap egy állapotot Skipped
és egy elavultsági üzenetet jelenít meg a tárkezelés változásaival kapcsolatban.
Ha a 3.20-at megelőzően a Databricks Runtime egy korábbi verziójában létrehozott fürt van a munkaterületen, és most szerkessze a fürtöt a Databricks Runtime 7.0 használatára, a fürtön minden olyan kódtár telepítve lesz, amelyet úgy konfiguráltak, hogy az összes fürtre telepítve legyen. Ebben az esetben a telepített kódtárakban lévő nem kompatibilis JAR-k a fürt letiltását okozhatják. A megkerülő megoldás a fürt klónozása vagy egy új fürt létrehozása.
Databricks Runtime 7.0 for Genomics (bétaverzió)
2020. május 21.
A Databricks Runtime 7.0 for Genomics a Databricks Runtime 7.0-ra épül, és a következő kódtár-módosításokat tartalmazza:
- Az ADAM-kódtár a 0.30.0-s verzióról a 0.32.0-ra frissült.
- A Hail-kódtár nem szerepel a Genomics Databricks Runtime 7.0-s verziójában, mivel nincs apache Spark 3.0-n alapuló kiadás.
Databricks Runtime 7.0 ML (bétaverzió)
2020. május 21.
A Databricks Runtime 7.0 ML a Databricks Runtime 7.0-ra épül, és a következő új funkciókat tartalmazza:
- Jegyzetfüzet-hatókörű Python-kódtárak és egyéni környezetek, amelyeket conda és pip parancsok kezelnek.
- Frissítések nagyobb Python-csomagokhoz, például tensorflow, tensorboard, pytorch, xgboost, sparkdl és hyperopt.
- Újonnan hozzáadott Python-csomagok lightgbm, nltk, petastorm és plotly.
- RStudio Server Open Source v1.2.
További információkért tekintse meg a Databricks Runtime 7.0 ML (nem támogatott) kiadási megjegyzéseit.
Databricks Runtime 6.6 for Genomics (bétaverzió)
2020. május 7.
A Databricks Runtime 6.6 for Genomics a Databricks Runtime 6.6-ra épül, és a következő új funkciókat tartalmazza:
- GFF3 olvasó
- Egyéni referencia genom támogatása
- Mintafolyamatonkénti időtúllépések
- BAM exportálási lehetőség
- Jegyzékblobok
Databricks Runtime 6.6 ML (bétaverzió)
2020. május 7.
A Databricks Runtime 6.6 ML a Databricks Runtime 6.6-ra épül, és a következő új funkciókat tartalmazza:
- Frissített mlflow: 1.7.0-ról 1.8.0-ra
További információkért tekintse meg a Databricks Runtime 6.6 ML (nem támogatott) kiadási megjegyzéseit.
Databricks Runtime 6.6 (bétaverzió)
2020. május 7.
A Databricks Runtime 6.6 (bétaverzió) számos könyvtárfrissítést és új funkciót kínál, köztük az alábbi Delta Lake-funkciókat:
- Mostantól a művelettel automatikusan fejlesztheti a tábla sémáját
merge
. Ez olyan helyzetekben hasznos, amikor az adatokat táblázattá szeretné alakítani, és az adatok sémája idővel változik. Ahelyett, hogy a sémamódosításokat észleli és alkalmazza a frissítés előtt, egyidejűleg fejlesztheti a sémát,merge
és továbbfejlesztheti a módosításokat. Lásd a Delta Lake-egyesítés automatikus sémafejlődését. - Az olyan egyesítési műveletek teljesítménye, amelyek csak egyező záradékokkal rendelkeznek, azaz csak
update
delete
és műveletekkel rendelkeznek, és nincsinsert
művelet, javult. - A Hive metaadattárban hivatkozott parquet táblák mostantól Delta Lake-re konvertálhatók a táblaazonosítók használatával
CONVERT TO DELTA
.
További információkért tekintse meg a Databricks Runtime 6.6 (nem támogatott) kiadási megjegyzéseit.
A feladatfürtök címkézése feladatnévvel és azonosítóval
2020. május 5–12.: 3.19-es verzió
A feladatfürtök automatikusan meg vannak címkézve a feladat nevével és azonosítójával. A címkék megjelennek a számlázható használati jelentésekben, így egyszerűen hozzárendelheti a DBU-használatot feladat szerint, és azonosíthatja az anomáliákat. A címkék a fürtcímkék specifikációinak megfelelően vannak megtisztítva, például az engedélyezett karakterek, a maximális méret és a címkék maximális száma. A feladat neve szerepel a RunName
címkében, a feladatazonosító pedig a JobId
címkében.
Törölt jegyzetfüzetcellák visszaállítása
2020. május 5–12.: 3.19-es verzió
Most már visszaállíthatja a törölt cellákat a(z) (Z
) billentyűparancs használatával vagy a Cellák törlése visszavonása szerkesztésével>.
Függőben lévő feladatok várólistájának korlátja
2020. május 5–12.: 3.19-es verzió
A munkaterületek jelenleg 1000 aktív (futó és függőben lévő) feladatfuttatásra korlátozódnak. Mivel egy munkaterület legfeljebb 150 egyidejű (futó) feladatfuttatásra korlátozódik, a munkaterületen legfeljebb 850 futtatás lehet a függőben lévő várólistán.