Sdílet prostřednictvím


Květen 2018

Verze jsou nasazovány postupně. Váš účet Azure Databricks se nemusí aktualizovat až do týdne po počátečním datu vydání.

Obecné nařízení o ochraně osobních údajů (GDPR)

24. května 2018: Verze 2.72

Abychom splnili požadavky obecného nařízení Evropské unie o ochraně osobních údajů (GDPR), které platí 25. května 2018, provedli jsme řadu úprav platformy Azure Databricks, abychom vám poskytli větší kontrolu nad uchováváním dat na úrovni účtu i uživatele. Mezi aktualizace patří:

  • Odstranění clusteru: Trvale odstraňte konfiguraci clusteru pomocí uživatelského rozhraní nebo rozhraní API clusterů. Viz Odstranit výpočetní prostředek.
  • Vyprázdnění pracovního prostoru (vydané ve verzi 2.71): Trvale odstraňte objekty pracovního prostoru, jako jsou celé poznámkové bloky, jednotlivé buňky poznámkového bloku, komentáře jednotlivých poznámkových bloků a historie revizí poznámkového bloku. Viz Vyprázdnit úložiště pracovního prostoru.
  • Vymazání historie revizí poznámkového bloku:

Informace o odstranění služby Azure Databricks nebo zrušení účtu Azure najdete v tématu Správa předplatného.

Uživatelé Azure Databricks musí patřit do tenanta Microsoft Entra ID.

24. května 2018: Verze 2.72

Uživatelé se teď můžou k Azure Databricks přihlásit jenom v případě, že patří do tenanta Microsoft Entra ID (dříve Azure Active Directory) pracovního prostoru Azure Databricks. Pokud máte uživatele, kteří nepatří do tenanta Microsoft Entra ID, můžete je přidat jako standardní uživatele nebo uživatele typu host.

HorovodEstimator

29. května 2018: Verze 2.72

Přidání dokumentace a poznámkového bloku pro HorovodEstimator, rozhraní API pro odhad stylu MLlib, které využívá architekturu Horovod od Uberu . HorovodEstimator usnadňuje distribuované trénování hlubokých neurálních sítí s více GPU v rámci datových rámců Spark, což zjednodušuje integraci ETL ve Sparku s trénováním modelů v TensorFlow.

Export modelu ML MLeap

24. května 2018: Verze 2.72

Přidání dokumentace a poznámkových bloků k používání MLeap v Azure Databricks MLeap umožňuje nasadit kanály strojového učení z Apache Sparku a scikit-learn do přenosného formátu a prováděcího modulu. Podívejte se na export modelu MLeap ML.

Ještě více typů clusterů GPU

24. května 2018: Verze 2.72

Kromě typů instancí NC Azure (NC12 a NC24), které jsme přidali ve verzi 2.71, teď podporujeme řadu typů instancí NCv3 (NC6s_v3, NC12s_v3 a NC24s_v3) v clusterech Azure Databricks. Instance NC a NCv3 poskytují GPU pro výkon zpracování obrázků, analýzy textu a dalších úloh strojového učení a hlubokého učení, které jsou výpočetně náročné a vyžadují vynikající výkon.

Podívejte se na výpočetní prostředky s podporou GPU.

Buňky v poznámkovém bloku: skrýt a zobrazit

24. května 2018: Verze 2.72

Nové indikátory a zasílání zpráv usnadňují zobrazení obsahu buněk poznámkového bloku po jejich skrytí. Viz Skrýt a zobrazit obsah buňky.

22. května 2018

Vyhledávání na webu dokumentace jsme nahradili lepším vyhledávacím nástrojem. V nadcházejících týdnech uvidíte ještě více vylepšení hledání.

Poznámka:

Pokud ho zkusíte krátce po nasazení nového hledání, může vyhledávání vypadat poškozeno. Jednoduše vymažte mezipaměť prohlížeče a podívejte se na nové prostředí hledání.

Databricks Runtime 4.1 ML pro strojové učení (Beta)

17. května 2018

Databricks Runtime ML (Beta) poskytuje připravené prostředí pro strojové učení a datové vědy. Obsahuje několik oblíbených knihoven, včetně TensorFlow, Keras a XGBoost.

Databricks Runtime ML umožňuje spustit cluster Databricks se všemi knihovnami potřebnými pro distribuované trénování TensorFlow. Zajišťuje kompatibilitu knihoven zahrnutých v clusteru (mezi TensorFlow a CUDA / cuDNN, například) a podstatně snižuje čas spuštění clusteru v porovnání s použitím inicializačních skriptů.

Poznámka:

Databricks Runtime 4.1 ML je k dispozici pouze v SKU Premium.

Podívejte se na kompletní poznámky pro Databricks Runtime 4.1 ML (EoS).

Databricks Delta

17. května 2018

Databricks Delta je teď k dispozici ve verzi Private Preview pro uživatele Azure Databricks. Obraťte se na svého správce účtů nebo se zaregistrujte na adrese https://databricks.com/product/databricks-delta. Tato verze představuje kandidátské vydání v očekávání nadcházející verze GA.

Další informace najdete v tématu Databricks Runtime 4.1 (EoS) a Co je Delta Lake v Azure Databricks?.

Podpora Display() pro obrazové datové typy

17. května 2018

V Databricks Runtime 4.1 teď display() vykresluje sloupce obsahující datové typy obrázků jako formátovaný kód HTML.

Viz Vizualizace v poznámkových blocích Databricks a editoru SQL.

Typy clusterů GPU

15. května 2018: Verze 2.71

S radostí oznamujeme podporu pro typy instancí nc Azure (NC12 a NC24) v clusterech Azure Databricks. Instance NC poskytují gpu pro zpracování obrázků, analýzu textu a další úlohy strojového učení a hlubokého učení, které jsou výpočetně náročné a vyžadují vynikající výkon.

Azure Databricks také poskytuje předem nainstalované ovladače a knihovny NVIDIA nakonfigurované pro GPU spolu s materiály pro začátek s několika oblíbenými knihovnami hlubokého učení.

Viz také:

Obecná dostupnost správy tajemství

15. května 2018: Verze 2.71

Správa tajných kódů, která byla ve verzi Private Preview, je teď obecně dostupná. Poskytuje výkonné nástroje pro správu přihlašovacích údajů, které potřebujete k ověřování v externích zdrojích dat. Místo přímého zadávání přihlašovacích údajů do poznámkového bloku použijte správu tajných kódů Databricks k ukládání a odkazování na přihlašovací údaje v poznámkových blocích a úlohách. Ke správě tajemství můžete použít rozhraní příkazového řádku tajemství (starší verze) pro přístup k rozhraní API tajemství.

Poznámka:

Správa tajných kódů vyžaduje Databricks Runtime 4.0 nebo novější a Databricks CLI 0.7.1 nebo novější.

Viz Správa tajemství.

Změny koncových bodů rozhraní API a příkazů CLI pro tajné údaje

15. května 2018: Verze 2.71

V koncových bodech rozhraní API pro tajné kódy byly provedeny následující změny:

  • Pro všechny koncové body se kořenová cesta změnila z /secret na /secrets.
  • U koncového bodu tajemství byl /secret/secrets převeden do /secrets/.
  • Metoda write byla změněna na put.

Databricks CLI 0.7.1 obsahuje aktualizace příkazů tajných kódů, které odpovídají těmto aktualizovaným koncovým bodům rozhraní API.

Viz rozhraní API pro tajné kódy a správa tajných kódů.

Připnutí clusteru

15. května 2018: Verze 2.71

Teď můžete klastr připnout do seznamu klastrů. Tím můžete zachovat konfiguraci clusterů ukončených před více než 30 dny.

Cluster pinů

Kromě toho se na stránce Clustery teď zobrazují všechny clustery, které byly ukončeny do 30 dnů (zvýšeno z 7 dnů).

Viz Připnutí výpočetních prostředků.

Automatické spuštění clusteru

15. května 2018: Verze 2.71

Před touto verzí se úlohy naplánované tak, aby běžely v Terminated clusterech, selhaly. Pro clustery vytvořené v Azure Databricks ve verzi 2.71 a vyšších automatické restartování clusteru při příkazech z rozhraní JDBC/ODBC nebo při spuštění úlohy přiřazené k existujícímu ukončenému clusteru. Podívejte se na JDBC connect a Konfigurace a úprava úloh Lakeflow.

Automatický start umožňuje nakonfigurovat clustery tak, aby se automaticky zprovozněly, aniž by bylo nutné ručně provést zásah k restartování clusterů pro naplánované úlohy. Kromě toho můžete inicializaci clusteru naplánovat tak, že úlohu, která restartuje ukončené clustery v zadaném čase, zahrnete do harmonogramu.

Řízení přístupu ke clusteru se vynucuje a oprávnění vlastníka úlohy se kontrolují obvyklým způsobem.

Vyprazdňování pracovního prostoru

15. května 2018: Verze 2.71

V rámci našeho průběžného úsilí o dodržování obecného nařízení Evropské unie o ochraně osobních údajů (GDPR) jsme přidali možnost vyprázdnit objekty pracovního prostoru, jako jsou celé poznámkové bloky, jednotlivé buňky poznámkového bloku, komentáře jednotlivých poznámkových bloků a historie revizí poznámkového bloku. V nadcházejících týdnech vydáme další funkce a dokumentaci pro podporu dodržování předpisů GDPR.

Viz Vyprázdnit úložiště pracovního prostoru.

Databricks CLI 0.7.1

10. května 2018

Databricks CLI 0.7.1 obsahuje aktualizace příkazů tajných kódů, které odpovídají aktualizovaným koncovým bodům rozhraní API.

Viz starší verzi rozhraní příkazového řádku Databricks a správa tajemství.