Maj 2018 r.

Wydania są etapowe. Twoje konto usługi Azure Databricks może nie zostać zaktualizowane do tygodnia po początkowej dacie wydania.

Ogólne rozporządzenie o ochronie danych (RODO)

24 maja 2018 r.: Wersja 2.72

Aby spełnić wymagania ogólnego rozporządzenia o ochronie danych (RODO) Unii Europejskiej, które wchodzi w życie 25 maja 2018 r., wprowadziliśmy szereg modyfikacji platformy Azure Databricks w celu zapewnienia większej kontroli nad przechowywaniem danych zarówno na poziomie konta, jak i użytkownika. Aktualizacje obejmują:

  • Usuwanie klastra: trwałe usuwanie konfiguracji klastra przy użyciu interfejsu użytkownika lub interfejsu API klastrów. Zobacz Usuwanie obliczeń.
  • Przeczyszczanie obszaru roboczego (wydane w wersji 2.71): trwałe usuwanie obiektów obszaru roboczego, takich jak całe notesy, poszczególne komórki notesu, komentarze poszczególnych notesów i historia poprawek notesu. Zobacz Przeczyszczanie magazynu obszaru roboczego.
  • Przeczyszczanie historii poprawek notesu:
    • Trwale usuń historię poprawek wszystkich notesów w obszarze roboczym dla zdefiniowanego przedziału czasu. Zobacz Przeczyszczanie magazynu obszaru roboczego.
    • Trwałe usunięcie pojedynczej poprawki notesu lub całej historii poprawek notesu. Zobacz Historia wersji.

Aby uzyskać informacje na temat usuwania usługi Azure Databricks lub anulowania konta platformy Azure, zobacz Zarządzanie subskrypcją.

Użytkownicy usługi Azure Databricks muszą należeć do dzierżawy identyfikatora entra firmy Microsoft

24 maja 2018 r.: Wersja 2.72

Użytkownicy mogą teraz logować się do usługi Azure Databricks tylko wtedy, gdy należą do dzierżawy microsoft Entra ID (dawniej Azure Active Directory) obszaru roboczego usługi Azure Databricks. Jeśli masz użytkowników, którzy nie należą do dzierżawy microsoft Entra ID, możesz dodać ich jako użytkowników standardowych lub gości.

HorovodEstimator

29 maja 2018 r.: Wersja 2.72

Dodano dokumentację i notes dla narzędzia HorovodEstimator, interfejs API narzędzia do szacowania w stylu MLlib, który korzysta ze struktury Horovod Ubera. Narzędzie HorovodEstimator ułatwia rozproszone, wieloprocesorowe trenowanie głębokich sieci neuronowych w ramkach danych platformy Spark, upraszczając integrację etl platformy Spark z trenowaniem modelu w usłudze TensorFlow.

Eksportowanie modelu uczenia maszynowego MLeap

24 maja 2018 r.: Wersja 2.72

Dodano dokumentację i notesy dotyczące korzystania z rozwiązania MLeap w usłudze Azure Databricks. Rozwiązanie MLeap umożliwia wdrażanie potoków uczenia maszynowego z platformy Apache Spark i biblioteki scikit-learn do przenośnego aparatu formatowania i wykonywania. Zobacz Eksportowanie modelu uczenia maszynowego MLeap.

Jeszcze więcej typów klastrów GPU

24 maja 2018 r.: Wersja 2.72

Oprócz typów wystąpień nc platformy Azure (NC12 i NC24), które dodaliśmy w wersji 2.71, obsługujemy teraz serię typów wystąpień NCv3 (NC6s_v3, NC12s_v3 i NC24s_v3) w klastrach usługi Azure Databricks. Wystąpienia NC i NCv3 zapewniają procesory GPU do zasilania przetwarzania obrazów, analizy tekstu i innych zadań uczenia maszynowego i uczenia głębokiego, które są obliczeniami wymagającymi i wymagają najwyższej wydajności.

Zobacz Obliczenia z obsługą procesora GPU.

Komórki notesu: ukrywanie i pokazywanie

24 maja 2018 r.: Wersja 2.72

Nowe wskaźniki i komunikaty ułatwiają wyświetlanie zawartości komórki notesu po ich ukryciu. Zobacz Ukrywanie i pokazywanie zawartości komórki.

22 maja 2018 r.

Zastąpiliśmy nasze wyszukiwanie witryny dokument lepszym narzędziem do wyszukiwania. W najbliższych tygodniach zobaczysz jeszcze więcej ulepszeń wyszukiwania.

Uwaga

Wyszukiwanie może wyglądać na uszkodzone, jeśli spróbujesz go wkrótce po wdrożeniu nowego wyszukiwania. Wystarczy wyczyścić pamięć podręczną przeglądarki, aby zobaczyć nowe środowisko wyszukiwania.

Databricks Runtime 4.1 ML na potrzeby uczenia maszynowego (wersja beta)

17 maja 2018 r.

Środowisko Databricks Runtime ML (beta) zapewnia gotowe do użycia środowisko do uczenia maszynowego i nauki o danych. Zawiera wiele popularnych bibliotek, w tym TensorFlow, Keras i XGBoost.

Środowisko Databricks Runtime ML umożliwia uruchomienie klastra usługi Databricks ze wszystkimi bibliotekami wymaganymi do trenowania rozproszonego bibliotek TensorFlow. Zapewnia to zgodność bibliotek uwzględnionych w klastrze (na przykład między bibliotekami TensorFlow i CUDA / cuDNN) i znacznie zmniejsza czas uruchamiania klastra w porównaniu z użyciem skryptów inicjowania.

Uwaga

Środowisko Databricks Runtime 4.1 ML jest dostępne tylko w jednostce SKU Premium.

Zobacz pełne informacje o wersji dla środowiska Databricks Runtime 4.1 ML (nieobsługiwane).

Databricks Delta

17 maja 2018 r.

Funkcja delta usługi Databricks jest teraz dostępna w prywatnej wersji zapoznawczej dla użytkowników usługi Azure Databricks. Skontaktuj się z menedżerem konta lub zarejestruj się pod adresem https://databricks.com/product/databricks-delta. Ta wersja reprezentuje wydanie kandydata w oczekiwaniu na nadchodzące wydanie ogólnie dostępne.

Aby uzyskać więcej informacji, zobacz Databricks Runtime 4.1 (nieobsługiwane) i Co to jest usługa Delta Lake?.

Obsługa funkcji Display() dla typów danych obrazu

17 maja 2018 r.

W środowisku Databricks Runtime 4.1 display() teraz renderuje kolumny zawierające typy danych obrazów jako bogaty kod HTML.

Zobacz Wizualizacje w notesach usługi Databricks.

Typy klastrów GPU

15 maja 2018 r.: Wersja 2.71

Z przyjemnością ogłaszamy obsługę typów wystąpień nc platformy Azure (NC12 i NC24) w klastrach usługi Azure Databricks. Wystąpienia nc zapewniają procesory GPU do zasilania przetwarzania obrazów, analizy tekstu i innych zadań uczenia maszynowego i uczenia głębokiego, które są obliczeniami wymagającymi i wymagają najwyższej wydajności.

Usługa Azure Databricks udostępnia również wstępnie zainstalowane sterowniki i biblioteki NVIDIA skonfigurowane dla procesorów GPU oraz materiały umożliwiające rozpoczęcie pracy z kilkoma popularnymi bibliotekami uczenia głębokiego.

Zobacz też:

Zarządzanie wpisami tajnymi (ogólna dostępność)

15 maja 2018 r.: Wersja 2.71

Zarządzanie wpisami tajnymi, które było w prywatnej wersji zapoznawczej, jest teraz ogólnie dostępne. Udostępnia zaawansowane narzędzia do zarządzania poświadczeniami potrzebnymi do uwierzytelniania w zewnętrznych źródłach danych. Zamiast wpisywać poświadczenia bezpośrednio w notesie, użyj funkcji zarządzania wpisami tajnymi usługi Databricks, aby przechowywać i odwoływać się do poświadczeń w notesach i zadaniach. Aby zarządzać wpisami tajnymi, możesz użyć interfejsu wiersza polecenia wpisów tajnych (starsza wersja) w celu uzyskania dostępu do interfejsu API wpisów tajnych.

Uwaga

Zarządzanie wpisami tajnymi wymaga środowiska Databricks Runtime 4.0 lub nowszego oraz interfejsu wiersza polecenia usługi Databricks w wersji 0.7.1 lub nowszej.

Zobacz Zarządzanie wpisami tajnymi.

Zmiany dotyczące poleceń interfejsu wiersza polecenia i punktu końcowego interfejsu API wpisów tajnych

15 maja 2018 r.: Wersja 2.71

Następujące zmiany zostały wprowadzone w punktach końcowych interfejsu API wpisów tajnych:

  • Dla wszystkich punktów końcowych ścieżka główna została zmieniona z /secret na /secrets.
  • W przypadku punktu końcowego /secret/secrets wpisów tajnych element został zwinięty do /secrets/.
  • Metoda została zmieniona write na put.

Interfejs wiersza polecenia usługi Databricks 0.7.1 zawiera aktualizacje poleceń wpisy tajne w celu dostosowania ich do tych zaktualizowanych punktów końcowych interfejsu API.

Zobacz Interfejs API wpisów tajnych i zarządzanie wpisami tajnymi.

Przypinanie klastra

15 maja 2018 r.: Wersja 2.71

Teraz możesz przypiąć klaster do listy Klastry. Dzięki temu można zachować konfigurację klastrów zakończonych w ciągu 30 dni.

Przypnij klaster

Ponadto na stronie Klastry są teraz wyświetlane wszystkie klastry, które zostały zakończone w ciągu 30 dni (zwiększone z 7 dni).

Zobacz Przypinanie obliczeń.

Autostart klastra

15 maja 2018 r.: Wersja 2.71

Przed tą wersją zadania zaplanowane do uruchomienia w Terminated klastrach zakończyły się niepowodzeniem. W przypadku klastrów utworzonych w usłudze Azure Databricks w wersji 2.71 lub nowszej polecenia z interfejsu JDBC/ODBC lub uruchomienia zadania przypisanego do istniejącego zakończonego klastra automatycznie ponownie uruchomi ten klaster. Zobacz Łączenie JDBC i Tworzenie zadania.

Autostart umożliwia skonfigurowanie klastrów w celu automatycznego zterminowania bez konieczności ręcznego uruchamiania klastrów dla zaplanowanych zadań. Ponadto można zaplanować inicjowanie klastra, planując zadanie ponownego uruchamiania zakończonych klastrów w określonym czasie.

Kontrola dostępu do klastra jest wymuszana, a uprawnienia właściciela zadania są sprawdzane jak zwykle.

Przeczyszczanie obszaru roboczego

15 maja 2018 r.: Wersja 2.71

W ramach naszych ciągłych wysiłków w celu zachowania zgodności z ogólnym rozporządzeniem o ochronie danych Unii Europejskiej (RODO) dodaliśmy możliwość przeczyszczania obiektów obszarów roboczych, takich jak całe notesy, poszczególne komórki notesu, indywidualne komentarze notesów i historia poprawek notesu. W najbliższych tygodniach udostępnimy więcej funkcji i dokumentacji w celu zapewnienia zgodności z RODO.

Zobacz Przeczyszczanie magazynu obszaru roboczego.

Interfejs wiersza polecenia usługi Databricks 0.7.1

10 maja 2018 r.

Interfejs wiersza polecenia usługi Databricks w wersji 0.7.1 zawiera aktualizacje poleceń wpisy tajne w celu dopasowania do zaktualizowanych punktów końcowych interfejsu API.

Zobacz Interfejs wiersza polecenia usługi Databricks (starsza wersja) i Zarządzanie wpisami tajnymi.