Luty 2019 r.

Te funkcje i ulepszenia platformy Azure Databricks zostały wydane w lutym 2019 r.

Uwaga

Wydania są etapowe. Twoje konto usługi Azure Databricks może nie zostać zaktualizowane do tygodnia po początkowej dacie wydania.

Usługa Databricks Light jest ogólnie dostępna

26 lutego — 5 marca 2019 r.: Wersja 2.92

Usługa Databricks Light (znana również jako inżynierowie danych ing Light) jest teraz dostępna. Databricks Light to opakowanie usługi Databricks środowiska uruchomieniowego apache Spark typu open source. Zapewnia ona opcję środowiska uruchomieniowego dla zadań, które nie wymagają zaawansowanej wydajności, niezawodności ani skalowania automatycznego korzyści zapewnianych przez środowisko Databricks Runtime. Możesz wybrać usługę Databricks Light tylko wtedy, gdy tworzysz klaster do uruchamiania zadania JAR, Python lub spark-submit . Nie można wybrać tego środowiska uruchomieniowego dla klastrów, na których uruchamiasz obciążenia zadań interakcyjnych lub notesów. Zobacz Databricks Light.

Zarządzana platforma MLflow w usłudze Azure Databricks jest w publicznej wersji zapoznawczej

26 lutego — 5 marca 2019 r.: Wersja 2.92

MLflow to platforma typu „open source” umożliwiająca zarządzanie całym cyklem życia uczenia maszynowego. Zajmuje się ona trzema podstawowymi funkcjami:

  • Śledzenie eksperymentów w celu rejestrowania i porównywania parametrów i wyników.
  • Zarządzanie i wdrażanie modeli z różnych bibliotek uczenia maszynowego do różnych platform obsługujących i wnioskowania.
  • Pakowanie kodu ML w postaci wielokrotnego użytku, powtarzalnej w celu udostępnienia innym analitykom danych lub przeniesieniu do środowiska produkcyjnego.

Usługa Azure Databricks udostępnia teraz w pełni zarządzaną i hostowaną wersję rozwiązania MLflow zintegrowaną z funkcjami zabezpieczeń przedsiębiorstwa, wysoką dostępnością i innymi funkcjami obszaru roboczego usługi Azure Databricks, takimi jak zarządzanie eksperymentami, zarządzanie uruchamianiem i przechwytywanie poprawek notesu. Platforma MLflow w usłudze Azure Databricks oferuje zintegrowane środowisko śledzenia i zabezpieczania przebiegów trenowania modeli uczenia maszynowego i uruchamiania projektów uczenia maszynowego. Korzystając z zarządzanego rozwiązania MLflow w usłudze Azure Databricks, uzyskujesz zalety obu platform, w tym:

  • Obszary robocze: wspólnie śledź i organizuj eksperymenty i wyniki w obszarach roboczych usługi Azure Databricks przy użyciu hostowanego serwera śledzenia MLflow i zintegrowanego interfejsu użytkownika eksperymentu. W przypadku korzystania z biblioteki MLflow w notesach usługa Azure Databricks automatycznie przechwytuje poprawki notesu, dzięki czemu można odtworzyć ten sam kod i uruchamiać je później.
  • Zabezpieczenia: skorzystaj z jednego wspólnego modelu zabezpieczeń dla całego cyklu życia uczenia maszynowego za pośrednictwem list ACL.
  • Zadania: uruchom projekty MLflow jako zadania usługi Azure Databricks zdalnie i bezpośrednio z notesów usługi Azure Databricks.

Oto pokaz przepływu pracy śledzenia w obszarze roboczym usługi Azure Databricks:

Track runs and organize experiment workflow

Aby uzyskać szczegółowe informacje, zobacz Śledzenie przebiegów trenowania uczenia maszynowego i uczenia głębokiego oraz Uruchamianie projektów MLflow w usłudze Azure Databricks.

Łącznik usługi Azure Data Lake Storage Gen2 jest już ogólnie dostępny

15 lutego 2019 r.

Usługa Azure Data Lake Storage Gen2 (ADLS Gen2 ), rozwiązanie typu data lake nowej generacji na potrzeby analizy danych big data, jest teraz ogólnie dostępne, podobnie jak łącznik usługi ADLS Gen2 dla usługi Azure Databricks. Z przyjemnością informujemy również, że usługa ADLS Gen2 obsługuje funkcję delta usługi Databricks podczas uruchamiania klastrów w środowisku Databricks Runtime 5.2 lub nowszym.

Język Python 3 jest teraz domyślny podczas tworzenia klastrów

12-19 lutego 2019 r.: Wersja 2.91

Domyślna wersja języka Python dla klastrów utworzonych przy użyciu interfejsu użytkownika została przełączona z języka Python 2 do języka Python 3. Domyślnym ustawieniem klastrów utworzonych przy użyciu interfejsu API REST jest nadal język Python 2.

Istniejące klastry nie zmienią ich wersji języka Python. Jeśli jednak używasz domyślnego ustawienia języka Python 2 podczas tworzenia nowych klastrów, musisz zacząć zwracać uwagę na wybór wersji języka Python.

Default Python version

Usługa Delta Lake jest teraz ogólnie dostępna

1 lutego 2019 r.

Teraz każdy może uzyskać korzyści z wydajnej transakcyjnej warstwy magazynowania usługi Databricks delta i super-szybkich operacji odczytu: od 1 lutego usługa Delta Lake jest ogólnie dostępna i dostępna we wszystkich obsługiwanych wersjach środowiska Databricks Runtime. Aby uzyskać informacje o funkcji Delta, zobacz Co to jest usługa Delta Lake?.