Udostępnij za pośrednictwem


Zarządzanie formatem notatnika

W tym artykule opisano domyślny format notesu w usłudze Azure Databricks, sposób zmiany formatu notesu oraz zarządzanie zatwierdzeniami wyjściowymi, jeśli notes znajduje się w folderze kontrolowanym przez źródło.

Domyślnie notesy w usłudze Databricks są tworzone w formacie .ipynb (IPython lub Jupyter). Możesz również użyć formatu źródłowego.

Nadal można importować i eksportować notesy w różnych formatach. Zobacz Eksportowanie i importowanie notesów usługi Databricks.

formaty notatników

Usługa Databricks obsługuje tworzenie i edytowanie notesów w dwóch formatach: IPYNB (wartość domyślna) i źródło.

Pliki źródłowe, w tym notesy, można zarządzać przy użyciu folderów Git. W folderach Git są obsługiwane tylko niektóre typy zasobów usługi Databricks. Format ma wpływ na sposób, w jaki notesy są zatwierdzane w repozytoriach zdalnych, zgodnie z opisem w poniższej tabeli.

Format źródła notatnika Opis
źródło Podstawowy format, który przechwytuje tylko kod źródłowy z sufiksem sygnalizujący język kodu, taki jak .py, .scala, .r i .sql.
IPYNB (Jupyter) Format, który przechwytuje kod źródłowy, środowisko notesu, definicje wizualizacji, widżety i opcjonalne wyniki. Notatnik IPYNB może zawierać kod w dowolnym języku obsługiwanym przez notatniki Databricks, niezależnie od części py w .ipynb. Przy użyciu formatu IPYNB możesz opcjonalnie kontrolować dane wyjściowe notesu wraz z notesem.

Format IPYNB obsługuje również lepsze środowisko wyświetlania notesów usługi Databricks w zdalnych repozytoriach Git. Jeśli używasz usługi GitHub lub GitLab, możesz włączyć funkcje, które zapewniają ulepszone różnice notesów w żądaniach ściągnięcia, co ułatwia wyświetlanie i przeglądanie zmian w notesie.

Aby dowiedzieć się więcej na temat obsługi zaawansowanych różnic w notesach IPYNB w usłudze GitHub, zobacz Artykuł Feature Preview: Rich Jupyter Notebook Diffs (Wersja zapoznawcza funkcji: rozbudowane różnice notesów Jupyter Notebook). Aby dowiedzieć się więcej o obsłudze biblioteki GitLab dla różnic notesów IPYNB, zobacz Pliki notesów Jupyter Notebook.

Aby odróżnić notesy formatu źródłowego od zwykłych plików Python, Scala i SQL, usługa Azure Databricks dodaje komentarz "Databricks notebook source" na początku notesów Python, Scala i SQL. Ten komentarz gwarantuje, że usługa Azure Databricks poprawnie analizuje plik jako notes, a nie plik skryptu.

Zmienianie domyślnego ustawienia formatu notesu

Notatniki IPYNB są domyślnym formatem przy tworzeniu nowego notatnika na platformie Azure Databricks.

Aby zmienić domyślny format źródła usługi Azure Databricks, zaloguj się do obszaru roboczego usługi Azure Databricks, kliknij swój profil w prawym górnym rogu strony, a następnie kliknij pozycję Ustawienia i przejdź do Developer. Zmień domyślny format notatnika w ustawieniach edytora pod nagłówkiem .

Zmień domyślny format notatnika w ustawieniach programisty profilu

Konwertuj format notesu

Istniejący notes można przekonwertować na inny format za pomocą interfejsu użytkownika usługi Azure Databricks.

Aby konwertować istniejący notes na inny format:

  1. Otwórz notatnik w obszarze roboczym.

  2. Wybierz pozycję Plik z menu obszaru roboczego, wybierz pozycję Format notesu i wybierz odpowiedni format. Możesz wybrać Jupyter (.ipynb) (zalecane) lub kod źródłowy (.scala, .py, .sql, .r). Bieżący format notesu jest wyszarzony i obok niego znajduje się znacznik wyboru.

    Menu pliku obszaru roboczego, rozwinięte, pokazujące opcję formatu notesu.

Aby uzyskać więcej informacji na temat rodzajów notesów obsługiwanych w usłudze Azure Databricks, zobacz Eksportowanie i importowanie notesów usługi Databricks.

Zarządzanie zatwierdzeniami wyjściowymi notesu IPYNB

Dane wyjściowe to wyniki uruchamiania notesu na platformie usługi Databricks, w tym wyświetlanie tabel i wizualizacje. W przypadku notesów IPYNB w folderach kontrolowanych przez źródło można zarządzać tym, jak dane wyjściowe notesu są zatwierdzane w repozytorium zdalnym.

Zezwalaj na zatwierdzanie danych wyjściowych notatnika .ipynb

Dane wyjściowe można zatwierdzać tylko wtedy, gdy administrator obszaru roboczego włączył tę funkcję. Domyślnie ustawienie administracyjne folderów Git nie zezwala na .ipynb zatwierdzanie danych wyjściowych notesu. Jeśli masz uprawnienia administratora dla obszaru roboczego, możesz zmienić to ustawienie:

  1. Przejdź do Ustawienia administratora>Ustawienia obszaru roboczego w konsoli administratora usługi Azure Databricks.

  2. W obszarze foldery Git wybierz pozycję Zezwalaj folderom Git na eksportowanie danych wyjściowych IPYNB, a następnie wybierz pozycję Zezwalaj: dane wyjściowe IPYNB mogą być przełączane.

    Konsola administracyjna: zezwalaj folderom Git na eksportowanie danych wyjściowych IPYNB.

Ważny

Gdy dane wyjściowe są dołączane, konfiguracje wizualizacji i pulpitu nawigacyjnego są uwzględniane w notesach.ipynb, które tworzysz.

Kontrolowanie zatwierdzania artefaktów wyjściowych notatnika IPYNB

Po zatwierdzeniu pliku .ipynb usługa Databricks tworzy plik konfiguracji, który umożliwia kontrolowanie sposobu zatwierdzania danych wyjściowych: .databricks/commit_outputs.

  1. Jeśli masz plik notesu , ale nie masz pliku konfiguracji w repozytorium zdalnym, przejdź do okna dialogowego statusu Git .

  2. W oknie dialogowym powiadomień wybierz pozycję Utwórz plik konfiguracji commit_outputs.

    Interfejs użytkownika zatwierdzania Notebooka: przycisk Utwórz plik commit_outputs.

Możesz również wygenerować pliki konfiguracji z menu Plik. Menu plik ma opcję umożliwiającą automatyczne aktualizowanie pliku konfiguracji, w którym można określić, które dane wyjściowe są dołączane lub wykluczane dla określonego notatnika IPYNB.

  1. W menu Plik, wybierz pozycję Zatwierdź dane wyjściowe notatników.

    Edytor notatników: Zatwierdzaj status i kontrolę wyników notatników.

  2. W oknie dialogowym potwierdź wybór zatwierdzenia danych wyjściowych notesu.

    okno dialogowe zatwierdzania wyników notesów.