Uwaga
Dostęp do tej strony wymaga autoryzacji. Może spróbować zalogować się lub zmienić katalogi.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
W tym artykule opisano domyślny format notesu w usłudze Azure Databricks, sposób zmiany formatu notesu oraz zarządzanie zatwierdzeniami wyjściowymi, jeśli notes znajduje się w folderze kontrolowanym przez źródło.
Domyślnie notesy w usłudze Databricks są tworzone w formacie .ipynb
(IPython lub Jupyter). Możesz również użyć formatu źródłowego.
Nadal można importować i eksportować notesy w różnych formatach. Zobacz Eksportowanie i importowanie notesów usługi Databricks.
formaty notatników
Usługa Databricks obsługuje tworzenie i edytowanie notesów w dwóch formatach: IPYNB (wartość domyślna) i źródło.
Pliki źródłowe, w tym notesy, można zarządzać przy użyciu folderów Git. W folderach Git są obsługiwane tylko niektóre typy zasobów usługi Databricks. Format ma wpływ na sposób, w jaki notesy są zatwierdzane w repozytoriach zdalnych, zgodnie z opisem w poniższej tabeli.
Format źródła notatnika | Opis |
---|---|
źródło | Podstawowy format, który przechwytuje tylko kod źródłowy z sufiksem sygnalizujący język kodu, taki jak .py , .scala , .r i .sql . |
IPYNB (Jupyter) | Format, który przechwytuje kod źródłowy, środowisko notesu, definicje wizualizacji, widżety i opcjonalne wyniki. Notatnik IPYNB może zawierać kod w dowolnym języku obsługiwanym przez notatniki Databricks, niezależnie od części py w .ipynb . Przy użyciu formatu IPYNB możesz opcjonalnie kontrolować dane wyjściowe notesu wraz z notesem. |
Format IPYNB obsługuje również lepsze środowisko wyświetlania notesów usługi Databricks w zdalnych repozytoriach Git. Jeśli używasz usługi GitHub lub GitLab, możesz włączyć funkcje, które zapewniają ulepszone różnice notesów w żądaniach ściągnięcia, co ułatwia wyświetlanie i przeglądanie zmian w notesie.
Aby dowiedzieć się więcej na temat obsługi zaawansowanych różnic w notesach IPYNB w usłudze GitHub, zobacz Artykuł Feature Preview: Rich Jupyter Notebook Diffs (Wersja zapoznawcza funkcji: rozbudowane różnice notesów Jupyter Notebook). Aby dowiedzieć się więcej o obsłudze biblioteki GitLab dla różnic notesów IPYNB, zobacz Pliki notesów Jupyter Notebook.
Aby odróżnić notesy formatu źródłowego od zwykłych plików Python, Scala i SQL, usługa Azure Databricks dodaje komentarz "Databricks notebook source
" na początku notesów Python, Scala i SQL. Ten komentarz gwarantuje, że usługa Azure Databricks poprawnie analizuje plik jako notes, a nie plik skryptu.
Zmienianie domyślnego ustawienia formatu notesu
Notatniki IPYNB są domyślnym formatem przy tworzeniu nowego notatnika na platformie Azure Databricks.
Aby zmienić domyślny format źródła usługi Azure Databricks, zaloguj się do obszaru roboczego usługi Azure Databricks, kliknij swój profil w prawym górnym rogu strony, a następnie kliknij pozycję Ustawienia i przejdź do Developer. Zmień domyślny format notatnika w ustawieniach edytora pod nagłówkiem .
Konwertuj format notesu
Istniejący notes można przekonwertować na inny format za pomocą interfejsu użytkownika usługi Azure Databricks.
Aby konwertować istniejący notes na inny format:
Otwórz notatnik w obszarze roboczym.
Wybierz pozycję Plik z menu obszaru roboczego, wybierz pozycję Format notesu i wybierz odpowiedni format. Możesz wybrać Jupyter (.ipynb) (zalecane) lub kod źródłowy (.scala, .py, .sql, .r). Bieżący format notesu jest wyszarzony i obok niego znajduje się znacznik wyboru.
Aby uzyskać więcej informacji na temat rodzajów notesów obsługiwanych w usłudze Azure Databricks, zobacz Eksportowanie i importowanie notesów usługi Databricks.
Zarządzanie zatwierdzeniami wyjściowymi notesu IPYNB
Dane wyjściowe to wyniki uruchamiania notesu na platformie usługi Databricks, w tym wyświetlanie tabel i wizualizacje. W przypadku notesów IPYNB w folderach kontrolowanych przez źródło można zarządzać tym, jak dane wyjściowe notesu są zatwierdzane w repozytorium zdalnym.
Zezwalaj na zatwierdzanie danych wyjściowych notatnika .ipynb
Dane wyjściowe można zatwierdzać tylko wtedy, gdy administrator obszaru roboczego włączył tę funkcję. Domyślnie ustawienie administracyjne folderów Git nie zezwala na .ipynb
zatwierdzanie danych wyjściowych notesu. Jeśli masz uprawnienia administratora dla obszaru roboczego, możesz zmienić to ustawienie:
Przejdź do Ustawienia administratora>Ustawienia obszaru roboczego w konsoli administratora usługi Azure Databricks.
W obszarze foldery Git wybierz pozycję Zezwalaj folderom Git na eksportowanie danych wyjściowych IPYNB, a następnie wybierz pozycję Zezwalaj: dane wyjściowe IPYNB mogą być przełączane.
Ważny
Gdy dane wyjściowe są dołączane, konfiguracje wizualizacji i pulpitu nawigacyjnego są uwzględniane w notesach.ipynb
, które tworzysz.
Kontrolowanie zatwierdzania artefaktów wyjściowych notatnika IPYNB
Po zatwierdzeniu pliku .ipynb
usługa Databricks tworzy plik konfiguracji, który umożliwia kontrolowanie sposobu zatwierdzania danych wyjściowych: .databricks/commit_outputs
.
Jeśli masz plik notesu
, ale nie masz pliku konfiguracji w repozytorium zdalnym, przejdź do okna dialogowego statusu Git . W oknie dialogowym powiadomień wybierz pozycję Utwórz plik konfiguracji commit_outputs.
Możesz również wygenerować pliki konfiguracji z menu Plik. Menu plik
W menu Plik, wybierz pozycję Zatwierdź dane wyjściowe notatników.
W oknie dialogowym potwierdź wybór zatwierdzenia danych wyjściowych notesu.