Jakie są katalogi główne?

Usługa Azure Databricks historycznie używała katalogów w katalogu głównym obszaru roboczego dla typowych lokalizacji magazynu. Większość z tych lokalizacji jest przestarzała.

/Volumes Udostępnia alias dostępu opartego na ścieżkach do danych w woluminach wykazu aparatu Unity. Zobacz Tworzenie woluminów i praca z nimi.

  • /databricks-datasets
  • /user/hive/warehouse
  • /FileStore
  • /databricks-results
  • /databricks/init

Co jest przechowywane w /databricks-datasets katalogu?

Katalog /databricks-datasets jest dostępny we wszystkich konfiguracjach trybu dostępu, chyba że niestandardowe uprawnienia obszaru roboczego ustawione przez administratorów obszaru roboczego uniemożliwiają dostęp.

Usługa Databricks udostępnia wiele zestawów danych typu open source w tym katalogu. Wiele samouczków i pokazów udostępnianych przez usługę Databricks odwołuje się do tych zestawów danych, ale można ich również używać do niedepedentnego eksplorowania funkcji usługi Azure Databricks.

Co jest przechowywane w /user/hive/warehouse katalogu?

Jest to domyślna lokalizacja danych dla tabel zarządzanych zarejestrowanych w obiekcie hive_metastore.

Co jest przechowywane w /Filestore katalogu?

Katalog /Filestore może zawierać dane i biblioteki przekazane za pośrednictwem interfejsu użytkownika usługi Azure Databricks lub plików obrazów dla wygenerowanych wykresów.

Jest to przede wszystkim starsze zachowanie, a większość opcji interfejsu użytkownika teraz przekazuje pliki przy użyciu plików obszaru roboczego lub woluminów.

Co jest przechowywane w /databricks-results katalogu?

/databricks-results przechowuje pliki generowane przez pobranie pełnych wyników zapytania.

Co jest przechowywane w /databricks/init katalogu?

Niektóre obszary robocze mogą zawierać ten katalog, który był używany do przechowywania starszych globalnych skryptów inicjowania, które nie powinny być używane. Zobacz Globalne skrypty inicjowania (starsza wersja).