什么是根目录?

Azure Databricks 以前使用工作区根目录中的目录作为用于常见存储位置。 其中大部分的位置已被弃用。

/Volumes 提供对 Unity Catalog 卷中数据的基于路径的访问的别名。 请参阅创建和使用卷

  • /databricks-datasets
  • /user/hive/warehouse
  • /FileStore
  • /databricks-results
  • /databricks/init

/databricks-datasets 目录中存储的是什么?

除非工作区管理员设置的自定义工作区权限阻止访问,否则 /databricks-datasets 目录适用于所有访问模式配置。

Databricks 在此目录中提供了许多开放源代码数据集。 Databricks 提供的许多教程和演示都引用了这些数据集,但也可以使用它们来独立探索 Azure Databricks 的功能。

/user/hive/warehouse 目录中存储的是什么?

这是注册到 hive_metastore 的托管表的数据的默认位置。

/Filestore 目录中存储的是什么?

/Filestore 目录可能包含通过 Azure Databricks UI 上传的数据和库,或者所生成的绘图的图像文件。

这主要是旧行为,大多数 UI 选项现在都使用工作区文件或卷上传文件。

/databricks-results 目录中存储的是什么?

/databricks-results 存储通过下载查询的完整结果而生成的文件。

/databricks/init 目录中存储的是什么?

某些工作区可能包含此目录,该目录用于保存不应使用的旧版全局初始化脚本。 请参阅全局 init 脚本事件(旧版)