DBFS란?
DBFS라는 용어는 플랫폼의 두 부분을 설명하는 데 사용됩니다.
- DBFS 루트
- DBFS 탑재
DBFS 루트 또는 DBFS 탑재를 사용하여 데이터를 저장하고 액세스하는 것은 사용되지 않는 패턴이며 Databricks에서 권장하지 않습니다. 파일 작업에 대한 권장 사항은 Azure Databricks의 파일 작업을 참조 하세요.
Databricks 파일 시스템이란?
DBFS라는 용어는 Azure Databricks가 클라우드 기반 스토리지와 상호 작용하는 데 사용하는 분산 파일 시스템을 설명하는 Databricks 파일 시스템에서 유래되었습니다.
DBFS와 연결된 기본 기술은 여전히 Azure Databricks 플랫폼의 일부입니다. 예를 들어 dbfs:/
Unity 카탈로그 볼륨과 상호 작용할 때 선택적 체계입니다.
DBFS에 대한 과거 및 현재 경고 및 주의 사항은 DBFS 루트 또는 DBFS 탑재에만 적용됩니다.
DBFS는 Unity 카탈로그에서 어떻게 작동하나요?
Databricks는 Unity 카탈로그를 사용하여 모든 데이터에 대한 액세스를 관리하는 것이 좋습니다.
Unity 카탈로그는 조직이 클라우드 개체 스토리지의 데이터에 대한 최소 권한 액세스를 제공할 수 있도록 외부 위치, 스토리지 자격 증명 및 볼륨의 개념을 추가합니다.
일부 보안 구성은 주로 마이그레이션을 완료하거나 부분적으로 Unity 카탈로그로 마이그레이션한 조직을 위해 Unity 카탈로그 관리 리소스 및 DBFS에 직접 액세스할 수 있도록 합니다. DBFS 및 Unity 카탈로그에 대한 모범 사례를 참조하세요.
DBFS 루트란?
DBFS 루트는 Azure Databricks 작업 영역을 포함하는 클라우드 계정에서 작업 영역을 만드는 동안 프로비전된 스토리지 위치입니다. DBFS 루트 구성 및 배포에 대한 자세한 내용은 Azure Databricks 빠른 시작을 참조하세요.
Databricks는 프로덕션 데이터, 라이브러리 또는 스크립트를 DBFS 루트에 저장하지 않는 것이 좋습니다. DBFS 루트 작업에 대한 권장 사항을 참조하세요.
DBFS 루트를 포함하는 스토리지 계정에 대한 고객 관리형 키를 구성하려면 DBFS 루트에 대한 고객 관리형 키를 참조하세요.
DBFS 루트를 포함하는 스토리지 계정에 대한 네트워크 액세스를 제한하려면 작업 영역 스토리지 계정에 대한 방화벽 지원 사용을 참조하세요.
개체 스토리지 탑재
참고 항목
DBFS 탑재는 더 이상 사용되지 않습니다. Databricks는 Unity 카탈로그 볼륨을 사용하는 것이 좋습니다. Unity 카탈로그 볼륨이란?을 참조하세요.
개체 스토리지를 DBFS에 탑재하면 마치 로컬 파일 시스템에 있는 것처럼 개체 스토리지의 개체에 액세스할 수 있습니다. 탑재는 스토리지에 액세스하는 데 필요한 Hadoop 구성을 저장합니다. 자세한 내용은 Azure Databricks에 클라우드 개체 스토리지 탑재를 참조하세요.