다음을 통해 공유


DBFS 루트 작업 권장 사항

Azure Databricks는 DBFS 루트 디렉터리를 일부 작업 영역 작업의 기본 위치로 사용합니다. Databricks에서는 DBFS 루트에 프로덕션 데이터 또는 민감한 정보를 저장하지 않는 것이 좋습니다. 이 문서에서는 DBFS 루트에 민감한 데이터를 실수로 노출하지 않도록 방지하기 위한 권장 사항에 중점을 둡니다.

참고 항목

Azure Databricks는 내부 DBFS라고 하는 고객 소유의 클라우드 스토리지에서 데이터 및 구성을 유지하기 위해 별도의 프라이빗 스토리지 위치를 구성합니다. 이 위치는 사용자에게 노출되지 않습니다.

Important

2023년 3월 6일부터 새 Azure Databricks 작업 영역은 DBFS 루트에 Azure Data Lake Storage Gen2 스토리지 계정을 사용합니다. 이전에 프로비전된 작업 영역은 Blob Storage를 사용합니다.

DBFS 루트에 데이터를 저장하지 않도록 사용자 교육

DBFS 루트는 작업 영역의 모든 사용자가 액세스할 수 있기 때문에 모든 사용자가 여기에 저장된 모든 데이터에 액세스할 수 있습니다. 중요한 정보를 저장할 때 이 위치를 사용하지 않도록 사용자를 교육하는 것이 중요합니다. Azure Databricks의 Hive 메타스토어에 있는 관리되는 테이블의 기본 위치는 DBFS 루트입니다. 관리되는 테이블을 만드는 최종 사용자가 DBFS 루트에 쓰기를 수행하지 않도록 하려면 Hive 메타스토어에 데이터베이스를 만들 때 외부 스토리지의 위치를 선언합니다.

Unity 카탈로그 관리되는 테이블에는 기본적으로 보안 스토리지 위치가 사용됩니다. Databricks에서는 관리되는 테이블에 대해 Unity 카탈로그를 사용하는 것이 좋습니다.

감사 로깅을 사용하여 작업 모니터링

참고 항목

DBFS 감사 이벤트에 대한 자세한 내용은 DBFS 이벤트를 참조 하세요.

고객 관리형 키를 사용하여 DBFS 루트 데이터 암호화

고객 관리형 키로 DBFS 루트 데이터를 암호화할 수 있습니다. DBFS 루트에 대한 고객 관리형 키 참조

Important

DBFS 루트를 지원하는 스토리지 계정에 대해 사용하지 않도록 설정 Storage account key access 하지 마세요. 이 설정을 사용하지 않도록 설정하면 예기치 않은 동작 및 오류가 발생합니다.