델타 공유(받는 사람용)를 사용하여 공유된 데이터에 액세스
이 문서에서는 델타 공유를 사용하여 공유된 데이터에 액세스하는 방법을 보여줍니다.
델타 공유 및 데이터 수신자
델타 공유는 보안 데이터 공유를 위한 개방형 표준입니다. 데이터 공급자라고 하는 Databricks 사용자는 델타 공유를 사용하여 데이터 수신자라고 하는 조직 외부의 개인 또는 그룹과 데이터를 공유할 수 있습니다.
Databricks 간 공유 및 열린 공유
데이터에 액세스하는 방법은 자신이 Databricks 사용자인지 여부와 데이터 공급자가 Databricks 간 공유 또는 열린 공유를 위해 사용자와 공유되는 데이터를 구성했는지 여부에 따라 다릅니다.
Databricks-to-Databricks 모델에서는 Unity 카탈로그에 대해 사용하도록 설정된 Databricks 작업 영역의 사용자여야 합니다. 팀의 구성원은 데이터 공급자에게 Unity 카탈로그 메타스토어에 대한 고유 식별자를 제공하고 데이터 공급자는 이를 사용하여 보안 공유 연결을 만듭니다. 공유 데이터는 작업 영역에서 액세스할 수 있게 됩니다. 필요한 경우 팀 멤버가 해당 데이터에 대한 세분화된 액세스 제어를 구성합니다.
열린 공유 모델에서 원하는 모든 도구(Databricks 포함)를 사용하여 공유 데이터에 액세스할 수 있습니다. 데이터 공급자는 보안 채널을 통해 활성화 URL을 보냅니다. 이에 따라 사용자와 공유된 데이터에 액세스할 수 있는 자격 증명 파일을 다운로드합니다.
사용 약관
공유 데이터는 Azure Databricks에서 직접 제공하는 것이 아니라 Databricks에서 실행되는 데이터 공급자가 제공합니다.
참고 항목
데이터 공급자의 공유 데이터에 데이터 수신자로 액세스함으로써 데이터 수신자는 데이터 공급자가 제공한 데이터 공유에 액세스할 수 있는 권한이 있음을 나타내며, (1) Databricks는 이러한 데이터 또는 데이터 수신자의 공유 데이터 사용에 대한 책임이 없음을 인정하고, (2) Databricks는 데이터 수신자의 공유 데이터(해당 정보와 관련하여 자격 증명 파일을 사용하여 데이터에 액세스하는 개인 또는 회사 확인 포함) 사용 및 액세스에 대한 정보를 수집할 수 있으며 해당 데이터 공급자와 공유할 수 있습니다.
사용자와 공유된 데이터에 액세스합니다.
데이터에 액세스하는 방법은 데이터 공급자가 열린 공유 프로토콜을 사용하는지 또는 Databricks-to-Databricks 공유 프로토콜을 사용하여 데이터를 공유하는지에 따라 다릅니다. Databricks 간 공유 및 열린 공유를 참조하세요.
Databricks-to-Databricks 모델에 액세스
Databricks-Databricks 모델에서:
데이터 공급자가 Databricks 작업 영역과 연결된 Unity 카탈로그 메타스토어의 고유 식별자를 찾기 위한 지침을 보내면 이를 보냅니다.
공유 식별자는 메타스토어의 클라우드, 지역 및 UUID(메타스토어의 고유 식별자)로 구성된
<cloud>:<region>:<uuid>
형식의 문자열입니다. 예들 들어aws:eu-west-1:b0c978c8-3e68-4cdf-94af-d05c120ed1ef
입니다.카탈로그 탐색기를 사용하여 공유 식별자를 얻으려면 다음을 수행합니다.
Azure Databricks 작업 영역에서 카탈로그를 클릭합니다.
카탈로그 창 위쪽에서 기어 아이콘을 클릭하고 델타 공유를 선택합니다.
또는 즐겨찾기 페이지에서 델타 공유> 버튼을 클릭합니다.
- 공유한 항목 탭에서 오른쪽 위에 있는 Databricks 공유 조직 이름을 클릭하고 공유 식별자 복사를 선택합니다.
Notebook 또는 Databricks SQL 쿼리를 사용하여 공유 식별자를 가져오려면 기본 SQL 함수
CURRENT_METASTORE
를 사용합니다. Notebook을 사용하는 경우 공유 데이터에 액세스하는 데 사용할 작업 영역의 공유 또는 단일 사용자 클러스터에서 실행해야 합니다.SELECT CURRENT_METASTORE();
데이터 공급자는 다음을 만듭니다.
- Databricks 계정의 수신자는 사용자와 데이터에 액세스할 조직의 사용자를 나타냅니다.
- 공유는 공유될 테이블, 볼륨 및 뷰의 표현입니다.
사용자와 공유된 데이터에 액세스합니다. 사용자 또는 사용자의 팀 구성원은 필요한 경우 사용자를 위해 해당 데이터에 대한 세분화된 데이터 액세스를 구성할 수 있습니다. Databricks 간 Delta Sharing을 사용하여 공유된 데이터 읽기(수신자의 경우)를 참조하세요.
열린 공유 모델에 액세스하기
열린 공유 모델에서:
데이터 공급자는 다음을 만듭니다.
- Databricks 계정의 수신자는 사용자와 데이터에 액세스할 조직의 사용자를 나타냅니다. 이 구성의 일부로 토큰 및 자격 증명 파일이 생성됩니다.
- 사용자와 공유할 테이블 및 파티션을 나타내는 공유.
데이터 공급자는 보안 채널을 통해 활성화 URL을 보냅니다. 이에 따라 사용자와 공유된 데이터에 액세스할 수 있는 자격 증명 파일을 다운로드합니다.
Important
다른 사용자와 활성화 링크를 공유하지 마세요. 자격 증명 파일은 한 번만 다운로드할 수 있습니다. 자격 증명 파일이 이미 다운로드된 후 활성화 링크를 다시 방문하면 자격 증명 파일 다운로드 단추가 사용하지 않도록 설정됩니다.
사용하기 전에 활성화 링크를 분실한 경우 데이터 공급자에게 문의하세요.
자격 증명 파일을 안전한 위치에 저장합니다.
공유 데이터에 액세스해야 하는 사용자 그룹 외부의 사용자와 자격 증명 파일을 공유하지 마세요. 조직의 다른 사용자와 공유해야 하는 경우 Databricks는 암호 관리자를 사용하는 것을 권장합니다.
공유 데이터 읽기
델타 공유를 사용하여 안전하게 공유된 데이터를 읽는 방법은 자격 증명 파일을 받았는지(열린 공유 모델) Databricks 작업 영역을 사용하고 데이터 공급자에게 공유 식별자를 제공했는지(Databricks-Databricks 모델)에 따라 달라집니다.
자격 증명 파일을 사용하여 공유 데이터 읽기(열린 공유)
델타 공유 열린 공유 프로토콜을 사용하여 데이터를 공유한 경우 다운로드한 자격 증명 파일을 사용하여 데이터 공급자의 Databricks 계정을 인증하고 공유 데이터를 읽습니다. 기본 토큰이 유효하고 공급자가 데이터를 계속 공유하는 한 액세스가 유지됩니다. 공급자는 토큰 만료 및 회전을 관리합니다. 데이터에 대한 업데이트는 거의 실시간으로 사용할 수 있습니다. 공유 데이터의 복사본을 읽고 만들 수 있지만 원본 데이터는 수정할 수 없습니다.
Azure Databricks, Apache Spark, pandas 및 Power BI에서 자격 증명 파일을 사용하여 공유 데이터에 액세스하고 읽는 방법을 알아보려면 델타 공유 열기 공유를 사용하여 공유된 데이터 읽기(받는 사람용)를 참조하세요.
Databricks 간 공유를 사용하여 공유 데이터 읽기
Databricks-to-Databricks 모델을 사용하여 데이터를 공유한 경우 공유 데이터에 액세스하는 데 자격 증명 파일이 필요하지 않습니다. Databricks는 보안 연결을 관리하고 공유 데이터는 Databricks 작업 영역에서 자동으로 검색할 수 있습니다.
Databricks 작업 영역에서 공유 데이터를 찾고 읽고 관리하는 방법을 알아보려면 Databricks-to-Databricks Delta Sharing(받는 사람용)를 사용하여 공유된 데이터 읽기를 참조하세요.
공유 데이터 사용 감사
Azure Databricks 작업 영역에 액세스할 수 있는 경우 Azure Databricks 감사 로그를 사용하여 조직에서 델타 공유를 사용하여 데이터에 액세스하는 사용자를 이해할 수 있습니다. 데이터 공유 감사 및 모니터링을 참조하세요.
다음 단계
- Azure Databricks에 대해 자세히 알아보기
- 델타 공유에 대해 자세히 알아보기
- 통합 카탈로그에 대한 자세한 정보