OneLake란?

Microsoft OneLake는 조직 전체에 통합된 데이터 레이크입니다. 모든 Microsoft Fabric 테넌트에는 OneLake가 자동으로 포함되며 모든 분석 데이터의 단일 위치입니다. 조직 전체에서 분석 및 AI 워크로드에 대한 모든 데이터를 저장, 관리 및 관리할 수 있는 중앙 리포지토리입니다.

OneLake는 Azure Data Lake Storage 기반으로 구축되었으며 델타 Parquet 또는 Iceberg 형식으로 테이블을 저장하며, 모든 도구에서 읽을 수 있는 두 가지 개방형 표준입니다. 이 방법은 데이터가 독점 형식으로 잠기지 않음을 의미합니다.

OneLake는 다음을 제공합니다.

기본 제공 거버넌스 및 보안을 사용하여 전체 조직에 대한 통합 데이터 스토리지
중복 없이 여러 분석 엔진에서 사용할 데이터 복사본 1개
파일 탐색기, ADLS Gen2 API 및 Azure 서비스 통합을 통한 유연한 연결
기본 제공 중복성, 재해 복구 및 액세스 진단을 사용한 데이터 보호 및 모니터링

통합 데이터 스토리지

OneLake 이전에는 조직에서 여러 비즈니스 그룹에 대해 여러 레이크를 만들었기 때문에 여러 리소스를 관리하는 데 추가 오버헤드가 발생했습니다. 이러한 사일로화된 방식은 팀 간 협업을 어렵게 만들고, 데이터 프로젝트의 진행을 늦추며, 중복의 위험을 높였습니다.

OneLake는 전체 조직에 대한 중앙 데이터 액세스 지점을 제공하여 이러한 문제를 해결합니다. 모든 Fabric 테넌트는 단일 OneLake 인스턴스와 함께 제공됩니다. OneLake를 삭제하거나 여러 OneLake를 만들 수 없으며 프로비전하거나 관리할 인프라가 없습니다. 부서, 팀 및 프로젝트는 이 통합 레이크에서 데이터를 저장하거나 연결하고 각각 자체 관리자와 함께 Fabric 도메인, 하위 도메인 및 작업 영역을 사용하여 구성할 수 있습니다. 이 모델은 데이터 소유권을 유지하고 페더레이션된 거버넌스를 사용하도록 설정하는 동시에 권한 있는 사용자가 마찰 없이 데이터를 검색하고 사용할 수 있도록 합니다.

분산 소유권을 사용하여 중앙에서 관리

Fabric 데이터는 조직 및 거버넌스를 위한 다음 계층 구조에 있습니다.

테넌트: 테넌트 수준 정책은 보안, 규정 준수 및 데이터 관리를 위해 OneLake에 있는 모든 데이터를 자동으로 보호합니다.
작업 영역: 테넌트에 원하는 수의 작업 영역을 만들어 데이터를 구성할 수 있습니다. 작업 영역을 사용하면 조직의 여러 부분에서 소유권 및 액세스 정책을 배포할 수 있습니다. 각 작업 영역은 특정 지역에 연결되고 별도로 청구되는 용량의 일부입니다.
데이터 항목: 작업 영역에는 레이크하우스, 웨어하우스, 이벤트하우스 및 KQL 데이터베이스와 같은 데이터 항목이 포함됩니다. 각 항목 유형은 Spark 기반 분석, T-SQL 쿼리, 실시간 스트리밍 등과 같은 특정 워크로드를 위해 특별히 빌드됩니다.

자세한 정보는 작업 영역을 참조하세요.

OneLake 카탈로그 검색 및 관리

OneLake 카탈로그는 데이터 전문가와 비즈니스 사용자가 소유하고 있는 데이터를 검색, 관리 및 제어할 수 있는 단일 위치이며 OneLake에서 액세스할 수 있습니다.

사용자는 도메인, 작업 영역, 항목 유형, 보증 등을 기준으로 필터링하여 필요한 항목을 정확하게 찾을 수 있으며, 각 데이터 항목은 설명, 소유자, 스키마, 계보 및 사용 메트릭과 같은 메타데이터에 의해 보강됩니다.

데이터 소유자는 민감도 레이블 검사, 태그 지정, 보증 및 데이터 위치에 대한 가시성을 포함하여 데이터 품질 및 규정 준수를 개선하기 위한 인사이트 및 권장 작업을 얻을 수 있습니다.

자세한 내용은 OneLake 카탈로그를 참조하세요.

보안

OneLake의 보안 모델을 사용하면 중요한 정보를 노출하지 않고도 데이터를 광범위하게 공유할 수 있습니다. OneLake 보안 역할을 사용하여 특정 폴더, 테이블 또는 행 및 열까지 데이터 항목에 대한 세분화된 권한을 정의할 수 있습니다. 예를 들어, 영업 데이터 세트를 팀과 공유하되 Cost 열에 대한 액세스는 제한하거나, Region = "US"인 행만 파트너가 볼 수 있도록 허용할 수 있습니다. OneLake는 이러한 역할을 저장하고 모든 분석 환경에서 자동으로 적용합니다. 따라서 사용자가 데이터 세트의 일부에만 액세스할 수 있는 경우 해당 규칙은 SQL을 통해 쿼리하거나 Spark Notebook을 실행하거나 Power BI 보고서를 보는지 여부에 따라 적용됩니다. OneLake는 그들이 볼 수 있는 것만 볼 수 있도록 합니다.

보안에 대한 이러한 통합 접근 방식은 사용자가 여러 엔진에서 별도의 권한을 유지할 필요가 없다는 것을 의미합니다. 또한 원래 데이터 소유자는 데이터가 다른 사람이 소유한 레이크하우스 또는 작업 영역에 전달되더라도 항상 데이터 원본에 액세스할 수 있는 사용자를 제어합니다.

문서에 있는 것처럼 OneLake 항목에 민감도 레이블을 적용할 수 있으며, 해당 레이블은 데이터를 Excel 또는 다른 도구로 내보낸 경우에도 암호화 또는 액세스 제한을 적용합니다. 마찬가지로 DLP(데이터 손실 방지) 정책은 OneLake에서 중요한 데이터 업로드 또는 다운로드를 감지하고 잠재적인 데이터 유출을 방지하거나 경고할 수 있습니다.

자세한 내용은 OneLake에서 데이터 보안 시작을 참조하세요.

하나의 데이터 복사본

모든 Fabric 분석 엔진은 OneLake에서 직접 데이터로 작동합니다. 데이터를 복사하여 다른 엔진과 함께 사용하거나 여러 원본의 데이터를 분석할 필요가 없습니다.

바로 가기

바로 가기는 다른 파일 위치에 저장된 데이터에 대한 참조입니다. 이러한 파일 위치는 동일한 작업 영역, OneLake의 다른 작업 영역 또는 OneLake 외부에 있을 수 있습니다. OneLake, Azure Data Lake Storage, Azure Blob Storage, Amazon S3 및 S3 호환 원본, Iceberg 호환 원본, Microsoft Dataverse, 온-프레미스 원본 등에 대한 바로 가기를 사용할 수 있습니다. 위치에 관계없이 바로 가기는 파일과 폴더를 로컬로 저장한 것처럼 보이게 합니다.

바로 가기를 사용하면 조직에서 데이터를 복사하지 않고 클라우드 및 도메인 간에 데이터를 통합할 수 있습니다. 팀은 별도의 작업 영역에서 독립적으로 작업하고 바로 가기를 사용하여 데이터를 복제하는 대신 서로 공유할 수 있습니다. 예를 들어 한 팀이 다른 팀의 작업 영역 또는 외부 S3 버킷의 데이터 세트에 대한 바로 가기를 만든 다음 OneLake에서 해당 데이터를 자신의 데이터와 결합할 수 있습니다. 바로 가기는 원본을 가리키므로 원본 데이터가 업데이트되면 해당 변경 내용이 OneLake를 통해 즉시 표시됩니다. 이렇게 하면 데이터를 이동하거나 복제하지 않고 특정 필요에 맞게 여러 비즈니스 그룹의 데이터를 통합하는 가상 제품 또는 뷰를 만들 수 있습니다. 바로 가기 변환을 사용하면 데이터 형식 변환 또는 PII(개인 식별 정보) 제거와 같은 자동 변경 내용을 데이터에 적용할 수도 있습니다.

바로 가기를 사용하는 방법에 대한 자세한 내용은 OneLake 바로 가기를 참조하세요.

Mirroring

Fabric 미러링은 다양한 시스템에서 OneLake로 데이터를 지속적으로 복제하는 저비용의 대기 시간이 짧은 솔루션입니다. 외부 데이터 원본에 안전하게 연결하고 선택한 데이터베이스 또는 테이블을 OneLake의 열린 형식으로 자동으로 미러링(복사)하여 거의 실시간으로 동기화할 수 있습니다. 미러된 데이터는 OneLake에 Delta Parquet으로 저장되므로 모든 Fabric 엔진에서 즉시 분석할 준비가 됩니다.

미러링에서는 Azure SQL Database, Azure Cosmos DB, Azure Database for PostgreSQL, Azure Databricks(Unity 카탈로그), Snowflake 등의 원본을 지원합니다. 원본의 변경 사항이 지속적으로 반영되므로 OneLake 복사본이 수동 ETL 작업 없이도 최신 상태로 유지됩니다. 프로덕션 원본을 직접 쿼리하지 않고도 새 데이터에 대한 분석, AI 또는 Power BI 보고서를 실행할 수 있습니다.

자세한 내용은 Fabric 미러링이란?을(를) 참조하세요.

여러 분석 엔진에서 공동 작업

Fabric 분석 엔진(T-SQL, Apache Spark, Analysis Services 등)은 모두 개방형 Delta Parquet 형식으로 OneLake에 데이터를 저장합니다. 이 표준화를 사용하면 여러 엔진에서 동일한 데이터를 사용할 수 있습니다. 다른 엔진과 함께 사용할 때 데이터를 복사하거나, 데이터가 있는 위치 때문에 특정 엔진에 구속되지 않아도 됩니다.

예를 들어 SQL 엔지니어 팀은 완전 트랜잭션 데이터 웨어하우스를 빌드합니다. T-SQL 엔진을 사용하여 테이블을 만들고, 데이터를 변환하고, 데이터를 테이블에 로드합니다. 데이터 과학자가 이 데이터를 사용하려는 경우 Spark Notebook을 OneLake에 연결하고 해당 테이블을 직접 읽을 수 있습니다. OneLake는 테이블을 델타 형식으로 저장하므로 Spark는 특수 커넥터 또는 데이터 내보내기 없이 테이블을 로드할 수 있습니다. SQL 쿼리와 Spark 작업은 모두 OneLake의 데이터 복사본 하나에서 작동합니다.

또한 비즈니스 사용자는 Analysis Services 엔진의 Direct Lake 모드를 사용하여 OneLake 위에 Power BI 보고서를 작성할 수 있습니다. Direct Lake 모드는 복사하지 않고 대량의 데이터를 신속하게 로드하고 새로 고치는 데이터 액세스 모드입니다. 자세한 내용은 Direct Lake 개요를 참조하세요.

개방형 테이블 형식 상호 운용성

OneLake는 메타데이터 가상화를 통해 Delta Lake 및 Apache Iceberg 테이블 형식을 모두 지원합니다. 이 기능은 자동으로 가상 메타데이터를 생성하여 Fabric 워크로드에서 Iceberg 테이블을 Delta Lake 테이블로 읽을 수 있고 외부 Iceberg 판독기에서 Delta Lake 테이블을 읽을 수 있습니다. OneLake에 직접 Iceberg 테이블을 작성하거나 외부에 저장된 Iceberg 테이블에 대한 바로 가기를 만들 수 있으며 OneLake를 사용하면 수동 변환 없이 모든 Fabric 엔진에서 사용할 수 있습니다. 마찬가지로, OneLake의 모든 Delta Lake 테이블은 Snowflake와 같은 Iceberg 호환 서비스에서 액세스할 수 있습니다.

자세한 내용은 OneLake와 함께 Iceberg 테이블 사용하기을 참조하세요.

OneLake에 연결

Fabric 포털, Windows, 기존 Azure 도구 또는 ADLS Gen2 API를 지원하는 애플리케이션에서 OneLake 데이터에 액세스할 수 있습니다.

Windows용 OneLake 파일 탐색기

Windows OneLake 파일 탐색기를 사용하여 Windows OneLake 데이터를 탐색할 수 있습니다. Office에서와 마찬가지로 모든 작업 영역과 데이터 항목을 탐색하여 파일을 쉽게 업로드, 다운로드 또는 수정할 수 있습니다. OneLake 파일 탐색기는 데이터 레이크 작업을 간소화하므로 비기술적인 비즈니스 사용자도 이를 사용할 수 있습니다.

자세한 내용은 OneLake 파일 탐색기를 참조하세요.

ADLS Gen2 API 및 SDK

OneLake는 기존 ADLS Gen2 애플리케이션을 사용할 수 있도록 ADLS(Azure Data Lake Storage) Gen2 API 및 SDK를 지원합니다. 모든 작업 영역은 컨테이너로 표시되고 데이터 항목은 해당 컨테이너 내의 폴더로 표시됩니다. 자세한 내용은 OneLake 액세스 및 API를 참조하세요.

OneLake는 ADLS Gen2 애플리케이션과 호환되므로 Azure 서비스에서 OneLake에 연결할 수 있습니다. 다음은 그 예입니다.

데이터 보호 및 모니터링

OneLake에는 데이터를 안전하게 유지하고 사용 방법을 파악할 수 있는 기본 제공 기능이 포함되어 있습니다.

재해 복구 및 데이터 보호

OneLake는 기본 제공되는 중복 저장 기능을 통해 데이터를 자동으로 보호합니다. 가용성 영역을 지원하는 지역에서 OneLake는 ZRS(영역 중복 스토리지)를 사용하여 여러 데이터 센터에서 데이터를 복제합니다. 다른 지역에서는 LRS(로컬 중복 스토리지)를 사용합니다. 리전 전체 장애에 대한 추가 보호를 위해 용량에 대해 BCDR(비즈니스 연속성 및 재해 복구)을 사용하도록 설정하여 데이터를 페어링된 Azure 지역에 지역 간 복제할 수 있습니다. OneLake는 실수로 삭제된 파일을 복구할 수 있도록 삭제된 파일을 7일 동안 유지하는 일시 삭제도 지원합니다.

자세한 내용은 OneLake에 대한 재해 복구 및 데이터 보호를 참조하세요.

진단

OneLake 진단은 Fabric 환경에서 데이터에 액세스하고 사용하는 방법에 대한 가시성을 제공합니다. 작업 영역 수준에서 진단을 사용하도록 설정하면 데이터 액세스 이벤트가 로그로 레이크하우스에 스트리밍됩니다. 누가 어떤 데이터에 액세스했는지, 언제, 어떻게 액세스했는지 추적할 수 있습니다. 이 로깅에는 Fabric UI의 사용자 작업, API 및 분석 엔진을 통한 프로그래밍 방식 액세스, 바로 가기를 통한 작업 영역 간 액세스가 포함됩니다.

자세한 내용은 OneLake 진단을 참조하세요.

피드백

이 페이지가 도움이 되었나요?

Last updated on 2026-06-24