다음을 통해 공유


Eventhouse OneLake 가용성

OneLake 가용성을 설정 하여 이벤트 하우스에서 KQL 데이터베이스 데이터의 논리적 복사본 하나를 만들 수 있습니다. OneLake 가용성을 켜면 Power BI, Warehouse, Lakehouse, Notebook 등의 Direct Lake 모드와 같은 다른 패브릭 엔진을 통해 Delta Lake 형식으로 KQL 데이터베이스의 데이터를 쿼리할 수 있습니다.

Delta Lake는 Microsoft Fabric의 모든 컴퓨팅 엔진에서 원활한 데이터 액세스를 달성하는 통합 데이터 레이크 테이블 형식입니다. Delta Lake에 대한 자세한 내용은 Delta Lake란?을 참조하세요.

이 문서에서는 OneLake에서 KQL 데이터베이스 데이터의 가용성을 설정하는 방법을 알아봅니다.

작동 방식

다음 표에서는 OneLake 가용성을 켜거나 끌 때 KQL 데이터베이스 및 테이블의 동작을 설명합니다.

켜짐 해제
KQL 데이터베이스 - 기존 테이블은 영향을 받지 않습니다. 새 테이블은 OneLake에서 사용할 수 있습니다.
- KQL 데이터베이스의 데이터 보존 정책도 OneLake의 데이터에 적용됩니다. 보존 기간이 끝날 때 KQL 데이터베이스에서 제거된 데이터도 OneLake에서 제거됩니다.
- 기존 테이블은 영향을 받지 않습니다. OneLake에서는 새 테이블을 사용할 수 없습니다.
KQL 데이터베이스의 테이블 - OneLake에서 새 데이터를 사용할 수 있습니다.
- 기존 데이터가 백필되지 않습니다.
- 데이터를 삭제, 잘리거나 제거할 수 없습니다.
- 테이블 스키마를 변경할 수 없으며 테이블 이름을 바꿀 수 없습니다.
- OneLake에서 새 데이터를 사용할 수 없습니다.
- 데이터를 삭제, 잘리거나 제거할 수 있습니다.
- 테이블 스키마를 변경할 수 있으며 테이블 이름을 바꿀 수 있습니다.
- OneLake에서 데이터가 일시 삭제됩니다.

Important

데이터가 OneLake에 표시되는 데 최대 몇 시간이 걸릴 수 있습니다. 자세한 내용은 적응 동작을 참조 하세요.

OneLake 가용성을 설정하는 데 추가 스토리지 비용은 없습니다. 자세한 내용은 리소스 사용을 참조하세요.

필수 조건

OneLake 가용성 켜기

KQL 데이터베이스 또는 테이블 수준에서 OneLake 가용성을 켤 수 있습니다.

  1. OneLake 가용성켜려면 KQL 데이터베이스 또는 테이블의 세부 정보 페이지로 이동합니다.

  2. 데이터베이스 세부 정보 창의 OneLake 가용성 옆에 있는 편집(연필) 아이콘을 선택합니다.

    OneLake 가용성 편집 옵션이 강조 표시된 데이터베이스 개요를 보여 주는 실시간 인텔리전스의 데이터베이스 세부 정보 창 스크린샷

  3. 단추를 활성으로 전환하여 기능을 켜고 완료선택합니다. 데이터베이스가 자동으로 새로 고쳐집니다.

    Microsoft Fabric의 실시간 인텔리전스에 있는 OneLake 폴더 세부 정보 창의 스크린샷 OneLake에 데이터를 노출하는 옵션이 켜져 있습니다.

KQL 데이터베이스에서 OneLake 가용성을 설정했습니다. 이제 Delta Lake 형식의 지정된 OneLake 경로에서 데이터베이스에 추가된 모든 새 데이터에 액세스할 수 있습니다. Lakehouse, Data Warehouse에서 OneLake 바로 가기를 만들거나 Power BI Direct Lake 모드를 통해 직접 데이터를 쿼리하도록 선택할 수도 있습니다.

적응형 동작

Eventhouse는 들어오는 데이터 스트림을 분석을 위해 구조화된 하나 이상의 Parquet 파일로 지능적으로 일괄 처리하는 강력한 메커니즘을 제공합니다. 데이터 스트림 일괄 처리는 세류 데이터를 처리할 때 중요합니다. 호수에 많은 작은 Parquet 파일을 쓰는 것은 비효율적일 수 있으므로 비용이 높고 성능이 저하될 수 있습니다.

최적의 Parquet 파일을 만들기에 충분한 데이터가 없는 경우 Eventhouse의 적응 메커니즘은 쓰기 작업을 최대 몇 시간 동안 지연할 수 있습니다. 이렇게 하면 Parquet 파일의 크기가 최적이고 Delta Lake 모범 사례를 준수할 수 있습니다. Eventhouse 적응 메커니즘은 Parquet 파일이 분석을 위해 준비되도록 하고 프롬프트 데이터 가용성에 대한 필요성과 비용 및 성능 고려 사항의 균형을 유지합니다.

.show 테이블 미러링 작업 명령을 사용하여 데이터 대기 시간을 확인하여 레이크에 새 데이터가 추가된 기간을 모니터링할 수 있습니다.

결과는 데이터가 마지막으로 추가된 시점부터 측정됩니다. 대기 시간이 00:00:00이 되면 KQL 데이터베이스의 모든 데이터를 OneLake에서 사용할 수 있습니다.

파일 보기

테이블에서 OneLake 가용성을 켜면 해당 JSON 및 Parquet 파일과 함께 델타 로그 폴더가 만들어집니다. 실시간 인텔리전스 내에 남아 있는 동안 OneLake 및 해당 속성에서 사용할 수 있게 된 파일을 볼 수 있습니다.

  • 파일을 보려면 탐색기 창에서 테이블을 마우스로 가리킨 다음[...]> 메뉴를 선택합니다.파일을 봅니다.

    테이블의 자세히 메뉴 드롭다운을 보여 주는 탐색기 창의 스크린샷

  • 델타 로그 폴더 또는 개별 파일의 속성을 보려면 폴더 또는 파일을 마우스로 가리킨 다음[...]> 추가 메뉴를 선택합니다.속성입니다.

  • 델타 로그 폴더의 파일을 보려면 다음을 수행합니다.

    1. _delta_log 폴더를 선택합니다.
    2. 테이블 메타데이터 및 스키마를 볼 파일을 선택합니다. 열리는 편집기는 읽기 전용 형식입니다.

미러링 정책 액세스

기본적으로 OneLake 가용성 이 켜 지면 미러링 정책이 활성화됩니다. 정책을 사용하여 데이터 대기 시간을 모니터링하거나 델타 테이블을 분할하도록 변경할 수 있습니다.

참고 항목

OneLake 가용성을 해제하면 미러링 정책의 IsEnabled 속성이 false(IsEnabled=false)로 설정됩니다.

파티션 델타 테이블

델타 테이블을 분할하여 쿼리 속도를 향상시킬 수 있습니다. OneLake 파일을 분할하는 시기에 대한 자세한 내용은 테이블을 분할하는 시기를 참조 하세요. 각 파티션은 파티션 목록에 나열된 PartitionName을 사용하여 별도의 열로 표시됩니다. 즉, OneLake 복사본에 원본 테이블보다 더 많은 열이 있습니다.

델타 테이블을 분할하려면 .alter-merge 테이블 정책 미러링 명령을 사용합니다.

  • OneLake에서 데이터를 노출하려면 OneLake에서 바로 가기 만들기를 참조 하세요.
  • 레이크 하우스에서 OneLake 바로 가기를 만들려면 레이크 하우스 의 바로 가기란?
  • KQL 데이터베이스 또는 테이블의 OneLake에서 참조된 데이터를 쿼리하려면 KQL 데이터베이스에서 OneLake 바로 가기 만들기를 참조 하세요.