Azure SQL Database 미러링
패브릭 미러링을 사용하면 복잡한 ETL(변환 로드 추출)을 방지하고 기존 Azure SQL Database 자산을 Microsoft Fabric의 나머지 데이터와 통합할 수 있습니다. 기존 Azure SQL Database를 패브릭의 OneLake에 직접 지속적으로 복제할 수 있습니다. Fabric 내에서 강력한 비즈니스 인텔리전스, 인공 지능, 데이터 엔지니어링, 데이터 과학 및 데이터 공유 시나리오의 잠금을 해제할 수 있습니다.
패브릭에서 미러링용 Azure SQL Database를 구성하는 방법에 대한 자습서는 자습서: Azure SQL Database에서 Microsoft Fabric 미러된 데이터베이스 구성을 참조하세요.
패브릭에서 미러링 Azure SQL Database의 데모를 자세히 알아보고 시청하려면 다음 데이터 노출 에피소드를 시청하세요.
Fabric에서 미러링을 사용하는 이유는 무엇인가요?
Fabric의 미러링을 사용하면 여러 공급업체의 다양한 서비스를 통합할 필요가 없습니다. 대신 분석 요구 사항을 간소화하도록 설계되고 오픈 소스 Delta Lake 테이블 형식을 읽을 수 있는 Microsoft, Azure SQL Database를 비롯한 수천 개의 기술 솔루션 간의 개방성과 협업을 위해 빌드된 고도로 통합되고 엔드투엔드 사용이 쉬운 제품을 즐길 수 있습니다.
기본 제공되는 분석 환경은 무엇인가요?
미러된 데이터베이스는 Fabric 데이터 웨어하우징 웨어하우스 및 SQL 분석 엔드포인트와 구별되는 항목 입니다.
미러링에서는 패브릭 작업 영역에 다음 세 개의 항목을 만듭니다.
- 미러된 데이터베이스 항목입니다. 미러링에서는 데이터를 OneLake로 복제하고 Parquet으로 변환하는 작업을 분석 가능한 형식으로 관리합니다. 이를 통해 데이터 엔지니어링, 데이터 과학 등과 같은 다운스트림 시나리오를 사용할 수 있습니다.
- SQL 분석 엔드포인트
- 기본 의미 체계 모델
미러된 각 Azure SQL Database에는 미러링 프로세스에서 만든 델타 테이블 위에 풍부한 분석 환경을 제공하는 자동 생성된 SQL 분석 엔드포인트 가 있습니다. 읽기 전용 복사본이기 때문에 데이터 개체를 정의하고 쿼리할 수 있지만 사용자는 SQL 분석 엔드포인트에서 데이터를 조작할 수 없는 친숙한 T-SQL 명령에 액세스할 수 있습니다. SQL 분석 엔드포인트에서 다음 작업을 수행할 수 있습니다.
- Azure SQL Database에서 Delta Lake 테이블의 데이터를 참조하는 테이블을 탐색합니다.
- 코드 없는 쿼리와 뷰를 만들고 코드 줄을 작성하지 않고 데이터를 시각적으로 탐색합니다.
- SQL 뷰, 인라인 TVF(테이블 반환 함수) 및 저장 프로시저를 개발하여 T-SQL에서 의미 체계 및 비즈니스 논리를 캡슐화합니다.
- 개체 사용 권한을 관리합니다.
- 동일한 작업 영역의 다른 웨어하우스 및 Lakehouse에서 데이터를 쿼리합니다.
SQL 쿼리 편집기 외에도 SSMS(SQL Server Management Studio), Visual Studio Code를 사용한 mssql 확장, GitHub Copilot등 SQL 분석 엔드포인트를 쿼리할 수 있는 광범위한 도구 에코시스템이 있습니다.
네트워크 요구 사항
현재 미러링에서는 Azure Virtual Network 또는 프라이빗 네트워킹 뒤에 있는 Azure SQL 데이터베이스 논리 서버를 지원하지 않습니다. 프라이빗 네트워크 뒤에 Azure Database 인스턴스가 있는 경우 Azure SQL Database 미러링을 사용하도록 설정할 수 없습니다.
- 현재 공용 네트워크 액세스를 허용하도록 Azure SQL 논리 서버 방화벽 규칙을 업데이트해야 합니다.
- Azure SQL Database 논리 서버에 연결하려면 Azure 서비스 허용 옵션을 사용하도록 설정해야 합니다.
활성 트랜잭션, 워크로드 및 복제자 엔진 동작
- 활성 트랜잭션은 트랜잭션이 커밋되고 미러링된 Azure SQL 데이터베이스가 따라잡히거나 트랜잭션이 중단될 때까지 트랜잭션 로그 잘라내기를 계속 유지합니다. 트랜잭션이 오래 지속되면 트랜잭션 로그가 평소보다 많이 채워질 수 있습니다. 트랜잭션 로그가 채워지지 않도록 원본 데이터베이스 트랜잭션 로그를 모니터링해야 합니다. 자세한 내용은 장기 실행 트랜잭션 및 CDC로 인해 트랜잭션 로그가 증가하는 것을 참조하세요.
- 사용자 워크로드마다 다릅니다. 초기 스냅샷 동안 CPU 및 IOPS(초당 입력/출력 작업, 페이지를 읽기 위해) 원본 데이터베이스에 더 많은 리소스 사용량이 있을 수 있습니다. 테이블 업데이트/삭제 작업으로 인해 로그 생성이 증가할 수 있습니다. Azure SQL Database에 대한 리소스를 모니터링하는 방법에 대해 자세히 알아봅니다.
- 복제기 엔진은 각 테이블에서 변경 내용을 독립적으로 모니터링합니다. 원본 테이블에 업데이트가 없으면 복제자 엔진이 해당 테이블에 대한 기하급수적으로 증가하는 기간(최대 1시간)으로 다시 시작합니다. 일시적인 오류가 발생하여 데이터 새로 고침을 방지하는 경우에도 마찬가지입니다. 업데이트된 데이터가 검색된 후 복제자 엔진이 자동으로 일반 폴링을 다시 시작합니다.
계층 및 구매 모델 지원
소스 Azure SQL 데이터베이스는 단일 데이터베이스이거나 Elastic Pool에 있는 데이터베이스일 수 있습니다.
- vCore 구매 모델의 모든 서비스 계층이 지원됩니다.
- DTU(데이터베이스 트랜잭션 단위) 구매 모델의 경우 DTU가 100개 미만인 무료, 기본 또는 표준 서비스 계층에서 만든 데이터베이스는 지원되지 않습니다.