방법: Azure Cosmos DB에서 Microsoft Fabric 미러된 데이터베이스의 중첩된 데이터 쿼리(미리 보기)
Microsoft Fabric의 미러된 데이터베이스를 사용하여 Azure Cosmos DB for NoSQL에서 원본으로 사용하는 중첩된 JSON 데이터를 쿼리합니다.
Important
Azure Cosmos DB의 미러링은 현재 프리뷰로 제공됩니다. 프로덕션 워크로드는 미리 보기 중에 지원되지 않습니다. 현재는 Azure Cosmos DB for NoSQL 계정만 지원됩니다.
필수 조건
- 기존 Azure Cosmos DB API for NoSQL 계정.
- Azure 구독이 없는 경우 Azure Cosmos DB for NoSQL을 무료로 사용해 보세요.
- 기존 Azure 구독이 있는 경우 새 Azure Cosmos DB for NoSQL 계정을 만듭니다.
- 기존 Fabric 용량입니다. 기존 용량이 없는 경우 Fabric 평가판을 시작합니다.
- Azure Cosmos DB for NoSQL 계정을 Fabric 미러링에 대해 구성해야 합니다. 자세한 내용은 계정 요구 사항을 참조하세요.
팁
공개 미리 보기 중에는 백업에서 신속하게 복구할 수 있는 기존 Azure Cosmos DB 데이터의 테스트 또는 개발 복사본을 사용하는 것이 좋습니다.
원본 데이터베이스 내에 중첩된 데이터 만들기
Azure Cosmos DB for NoSQL 계정 내에서 다양한 수준의 중첩된 JSON 데이터를 포함하는 JSON 항목을 만듭니다.
Azure Portal에서 Azure Cosmos DB 계정으로 이동합니다.
리소스 메뉴에서 데이터 탐색기를 선택합니다.
+ 새 컨테이너를 사용하여 새 컨테이너를 만듭니다. 이 가이드에서는 컨테이너 이름을
TestC
로 지정합니다. 해당 데이터베이스 이름은 임의적입니다.+ 새 항목 옵션을 여러 번 사용하여 이러한 JSON 항목들을 5개 만들고 저장합니다.
{ "id": "123-abc-xyz", "name": "A 13", "country": "USA", "items": [ { "purchased": "11/23/2022", "order_id": "3432-2333-2234-3434", "item_description": "item1" }, { "purchased": "01/20/2023", "order_id": "3431-3454-1231-8080", "item_description": "item2" }, { "purchased": "02/20/2023", "order_id": "2322-2435-4354-2324", "item_description": "item3" } ] }
{ "id": "343-abc-def", "name": "B 22", "country": "USA", "items": [ { "purchased": "01/20/2023", "order_id": "2431-2322-1545-2322", "item_description": "book1" }, { "purchased": "01/21/2023", "order_id": "3498-3433-2322-2320", "item_description": "book2" }, { "purchased": "01/24/2023", "order_id": "9794-8858-7578-9899", "item_description": "book3" } ] }
{ "id": "232-abc-x43", "name": "C 13", "country": "USA", "items": [ { "purchased": "04/03/2023", "order_id": "9982-2322-4545-3546", "item_description": "clothing1" }, { "purchased": "05/20/2023", "order_id": "7989-9989-8688-3446", "item_description": "clothing2" }, { "purchased": "05/27/2023", "order_id": "9898-2322-1134-2322", "item_description": "clothing3" } ] }
{ "id": "677-abc-yuu", "name": "D 78", "country": "USA" }
{ "id": "979-abc-dfd", "name": "E 45", "country": "USA" }
미러링 설정 및 필수 구성 요소
Azure Cosmos DB for NoSQL 데이터베이스에 대한 미러링을 구성합니다. 미러링을 구성하는 방법을 잘 모르는 경우 미러된 데이터베이스 구성 자습서를 참조하세요.
Fabric 포털로 이동합니다.
Azure Cosmos DB 계정의 자격 증명을 사용하여 새 연결 및 미러된 데이터베이스를 만듭니다.
복제가 데이터의 초기 스냅샷을 완료할 때까지 기다립니다.
기본 중첩 데이터 쿼리
이제 SQL 분석 엔드포인트를 사용하여 간단한 중첩된 JSON 데이터를 처리할 수 있는 쿼리를 만듭니다.
Fabric 포털의 미러된 데이터베이스로 이동합니다.
미러된 Azure Cosmos DB에서 SQL 분석 엔드포인트로 전환합니다.
테스트 테이블의 컨텍스트 메뉴를 열고 새 SQL 쿼리를 선택합니다.
이 쿼리를 실행하여
items
으로OPENJSON
배열을 확장합니다. 이 쿼리는OUTER APPLY
를 사용하여 항목 배열이 없을 수 있는 추가 항목을 포함하도록 합니다.SELECT t.name, t.id, t.country, P.purchased, P.order_id, P.item_description FROM OrdersDB_TestC AS t OUTER APPLY OPENJSON(t.items) WITH ( purchased datetime '$.purchased', order_id varchar(100) '$.order_id', item_description varchar(200) '$.item_description' ) as P
팁
OPENJSON
의 데이터 형식을 선택할 때 문자열 형식에varchar(max)
를 사용하면 쿼리 성능이 저하될 수 있습니다. 대신n
이(가) 숫자일 수 있는varchar(n)
을(를) 사용합니다.n
가 낮을 수록 쿼리 성능이 향상될 가능성이 높습니다.CROSS APPLY
배열이 있는 항목만 표시하려면 다음 쿼리에서items
를 사용하세요.SELECT t.name, t.id, t.country, P.purchased, P.order_id, P.item_description FROM OrdersDB_TestC as t CROSS APPLY OPENJSON(t.items) WITH ( purchased datetime '$.purchased', order_id varchar(100) '$.order_id', item_description varchar(200) '$.item_description' ) as P
깊게 중첩된 데이터 만들기
이 중첩된 데이터 예제를 빌드하기 위해 깊게 중첩된 데이터 예제를 추가해 보겠습니다.
Azure Portal에서 Azure Cosmos DB 계정으로 이동합니다.
리소스 메뉴에서 데이터 탐색기를 선택합니다.
+ 새 컨테이너를 사용하여 새 컨테이너를 만듭니다. 이 가이드에서는 컨테이너 이름을
TestD
로 지정합니다. 해당 데이터베이스 이름은 임의적입니다.+ 새 항목 옵션을 여러 번 사용하여 이러한 JSON 항목을 5개 만들고 저장합니다.
{ "id": "eadca09b-e618-4090-a25d-b424a26c2361", "entityType": "Package", "packages": [ { "packageid": "fiwewsb-f342-jofd-a231-c2321", "storageTemperature": "69", "highValue": true, "items": [ { "id": "1", "name": "Item1", "properties": { "weight": "2", "isFragile": "no" } }, { "id": "2", "name": "Item2", "properties": { "weight": "4", "isFragile": "yes" } } ] }, { "packageid": "d24343-dfdw-retd-x414-f34345", "storageTemperature": "78", "highValue": false, "items": [ { "id": "3", "name": "Item3", "properties": { "weight": "12", "isFragile": "no" } }, { "id": "4", "name": "Item4", "properties": { "weight": "12", "isFragile": "no" } } ] } ], "consignment": { "consignmentId": "ae21ebc2-8cfc-4566-bf07-b71cdfb37fb2", "customer": "Humongous Insurance", "deliveryDueDate": "2020-11-08T23:38:50.875258Z" } }
깊게 중첩된 데이터 쿼리
마지막으로 JSON 문자열에 깊게 중첩된 데이터를 찾을 수 있는 T-SQL 쿼리를 만듭니다.
TestD
테이블의 컨텍스트 메뉴를 열고 새 SQL 쿼리를 다시 선택합니다.이 쿼리를 실행하여 consignment와 함께
OUTER APPLY
를 사용하여 중첩된 데이터의 모든 수준을 확장합니다.SELECT P.id, R.packageId, R.storageTemperature, R.highValue, G.id, G.name, H.weight, H.isFragile, Q.consignmentId, Q.customer, Q.deliveryDueDate FROM OrdersDB_TestD as P CROSS APPLY OPENJSON(P.packages) WITH ( packageId varchar(100) '$.packageid', storageTemperature INT '$.storageTemperature', highValue varchar(100) '$.highValue', items nvarchar(MAX) AS JSON ) as R OUTER APPLY OPENJSON (R.items) WITH ( id varchar(100) '$.id', name varchar(100) '$.name', properties nvarchar(MAX) as JSON ) as G OUTER APPLY OPENJSON(G.properties) WITH ( weight INT '$.weight', isFragile varchar(100) '$.isFragile' ) as H OUTER APPLY OPENJSON(P.consignment) WITH ( consignmentId varchar(200) '$.consignmentId', customer varchar(100) '$.customer', deliveryDueDate Date '$.deliveryDueDate' ) as Q
참고 항목
packages
를 확장할 때items
은 필요에 따라 확장할 수 있는 JSON으로 표시됩니다.items
속성에는 필요에 따라 확장할 수 있는 JSOn과 같은 하위 속성이 있습니다.마지막으로 특정 수준의 중첩을 확장할 시기를 선택하는 쿼리를 실행합니다.
SELECT P.id, R.packageId, R.storageTemperature, R.highValue, R.items, Q.consignmentId, Q.customer, Q.deliveryDueDate FROM OrdersDB_TestD as P CROSS APPLY OPENJSON(P.packages) WITH ( packageId varchar(100) '$.packageid', storageTemperature INT '$.storageTemperature', highValue varchar(100) '$.highValue', items nvarchar(MAX) AS JSON ) as R OUTER APPLY OPENJSON(P.consignment) WITH ( consignmentId varchar(200) '$.consignmentId', customer varchar(100) '$.customer', deliveryDueDate Date '$.deliveryDueDate' ) as Q
참고 항목
중첩된 수준에 대한 속성 제한은 이 T-SQL 쿼리 환경에서 적용되지 않습니다.