다음을 통해 공유


방법: Azure Cosmos DB에서 Microsoft Fabric 미러된 데이터베이스의 중첩된 데이터 쿼리(미리 보기)

Microsoft Fabric의 미러된 데이터베이스를 사용하여 Azure Cosmos DB for NoSQL에서 원본으로 사용하는 중첩된 JSON 데이터를 쿼리합니다.

Important

Azure Cosmos DB의 미러링은 현재 프리뷰로 제공됩니다. 프로덕션 워크로드는 미리 보기 중에 지원되지 않습니다. 현재는 Azure Cosmos DB for NoSQL 계정만 지원됩니다.

필수 조건

공개 미리 보기 중에는 백업에서 신속하게 복구할 수 있는 기존 Azure Cosmos DB 데이터의 테스트 또는 개발 복사본을 사용하는 것이 좋습니다.

원본 데이터베이스 내에 중첩된 데이터 만들기

Azure Cosmos DB for NoSQL 계정 내에서 다양한 수준의 중첩된 JSON 데이터를 포함하는 JSON 항목을 만듭니다.

  1. Azure Portal에서 Azure Cosmos DB 계정으로 이동합니다.

  2. 리소스 메뉴에서 데이터 탐색기를 선택합니다.

  3. + 새 컨테이너를 사용하여 새 컨테이너를 만듭니다. 이 가이드에서는 컨테이너 이름을 TestC로 지정합니다. 해당 데이터베이스 이름은 임의적입니다.

  4. + 새 항목 옵션을 여러 번 사용하여 이러한 JSON 항목들을 5개 만들고 저장합니다.

    {
      "id": "123-abc-xyz",
      "name": "A 13",
      "country": "USA",
      "items": [
        {
          "purchased": "11/23/2022",
          "order_id": "3432-2333-2234-3434",
          "item_description": "item1"
        },
        {
          "purchased": "01/20/2023",
          "order_id": "3431-3454-1231-8080",
          "item_description": "item2"
        },
        {
          "purchased": "02/20/2023",
          "order_id": "2322-2435-4354-2324",
          "item_description": "item3"
        }
      ]
    }
    
    {
      "id": "343-abc-def",
      "name": "B 22",
      "country": "USA",
      "items": [
        {
          "purchased": "01/20/2023",
          "order_id": "2431-2322-1545-2322",
          "item_description": "book1"
        },
        {
          "purchased": "01/21/2023",
          "order_id": "3498-3433-2322-2320",
          "item_description": "book2"
        },
        {
          "purchased": "01/24/2023",
          "order_id": "9794-8858-7578-9899",
          "item_description": "book3"
        }
      ]
    }
    
    {
      "id": "232-abc-x43",
      "name": "C 13",
      "country": "USA",
      "items": [
        {
          "purchased": "04/03/2023",
          "order_id": "9982-2322-4545-3546",
          "item_description": "clothing1"
        },
        {
          "purchased": "05/20/2023",
          "order_id": "7989-9989-8688-3446",
          "item_description": "clothing2"
        },
        {
          "purchased": "05/27/2023",
          "order_id": "9898-2322-1134-2322",
          "item_description": "clothing3"
        }
      ]
    }
    
    {
      "id": "677-abc-yuu",
      "name": "D 78",
      "country": "USA"
    }
    
    {
      "id": "979-abc-dfd",
      "name": "E 45",
      "country": "USA"
    }
    

미러링 설정 및 필수 구성 요소

Azure Cosmos DB for NoSQL 데이터베이스에 대한 미러링을 구성합니다. 미러링을 구성하는 방법을 잘 모르는 경우 미러된 데이터베이스 구성 자습서를 참조하세요.

  1. Fabric 포털로 이동합니다.

  2. Azure Cosmos DB 계정의 자격 증명을 사용하여 새 연결 및 미러된 데이터베이스를 만듭니다.

  3. 복제가 데이터의 초기 스냅샷을 완료할 때까지 기다립니다.

기본 중첩 데이터 쿼리

이제 SQL 분석 엔드포인트를 사용하여 간단한 중첩된 JSON 데이터를 처리할 수 있는 쿼리를 만듭니다.

  1. Fabric 포털의 미러된 데이터베이스로 이동합니다.

  2. 미러된 Azure Cosmos DB에서 SQL 분석 엔드포인트로 전환합니다.

    Fabric 포털의 항목 간에 전환할 선택기의 스크린샷.

  3. 테스트 테이블의 컨텍스트 메뉴를 열고 새 SQL 쿼리를 선택합니다.

  4. 이 쿼리를 실행하여 items으로 OPENJSON 배열을 확장합니다. 이 쿼리는 OUTER APPLY를 사용하여 항목 배열이 없을 수 있는 추가 항목을 포함하도록 합니다.

    SELECT 
        t.name, 
        t.id, 
        t.country, 
        P.purchased, 
        P.order_id, 
        P.item_description 
    FROM OrdersDB_TestC AS t
    OUTER APPLY OPENJSON(t.items) WITH
    (
        purchased datetime '$.purchased',
        order_id varchar(100) '$.order_id',
        item_description varchar(200) '$.item_description'
    ) as P
    

    OPENJSON의 데이터 형식을 선택할 때 문자열 형식에 varchar(max)를 사용하면 쿼리 성능이 저하될 수 있습니다. 대신 n이(가) 숫자일 수 있는 varchar(n)을(를) 사용합니다. n가 낮을 수록 쿼리 성능이 향상될 가능성이 높습니다.

  5. CROSS APPLY 배열이 있는 항목만 표시하려면 다음 쿼리에서 items를 사용하세요.

    SELECT
        t.name,
        t.id,
        t.country,
        P.purchased,
        P.order_id,
        P.item_description 
    FROM
        OrdersDB_TestC as t CROSS APPLY OPENJSON(t.items) WITH (
            purchased datetime '$.purchased',
            order_id varchar(100) '$.order_id',
            item_description varchar(200) '$.item_description' 
        ) as P 
    

깊게 중첩된 데이터 만들기

이 중첩된 데이터 예제를 빌드하기 위해 깊게 중첩된 데이터 예제를 추가해 보겠습니다.

  1. Azure Portal에서 Azure Cosmos DB 계정으로 이동합니다.

  2. 리소스 메뉴에서 데이터 탐색기를 선택합니다.

  3. + 새 컨테이너를 사용하여 새 컨테이너를 만듭니다. 이 가이드에서는 컨테이너 이름을 TestD로 지정합니다. 해당 데이터베이스 이름은 임의적입니다.

  4. + 새 항목 옵션을 여러 번 사용하여 이러한 JSON 항목을 5개 만들고 저장합니다.

    {
      "id": "eadca09b-e618-4090-a25d-b424a26c2361",
      "entityType": "Package",
      "packages": [
        {
          "packageid": "fiwewsb-f342-jofd-a231-c2321",
          "storageTemperature": "69",
          "highValue": true,
          "items": [
            {
              "id": "1",
              "name": "Item1",
              "properties": {
                "weight": "2",
                "isFragile": "no"
              }
            },
            {
              "id": "2",
              "name": "Item2",
              "properties": {
                "weight": "4",
                "isFragile": "yes"
              }
            }
          ]
        },
        {
          "packageid": "d24343-dfdw-retd-x414-f34345",
          "storageTemperature": "78",
          "highValue": false,
          "items": [
            {
              "id": "3",
              "name": "Item3",
              "properties": {
                "weight": "12",
                "isFragile": "no"
              }
            },
            {
              "id": "4",
              "name": "Item4",
              "properties": {
                "weight": "12",
                "isFragile": "no"
              }
            }
          ]
        }
      ],
      "consignment": {
        "consignmentId": "ae21ebc2-8cfc-4566-bf07-b71cdfb37fb2",
        "customer": "Humongous Insurance",
        "deliveryDueDate": "2020-11-08T23:38:50.875258Z"
      }
    }
    

깊게 중첩된 데이터 쿼리

마지막으로 JSON 문자열에 깊게 중첩된 데이터를 찾을 수 있는 T-SQL 쿼리를 만듭니다.

  1. TestD 테이블의 컨텍스트 메뉴를 열고 새 SQL 쿼리를 다시 선택합니다.

  2. 이 쿼리를 실행하여 consignment와 함께 OUTER APPLY를 사용하여 중첩된 데이터의 모든 수준을 확장합니다.

    SELECT
        P.id,
        R.packageId,
        R.storageTemperature,
        R.highValue,
        G.id,
        G.name,
        H.weight,
        H.isFragile,
        Q.consignmentId,
        Q.customer,
        Q.deliveryDueDate 
    FROM
        OrdersDB_TestD as P CROSS APPLY OPENJSON(P.packages) WITH ( packageId varchar(100) '$.packageid',
        storageTemperature INT '$.storageTemperature',
        highValue varchar(100) '$.highValue',
        items nvarchar(MAX) AS JSON ) as R 
    OUTER APPLY OPENJSON (R.items) WITH (
        id varchar(100) '$.id',
        name varchar(100) '$.name',
        properties nvarchar(MAX) as JSON 
    ) as G OUTER APPLY OPENJSON(G.properties) WITH  (
        weight INT '$.weight',
        isFragile varchar(100) '$.isFragile'
    ) as H OUTER APPLY OPENJSON(P.consignment) WITH  (
        consignmentId varchar(200) '$.consignmentId',
        customer varchar(100) '$.customer',
        deliveryDueDate Date '$.deliveryDueDate'
    ) as Q 
    

    참고 항목

    packages를 확장할 때 items은 필요에 따라 확장할 수 있는 JSON으로 표시됩니다. items 속성에는 필요에 따라 확장할 수 있는 JSOn과 같은 하위 속성이 있습니다.

  3. 마지막으로 특정 수준의 중첩을 확장할 시기를 선택하는 쿼리를 실행합니다.

    SELECT
        P.id,
        R.packageId,
        R.storageTemperature,
        R.highValue,
        R.items,
        Q.consignmentId,
        Q.customer,
        Q.deliveryDueDate 
    FROM
        OrdersDB_TestD as P CROSS APPLY OPENJSON(P.packages) WITH (
            packageId varchar(100) '$.packageid',
            storageTemperature INT '$.storageTemperature',
            highValue varchar(100) '$.highValue',
            items nvarchar(MAX) AS JSON
        ) as R 
    OUTER APPLY OPENJSON(P.consignment) WITH  (
        consignmentId varchar(200) '$.consignmentId',
        customer varchar(100) '$.customer',
        deliveryDueDate Date '$.deliveryDueDate'
    ) as Q 
    

    참고 항목

    중첩된 수준에 대한 속성 제한은 이 T-SQL 쿼리 환경에서 적용되지 않습니다.