다음을 통해 공유


Google Sheets에서 Azure Databricks에 연결

중요합니다

이 기능은 공개 미리보기 단계에 있습니다.

이 페이지에서는 Google Sheets용 Databricks Connector를 사용하여 Google Sheets 에서 Azure Databricks에 연결하는 방법을 설명합니다. Databricks 커넥터는 Google Sheets 내에서 Azure Databricks 데이터를 쿼리하여 추가 분석을 사용하도록 설정합니다.

시작하기 전 주의 사항:

Azure Databricks 작업 영역에 연결

먼저 Azure Databricks 작업 영역에 연결하여 Google Sheets용 Databricks 커넥터를 사용하여 Azure Databricks에서 Google Sheets로 데이터를 가져옵니다.

  1. Google 시트에서 확장 Databricks > 커넥터 > 시작 사이드바 를 선택하여 커넥터를 엽니다.

    Google 시트에서 Databricks 커넥터 실행

  2. 로그인 대화 상자에서 Azure Databricks 작업 영역 URL을 입력합니다. 작업 영역 URL을 찾는 방법을 알아보려면 작업 영역 개체에 대한 식별자 가져오기를 참조하세요.

    • 작업 영역 URL 형식은 다음과 같습니다 adb-<workspace-id>.<random-number>.azuredatabricks.net.
  3. 로그인을 클릭합니다.

  4. 로그인하라는 대화 상자가 나타나거나 로그인 상태를 표시합니다.

  5. 로그인한 후 사용할 SQL 웨어하우스를 선택할 수 있습니다. Databricks Connector 사이드바의 데이터 탭 아래에서, 커넥터 사이드바의 오른쪽 위에 있는 원을 클릭한 후, 원하는 Databricks SQL 웨어하우스를 선택하세요. 커넥터가 선택한 SQL 웨어하우스를 시작합니다.

    Google Sheets 커넥터에서 DBSQL 웨어하우스 전환

Google 시트용 Databricks 커넥터 사용

Google Sheets용 Databricks Connector는 Unity 카탈로그에서 액세스할 수 있는 데이터에 대한 쿼리를 실행하고 데이터를 Google Sheets로 가져옵니다. 커넥터는 모든 쿼리를 가져오기로 자동으로 저장합니다. Google Sheets에서 결과를 새로 고치고, 기존 쿼리를 다시 사용하고, 데이터 원본을 추적할 수 있습니다.

데이터를 가져온 후 쿼리는 시트에 연결됩니다. 시트 이름을 변경하면 매핑이 중단됩니다. 이름 변경을 처리하는 방법에 대한 자세한 내용은 제한 사항을 참조하세요.

중요합니다

쿼리 실행은 3분 후 타임아웃됩니다. 쿼리가 이 제한을 초과하면 자동으로 취소됩니다. 큰 결과 집합의 경우 처음 1,000개의 행이 즉시 작성되고 나머지 데이터는 점진적으로 페치됩니다. 데이터 가져오기가 중단되면 부분 결과가 시트에 남아 있으며 쿼리를 다시 실행하여 지울 수 있습니다.

가져오기 방법 선택

다음 방법 중 하나를 선택하여 Azure Databricks에서 데이터를 가져옵니다.

테이블 선택

Azure Databricks의 테이블에서 데이터를 가져오려면 다음을 수행합니다.

  1. 커넥터 사이드바에서 가져오기 메서드에 대해 데이터 선택을 선택합니다.
  2. 카탈로그 아래에서 카탈로그, 스키마 및 테이블 드롭다운 메뉴를 사용하여 가져올 테이블을 검색합니다.
  3. 필요에 따라 자산 이름을 업데이트하여 이 가져오기의 이름을 변경합니다.
  4. 필요에 따라 필드 아래에서 포함하거나 제외할 열을 선택합니다.
  5. 필요에 따라 피벗 테이블로 가져올 수 있습니다.
  6. 필터를 추가하려면 필터 아래에서 + 필터 클릭합니다. 필터를 적용할 필터 유형을 선택합니다.
  7. 필요에 따라 행 제한을 확인하여 가져올 행 수에 대한 제한을 설정합니다.
  8. 고급 옵션에서 쿼리 결과를 새 시트 또는 현재 시트에 저장할지 선택합니다.
    • 현재 시트를 선택하는 경우 데이터 추가를 시작할 셀을 지정합니다.
  9. 저장 및 가져오기를 클릭하여 시트를 채웁다.

SQL 쿼리 작성

새 SQL 쿼리를 작성하려면 다음을 수행합니다.

  1. 커넥터 사이드바에서 Import 메서드에 대해 새 쿼리 만들기를 선택합니다.
  2. Databricks는 식별할 수 있도록 쿼리의 이름을 입력하는 것이 좋습니다.
  3. 카탈로그, 스키마 및 테이블을 탐색할 수 있습니다.
  4. 쿼리 텍스트에서 SQL 쿼리를 입력합니다.
  5. 필요에 따라 쿼리 매개 변수를 추가할 수 있습니다.
  6. 고급 옵션에서 쿼리 결과를 새 시트 또는 현재 시트에 저장할지 선택합니다.
    • 현재 시트를 선택하는 경우 데이터 추가를 시작할 셀을 지정합니다.
  7. 저장 및 가져오기를 클릭하여 쿼리를 실행하고 시트를 채웁다.

중요합니다

"데이터 선택"을 사용하여 Unity 카탈로그 메트릭 뷰를 가져오는 경우 Unity 카탈로그 메트릭이 피벗 데이터를 나타내기 때문에 피벗 테이블로만 가져올 수 있습니다.

쿼리 결과로 채워진 시트

쿼리 매개 변수 추가(선택 사항)

SQL 쿼리에 쿼리 매개 변수를 추가하려면 다음을 수행합니다.

  1. 쿼리에 적어도 하나 이상의 쿼리 매개 변수가 :parameter_name 형식으로 포함되어 있는지 확인하십시오. 쿼리 매개 변수에 대한 자세한 내용은 쿼리 매개 변수 작업을 참조하세요.

  2. + 매개 변수 추가를 클릭합니다.

  3. 첫 번째 상자에 매개 변수를 입력합니다. 매개 변수 이름이 쿼리 편집기에서 입력한 이름과 일치하는지 확인합니다.

  4. 시트 이름 뒤의 느낌표를 포함하여 두 번째 상자에 매개 변수 값의 시트 이름과 셀 위치를 입력합니다.

  5. 쿼리 매개 변수를 더 추가하려면 + 매개 변수 추가 를 다시 클릭합니다.

    예를 들어 다음 쿼리에는 시트:trip_distance, 셀 H1에 정의된 쿼리 매개 변수sheet_1가 포함됩니다.

    쿼리 매개 변수를 사용하여 쿼리

피벗 테이블로 가져오기(선택 사항)

데이터를 피벗 테이블로 가져오려면 다음을 수행합니다.

  1. 데이터를 가져올 때 피벗 테이블을 선택합니다.
  2. 피벗 구성에서 피벗 테이블의 행과 열 차원을 선택합니다.
  3. 집계 기준 값을 지정합니다. + 값 추가를 클릭하고 열 및 집계 메서드를 선택합니다.
  4. 필요에 따라 + 필터 추가 를 클릭하여 필터를 추가하고 필터 유형을 선택합니다.
  5. 저장 및 가져오기를 클릭하여 결과를 피벗 테이블로 가져옵니다. 가져온 피벗 테이블은 자동으로 새 시트에 추가됩니다.

Databricks 커넥터에서 피벗 테이블 구성

가져온 데이터 관리

Azure Databricks에서 가져오는 데이터를 관리하려면 다음을 수행합니다.

  1. 커넥터 사이드바에서 가져오기 탭을 선택합니다.
  2. 가져오기를 새로 고치려면 쿼리 이름 옆에 있는 새로 고침 아이콘을 클릭합니다.
  3. 가져오기가 연결된 시트를 보려면 Kebab 메뉴 아이콘을 클릭합니다.> 쿼리 이름 옆에 있는 시트로 이동합니다.
  4. 가져오기를 편집하려면 Kebab 메뉴 아이콘을 클릭합니다.> 쿼리 이름 옆에서 편집합니다.
  5. 가져오기를 삭제하려면 Kebab 메뉴 아이콘을 클릭합니다.> 쿼리 이름 옆에 삭제합니다. 이렇게 하면 Google Sheets로 가져온 데이터가 아니라 쿼리가 삭제됩니다. 가져온 데이터를 수동으로 삭제해야 합니다.

Google Sheets에서 가져온 Databricks 데이터 관리

Azure Databricks 작업 영역 변경

연결된 Azure Databricks 작업 영역을 변경하려면 다음을 수행합니다.

  1. Extensions > Databricks Connector > 작업 공간 변경을 선택합니다.
  2. 새 작업 영역 URL을 입력하고 작업 영역에 인증합니다.

의미 공유

추가 기능은 Google Sheet를 공유하는 기능에 영향을 주지 않습니다. 그러나 파일을 공유하는 방식은 받는 사람이 추가 기능을 사용하여 수행할 수 있는 작업에 영향을 줍니다.

  • 뷰어 또는 주석 처리기 역할이 있는 받는 사람은 추가 기능에 액세스할 수 없습니다.
  • 편집기 역할과 동등한 데이터 자산 액세스 권한이 있는 받는 사람은 Google 계정으로 추가 기능을 사용할 수 있습니다. 소유자와 마찬가지로 커넥터를 사용할 수 있습니다.
  • 편집기 역할과 기본 리소스에 대한 동일한 액세스 권한이 있는 받는 사람은 동일한 Azure Databricks 작업 영역에 로그인한 경우 가져오기를 새로 고칠 수 있습니다.

제한점

  • 기존 가져오기에 연결된 시트의 이름을 바꾸거나 삭제하면 가져오기를 새로 고치지 못하게 됩니다. 이 문제를 해결하려면 다음 중 하나를 수행합니다.

    • 정확히 동일한 이름으로 시트를 다시 만듭니다.
    • 원본으로 쿼리 선택을 선택하고 가져오기를 다시 사용하고 새로 저장을 클릭하여 새 가져오기를 만듭니다.
  • 두 쿼리가 동일하거나 겹치는 범위에 매핑되는 경우 추가 기능은 가장 최근에 실행된 쿼리의 결과를 표시합니다. 이렇게 하면 이전에 가져온 데이터를 덮어씁니다.