다음을 통해 공유


AI/BI Genie 공간란?

이 페이지에서는 비즈니스 팀이 자연어를 사용하여 데이터와 상호 작용할 수 있는 Azure Databricks 기능인 AI/BI Genie를 소개합니다. 사용자 피드백을 통해 성능을 모니터링하고 구체화하는 기능을 통해 조직의 용어 및 데이터에 맞게 조정된 생성 AI를 사용합니다.

개요

데이터 분석가와 같은 분야 전문가는 Genie가 비즈니스 질문을 분석 쿼리로 변환하는 데 도움이 되도록 데이터 세트, 샘플 쿼리 및 텍스트 지침을 사용하여 Genie 공간을 구성합니다. 설정 후 비즈니스 사용자는 질문을 하고 시각화를 생성하여 운영 데이터를 이해할 수 있습니다. 데이터가 변경되고 사용자가 새로운 질문을 제기함에 따라 Genie의 의미 체계 지식을 지속적으로 업데이트할 수 있습니다. Databricks AI 기반 기능에 대한 자세한 내용은 Databricks AI 기반 기능을 참조하세요.

AI/BI Genie는 주석이 추가된 테이블 및 열에서 관련 이름과 설명을 선택하여 자연어 질문을 동등한 SQL 쿼리로 변환합니다. 그런 다음 가능한 경우 생성된 쿼리 및 결과 테이블로 응답합니다. Genie가 답변을 생성할 수 없는 경우 응답을 제공하기 전에 추가 질문을 통해 명확히 설명할 수 있습니다.

사용 사례 예

다양한 비기술 대상 그룹을 지원하기 위해 다양한 Genie 공간을 만들 수 있습니다. 다음 시나리오에서는 두 가지 가능한 사용 사례를 설명합니다.

예제 1: 기회 상태 시각화

영업 관리자는 영업 파이프라인의 스테이지별로 열려 있고 닫힌 기회의 현재 상태를 확인하려고 합니다. 자연어를 사용하여 지니 공간과 상호 작용하고 시각화를 자동으로 생성할 수 있습니다.

다음 gif는 이 상호 작용을 보여줍니다.

샘플 질문, 응답 및 자동 생성된 시각화가 포함된 Gif

예제 2: 물류 추적

물류 회사는 Genie 공간을 사용하여 여러 부서의 비즈니스 사용자가 운영 및 재무 세부 정보를 추적할 수 있도록 돕고자 합니다. 그들은 선적 시설 관리자가 배송을 추적할 수 있는 지니 공간을 마련하고 재무 경영진이 재무 상태를 이해할 수 있도록 또 다른 공간을 마련했습니다.

어떤 데이터를 사용해야 하나요?

Genie 공간은 관리되는 테이블, 외부 테이블, 외장 테이블, 뷰, 메트릭 뷰 및 구체화된 뷰를 포함하여 Unity 카탈로그에 등록된 데이터를 기반으로 합니다. AI/BI Genie는 Unity 카탈로그 개체에 연결된 메타데이터와 저자가 큐레이팅한 공간 수준 지식 저장소를 사용하여 응답을 생성합니다. 사용자가 제공하는 특정 지침과 연결된 잘 주석이 추가된 데이터 세트는 최종 사용자에게 긍정적인 환경을 만드는 데 핵심적인 요소입니다.

파일 업로드

중요합니다

이 기능은 공개 미리 보기로 제공됩니다.

파일 업로드를 통해 사용자는 로컬 CSV 및 Excel 파일을 Unity 카탈로그 데이터와 혼합하여 질문에 대답할 수 있습니다. 파일 업로드를 사용하도록 설정하려면 Databricks 계정 팀에 문의하세요. 자세한 내용은 파일 업로드를 참조하세요.

Genie 작동 방식

Genie는 복합 AI 시스템을 사용하여 비즈니스 질문을 해석하고 답변을 생성합니다. 복합 AI 시스템은 단일 큰 언어 모델을 사용하는 대신 여러 상호 작용 구성 요소를 결합하여 AI 애플리케이션에서 작업을 처리합니다. 복합 AI 시스템은 성능과 유연성 때문에 AI 애플리케이션에 점점 더 일반적인 디자인 패턴입니다. 자세한 내용은 모델에서 복합 AI 시스템으로의 전환을 참조하세요.

지니의 지식 저장소란?

Genie 작성자는 Genie 공간의 데이터 자산에 회사 및 공간별 메타데이터를 직접 추가할 수 있습니다. 여기에는 테이블 및 열 메타데이터 설명, 열 수준 동의어, 샘플링된 값 및 값 사전이 포함되며, Genie는 답변을 생성할 때 참조합니다. 자세한 메타데이터 계층은 Genie가 올바른 정보를 검색하고 보다 정확한 결과를 생성하는 데 도움이 됩니다.

Genie는 어떻게 응답을 생성하나요?

사용자가 질문을 제출하면 Genie는 요청을 구문 분석하고 관련 데이터 원본을 식별하며 프롬프트에 응답하는 방법을 결정합니다. 작성자가 제공하는 세부 정보는 Unity 카탈로그 메타데이터와 결합되어 Genie가 비즈니스 논리와 기술 논리를 모두 유추할 수 있도록 합니다. Genie는 예제 SQL 쿼리, 테이블 및 열 메타데이터 및 채팅 기록을 지능적으로 필터링하여 요청에 응답하기 위한 가장 관련성이 높은 정보를 선택합니다.

Genie는 다음 구성 요소를 사용하여 응답을 생성합니다.

  • Unity 카탈로그 테이블 메타데이터: 테이블 이름, 설명 및 정의된 PK(기본 키) 및 FK(외래 키) 관계가 포함됩니다. Genie는 요청을 구문 분석하고 자연어 프롬프트를 SQL로 변환할 때 이 데이터를 사용합니다.
  • 열 이름 및 설명: Genie는 포함할 관련 열 이름 및 설명을 지능적으로 필터링합니다.
  • 지식 저장소 컨텍스트: 작성자는 지니 공간에서 사용되는 자산에 대한 테이블 메타데이터를 로컬로 편집할 수 있습니다. 이를 통해 Genie는 보다 정확한 응답을 생성하고 기존 Unity 카탈로그 메타데이터를 변경하지 않습니다. AI/BI Genie 공간 설정 및 관리를 참조하세요.
  • 예제 SQL 쿼리: Genie는 SQL 쿼리에서 관련 SQL 예제를 지능적으로 선택합니다.
  • SQL 함수: 공간에 추가된 모든 SQL 함수입니다.
  • 지침: 일반 지침으로 제공되는 일반 텍스트 노트가 컨텍스트로 포함됩니다.
  • 프롬프트 및 응답 기록: 현재 채팅의 프롬프트 및 응답이 컨텍스트로 포함됩니다. 필요한 경우 설정된 토큰 제한으로 인해 채팅 레코드의 가장 오래된 부분이 제외됩니다.

참고

소유자 및 테이블 크기와 같은 일부 테이블 세부 정보는 기본적으로 포함되지 않습니다. 이 정보에 액세스하려면 모든 Unity 카탈로그의 정보 스키마에서 보기를 사용합니다. 기본 보기에는 불필요한 세부 정보가 포함될 수 있으므로 그 위에 사용자 지정 보기를 만들면 필요한 특정 정보에 집중하는 데 도움이 될 수 있습니다. 정보 스키마에서 사용할 수 있는 항목에 대한 자세한 내용은 정보 스키마를 참조하세요.

대부분의 경우 Genie는 공간의 SQL 웨어하우스에서 실행되는 SQL 쿼리를 생성합니다. 생성된 쿼리는 항상 읽기 전용입니다. 재시도는 자동으로 처리되고 SQL 웨어하우스는 동시성 및 규모를 처리합니다. 결과 집합은 응답의 일부로 표시됩니다.

지니 공간 설정

다음과 같은 경우 지니 공간을 만들 수 있습니다.

  • Databricks SQL 권한입니다.
  • 적어도 pro 또는 서버리스 SQL 웨어하우스에 CAN USE 권한이 필요합니다.
  • 하나 이상의 Unity 카탈로그 데이터 개체에 대한 최소 SELECT 권한이 필요합니다.

AI/BI Genie 공간 설정 및 관리를 참조하세요.

지니 공간과 상호 작용

비즈니스 팀은 지니 공간의 최종 사용자입니다. Genie 공간을 사용하려면 비즈니스 사용자에게 다음이 있어야 합니다.

  • 소비자 액세스 또는 Databricks SQL 권한입니다.
  • 적어도 지니 공간에 지정된 기본 웨어하우스에 대한 사용 권한을 사용할 수 있습니다.
  • 공간에 사용되는 모든 Unity 카탈로그 데이터 개체에 대한 최소 SELECT 권한입니다.

비즈니스 사용자는 개발 중에 공간을 테스트하고 피드백을 제공하여 공간을 큐레이팅하는 데 도움을 줄 수 있습니다. 비즈니스 사용자가 Genie 공간 작업을 시작하는 방법에 대한 자세한 내용은 지니 공간 사용을 참조하여 비즈니스 데이터를 탐색합니다.

신뢰할 수 있는 자산

신뢰할 수 있는 자산은 결과의 정확도에 대한 추가 보증 계층을 공간 사용자에게 전달합니다. 매개 변수가 있는 예제 쿼리 또는 SQL 함수의 정확한 텍스트를 사용하여 응답을 생성하는 경우 Genie는 응답을 신뢰할 수 있는 것으로 표시합니다. 신뢰할 수 있는 자산에 대한 자세한 내용은 AI/BI Genie 공간에서 신뢰할 수 있는 자산 사용을 참조하세요. 매개 변수가 있는 쿼리 작업에 대한 자세한 내용은 SQL 쿼리의 매개 변수 사용을 참조하세요.

벤치마크를 사용하여 응답 평가

벤치마크를 사용하면 Genie 공간에서 개별 응답의 테스트 및 평가를 확장할 수 있습니다. 지침과 달리, 벤치마크는 Genie 공간의 정보를 제공하는 것이 아니라 평가를 위한 것입니다. Genie는 Genie의 컨텍스트를 개선하기 위해 벤치마크 질문 또는 예제 SQL을 사용하지 않습니다.

벤치마크를 사용하여 테스트 질문 컬렉션을 실행하고 응답을 사용하여 Genie의 정확도를 측정할 수 있습니다. 필요에 따라 예상된 결과를 반환하는 SQL 문을 포함할 수 있습니다. 벤치마크 질문이 실행될 때 Genie의 응답은 SQL 문에서 제공한 결과와 비교되고 정확도를 위해 점수가 매깁니다. SQL 답변이 제공되지 않은 경우 이 질문은 검토용으로 표시됩니다.

지니 공간에서 벤치마크 사용을 참조하세요.

개인 정보 보호 및 보안

Q: Genie는 어떤 모델을 사용하나요?

Genie는 Databricks AI 기반 기능입니다. AI 모델, 검색, 순위 및 개인 설정 시스템의 사용을 결합하여 조직의 데이터 및 사용 패턴을 이해하는 복합 AI 시스템을 사용합니다. 자세한 내용은 Databricks AI 기반 기능을 참조하세요.

Q: 어떤 데이터를 모델로 보내나요?

Genie는 응답을 생성할 때 프롬프트, 관련 테이블 메타데이터 및 값, 오류, 입력 코드 또는 쿼리를 사용합니다.

응답을 처리하기 위해 Genie는 다음을 사용합니다.

  • 사용자가 제출한 자연어 프롬프트
  • 테이블 이름 및 설명
  • 열 제목, 설명 및 샘플 값
  • 일반 지침
  • 예제 SQL 쿼리
  • SQL 함수

Q: Azure OpenAI에서 내 데이터를 저장하나요?

아니요. Databricks를 통해 Azure OpenAI 모델을 사용하는 경우 Microsoft는 네트워크 로그가 아닌 모든 수준에서 일정 기간 동안 프롬프트 또는 응답을 저장하지 않습니다. 여기에는 일반적으로 남용 모니터링에 사용되는 데이터가 포함됩니다. Databricks는 Azure OpenAI의 남용 모니터링 및 사용자 검토를 옵트아웃하므로 Microsoft는 Genie에서 보낸 데이터를 보존하거나 검사하지 않습니다. 자세한 내용은 Microsoft 설명서를 참조하세요.

Q: Genie 응답은 어디에 저장됩니다.

Genie 응답은 Azure Databricks 컨트롤 플레인에 저장됩니다.

Q: 지니 공간에서 행 수준 필터링이 지원되는가요?

예, 사용자가 특정 데이터 개체에 액세스할 수 있는 Unity 카탈로그 컨트롤에 부여된 권한입니다. 행 필터 또는 열 마스크가 데이터 개체에 적용되는 경우 결과 집합에 반환되는 값을 제어합니다. 행 필터 및 열 마스크를 참조하세요.

Q: 내 트래픽이 Geos를 통해 라우팅되는 방법

  • Genie는 미국, EU, AUS 및 인도에 배포됩니다.

  • 트래픽 라우팅은 지역 및 지역 간 처리를 사용할 수 있는지 여부에 따라 달라집니다(지정된 서비스에 대한 작업 영역 Geography 내에서 데이터 처리 적용사용 안 함).

    • EU: 트래픽은 지역 간 처리에 관계없이 항상 EU를 통해 라우팅됩니다.
    • 미국: 트래픽은 지역 간 처리에 관계없이 항상 미국을 통해 라우팅됩니다.
    • 인도 및 AUS:
      • 지역 간 처리를 사용하지 않도록 설정하면 트래픽이 해당 지역 내에 유지됩니다.
      • 지역 간 처리를 사용하는 경우: 트래픽은 항상 미국을 통해 라우팅됩니다.
    • 다른 모든 지역:
      • 지역 간 처리를 사용하지 않도록 설정하면 Genie가 작동하지 않습니다.
      • 지역 간 처리를 사용하는 경우: 트래픽은 미국을 통해 라우팅됩니다.