Microsoft Fabric의 데이터 에이전트를 사용하면 Fabric의 레이크하우스, 웨어하우스, Power BI 의미 체계 모델, KQL 데이터베이스에 저장된 데이터에 대한 질문에 답하는 대화형 AI 환경을 만들 수 있습니다. 데이터 인사이트에 액세스할 수 있게 됩니다. 동료는 AI 전문가가 아니거나 데이터에 깊이 익숙하지 않더라도 일반 영어로 질문을 하고 데이터 기반 답변을 받을 수 있습니다.
중요
이 기능은 프리뷰로 제공됩니다.
- 유료 F64 이상의 플랫폼 용량 리소스
- Fabric 데이터 에이전트 테넌트 설정이 활성화되었습니다.
- Copilot 테넌트 스위치가 활성화되었습니다.
- 인공지능의 지역 간 처리가 활성화되었습니다.
- AI의 지리 간 저장이 활성화되었습니다.
- 다음 중 하나 이상: 웨어하우스, 레이크하우스, 하나 이상의 Power BI 의미 체계 모델 또는 데이터가 포함된 KQL 데이터베이스.
- Power BI 의미 체계 모델을 XMLA 엔드포인트 테넌트 스위치를 통해 Power BI 의미 체계 모델 데이터 원본에 대해 사용할 수 있도록 설정되었습니다.
이 섹션에서는 Fabric에서 Fabric 데이터 에이전트를 만들고, 유효성을 검사하고, 공유하고, 이를 사용할 수 있도록 하는 주요 단계를 간략하게 설명합니다.
이 프로세스는 간단하며 몇 분 안에 Fabric 데이터 에이전트 리소스 테스트를 시작할 수 있습니다.
새 Fabric 데이터 에이전트를 만들려면 먼저 작업 영역으로 이동한 다음 + 새 항목 단추를 선택합니다. 모든 항목 탭에서 Fabric 데이터 에이전트를 검색하여 이 스크린샷에 표시된 대로 적절한 옵션을 찾습니다.
선택하면 이 스크린샷에 표시된 대로 Fabric 데이터 에이전트의 이름을 제공하라는 메시지가 표시됩니다.
Fabric 데이터 에이전트의 이름을 지정하는 방법에 대한 시각적 가이드는 제공된 스크린샷을 참조하세요. 이름을 입력한 후 Fabric 데이터 에이전트를 특정 요구 사항에 맞게 조정하기 위한 구성을 진행합니다.
Fabric 데이터 에이전트를 만든 후에는 레이크하우스, 웨어하우스, Power BI 의미 체계 모델, KQL 데이터베이스 등 최대 5개의 데이터 원본을 원하는 대로 조합하여 추가할 수 있습니다. 예를 들어 Power BI 의미 체계 모델 5개 또는 Power BI 의미 체계 모델 2개, 레이크하우스 1개, KQL 데이터베이스 1개를 추가할 수 있습니다.
처음으로 Fabric 데이터 에이전트를 만들고 이름을 제공하면 OneLake 카탈로그가 자동으로 나타나서 데이터 원본을 추가할 수 있습니다. 데이터 원본을 추가하려면 다음 화면에 표시된 대로 카탈로그에서 데이터 원본을 선택한 다음 추가를 선택합니다. 각 데이터 원본은 개별적으로 추가해야 합니다. 예를 들어, lakehouse를 추가한 후 을 선택하고을 추가한 다음, 다른 데이터 원본을 계속 추가할 수 있습니다. 데이터 원본 형식을 필터링하려면 필터 아이콘을 선택한 다음 원하는 형식을 선택합니다. 선택한 형식의 데이터 원본만 볼 수 있으므로 Fabric 데이터 에이전트에 적절한 원본을 쉽게 찾아 연결할 수 있습니다.
데이터 원본을 추가하면 Fabric 데이터 에이전트 페이지의 왼쪽 창에 있는 탐색기에 선택한 각 데이터 원본에서 사용 가능한 테이블이 채워집니다. 여기서 확인란을 사용하여 다음 스크린샷에 표시된 대로 테이블을 AI에서 사용 가능하거나 사용 불가능하게 만들 수 있습니다.
참고
Fabric 데이터 에이전트에 Power BI 의미 체계 모델을 데이터 원본으로 추가하려면 읽기/쓰기 권한이 필요합니다.
이후 데이터 원본을 추가하려면 Fabric 데이터 에이전트 페이지의 왼쪽 창에 있는 탐색기로 이동하고 이 스크린샷에 표시된 대로 + 데이터 원본을 선택합니다.
OneLake 카탈로그가 다시 열리고 필요에 따라 더 많은 데이터 원본을 원활하게 추가할 수 있습니다.
팁
테이블과 열 모두에 설명이 포함된 이름을 사용해야 합니다.
SalesData
테이블은 TableA
것보다 더 의미가 있으며 ActiveCustomer
또는 IsCustomerActive
같은 열 이름은 C1
또는 ActCu
보다 명확합니다. 설명이 포함된 이름은 AI가 보다 정확하고 신뢰할 수 있는 쿼리를 생성하는 데 도움이 됩니다.
데이터 원본을 추가하고 각 데이터 원본에 대한 관련 테이블을 선택하면 질문을 시작할 수 있습니다. 시스템은 다음 스크린샷에 표시된 대로 질문을 처리합니다.
이러한 예제와 유사한 질문도 작동해야 합니다.
- "2023년 캘리포니아에서의 총 매출은 어땠나요?"
- "가장 높은 정가를 가진 상위 5개 제품은 무엇이며 해당 범주는 무엇인가요?"
- "판매된 적이 없는 가장 비싼 품목은 무엇인가요?"
이와 같은 질문은 시스템이 이를 구조화된 쿼리(T-SQL, DAX 또는 KQL)로 변환하고, 데이터베이스에서 실행한 후 저장된 데이터를 기반으로 구체적인 답변을 반환할 수 있기 때문에 적합합니다.
하지만 다음과 같은 질문은 범위에서 벗어납니다.
- "2024년 2분기 공장 생산성이 낮은 이유는 무엇인가요?"
- "판매 급증의 근본 원인은 무엇인가요?"
이러한 질문은 복잡한 추론, 상관 관계 분석 또는 데이터베이스에서 직접 사용할 수 없는 외부 요소가 필요하기 때문에 현재 범위를 벗어났습니다. Fabric 데이터 에이전트는 현재 고급 분석, 기계 학습 또는 인과 유추를 수행하지 않습니다. 단순히 사용자의 쿼리에 따라 구조화된 데이터를 검색하고 처리합니다.
질문을 하면 Fabric 데이터 에이전트는 Azure OpenAI 도우미 API를 사용하여 요청을 처리합니다. 흐름은 다음과 같이 작동합니다.
시스템은 먼저 사용자의 자격 증명을 사용하여 데이터 원본의 스키마(예: lakehouse, warehouse, PBI 의미 체계 모델 또는 KQL 데이터베이스)에 액세스합니다. 이렇게 하면 시스템에서 사용자가 볼 수 있는 권한이 있는 데이터 구조 정보를 가져옵니다.
사용자의 질문을 해석하기 위해 시스템은 다음을 결합합니다.
- 사용자 쿼리: 사용자가 제공하는 자연어 질문입니다.
- 스키마 정보: 이전 단계에서 검색된 데이터 원본의 메타데이터 및 구조적 세부 정보입니다.
- 예 및 지침: Fabric 데이터 에이전트를 설정할 때 제공되는 미리 정의된 예(예: 샘플 질문과 답변) 또는 특정 지침입니다. 이러한 예제와 지침은 질문에 대한 AI의 이해를 구체화하고 AI가 데이터와 상호 작용하는 방법을 안내하는 데 도움이 됩니다.
이 모든 정보는 프롬프트를 생성하는 데 사용됩니다. 이 프롬프트는 Fabric 데이터 에이전트의 기반이 되는 에이전트 역할을 하는 Azure OpenAI 도우미 API에 대한 입력으로 사용됩니다. 이는 기본적으로 Fabric 데이터 에이전트에게 쿼리를 처리하는 방법과 생성할 답변 형식에 대한 지침을 제공합니다.
에이전트는 생성된 프롬프트를 분석하고 응답을 검색하기 위해 호출할 도구를 결정합니다.
- NL2SQL(자연어- SQL): 데이터가 레이크하우스 또는 웨어하우스에 있을 때 SQL 쿼리를 생성하는 데 사용됩니다.
- NL2DAX(Natural Language to DAX): Power BI 데이터 원본에서 의미 체계 모델과 상호 작용하는 DAX 쿼리를 만드는 데 사용됩니다.
- NL2KQL(Natural Language to KQL): KQL 데이터베이스에서 데이터를 쿼리하는 KQL 쿼리를 생성하는 데 사용됩니다.
선택된 도구는 Fabric 데이터 에이전트가 제공하는 스키마, 메타데이터 및 컨텍스트를 사용하여 쿼리를 생성합니다. 그런 다음 도구는 쿼리의 유효성을 검사하여 적절한 형식 지정 및 보안 프로토콜 및 자체 RAI(책임 있는 AI) 정책을 준수합니다.
Fabric 데이터 에이전트의 기반이 되는 에이전트는 쿼리를 실행하고 응답이 적절하게 구성되고 형식이 지정되었는지 확인합니다. 에이전트는 종종 사용자에게 친숙한 답변을 만들기 위한 추가 컨텍스트를 포함합니다. 마지막으로 다음 스크린샷과 같이 대화형 인터페이스에서 사용자에게 답변이 표시됩니다.
에이전트는 결과와 최종 답변을 검색하는 데 걸린 중간 단계를 모두 표시합니다. 이 방법은 투명성을 향상시키고 필요한 경우 해당 단계의 유효성을 검사할 수 있도록 합니다. 사용자는 다음 스크린샷에 표시된 대로 단계에 대한 드롭다운을 확장하여 Fabric 데이터 에이전트가 답변을 검색하는 데 수행한 모든 단계를 볼 수 있습니다.
또한 Fabric 데이터 에이전트는 해당 데이터 원본을 쿼리하는 데 사용되는 생성된 코드를 제공하여 응답이 어떻게 구성되었는지에 대한 추가적인 인사이트를 제공합니다.
이러한 쿼리는 데이터 쿼리 전용으로 설계되었습니다. 관련된 작업
- 데이터 만들기
- 데이터 업데이트
- 데이터 삭제
- 모든 유형의 데이터 변경
데이터의 무결성을 보호하기 위해 허용되지 않는 것이 있습니다.
언제든지 다음 스크린샷과 같이 채팅 지우기 단추를 선택하여 채팅을 지울 수 있습니다.
채팅 지우기 기능은 모든 채팅 기록을 지우고 새 세션을 시작합니다. 채팅 기록을 삭제한 후에는 검색할 수 없습니다.
데이터 원본을 제거하려면 Fabric 데이터 에이전트 페이지의 왼쪽 창에 있는 탐색기에서 3개 점 메뉴가 나타날 때까지 데이터 원본 이름을 마우스로 가리켜야 합니다. 세 개의 점을 선택하여 옵션을 표시한 다음, 제거 선택하여 다음 스크린샷과 같이 데이터 원본을 삭제합니다.
또는 데이터 원본이 변경된 경우 다음 스크린샷과 같이 동일한 메뉴 내에서 새로 고침 선택할 수 있습니다.
이렇게 하면 모든 데이터 원본 업데이트가 탐색기에 반영되고 올바르게 채워져 Fabric 데이터 에이전트가 최신 데이터와 동기화 상태를 유지할 수 있습니다.
Fabric 데이터 에이전트는 사용자가 조직의 요구 사항에 더 잘 부합하도록 Fabric 데이터 에이전트 동작을 사용자 지정할 수 있는 여러 가지 구성 옵션을 제공합니다. Fabric 데이터 에이전트가 데이터를 처리하고 제공할 때 이러한 구성은 결과에 대한 보다 많은 제어를 가능하게 하는 유연성을 제공합니다.
AI의 동작을 안내하는 구체적인 지침을 제공할 수 있습니다. Fabric 데이터 에이전트 지침 창에 추가하려면 다음 스크린샷에 표시된 대로 데이터 에이전트 지침을 선택합니다.
여기서는 일반 영어 텍스트로 최대 15,000자를 작성하여 AI에 쿼리를 처리하는 방법을 지시할 수 있습니다.
예를 들어 특정 유형의 질문에 사용할 정확한 데이터 원본을 지정할 수 있습니다. 데이터 원본 선택 예에는 AI가 사용하도록 지시하는 작업이 포함될 수 있습니다.
- 재무 쿼리에 대한 Power BI 의미 체계 모델
- 판매 데이터를 위한 레이크하우스
- 운영 메트릭에 대한 KQL 데이터베이스
이러한 지침은 AI가 지침 및 질문의 컨텍스트에 따라 SQL, DAX 또는 KQL에 관계없이 적절한 쿼리를 생성하도록 합니다.
AI 리소스가 특정 단어, 머리글자어 또는 용어를 지속적으로 잘못 해석하는 경우 이 섹션에서 명확한 정의를 제공하여 AI가 이를 올바르게 이해하고 처리할 수 있도록 합니다. 이는 도메인별 용어 또는 고유한 비즈니스 전문 용어에 특히 유용합니다.
이러한 지침을 조정하고 용어를 정의하면 데이터 전략 및 비즈니스 요구 사항에 완전히 부합하여 정확하고 관련 있는 인사이트를 제공하는 AI의 기능을 향상시킵니다.
레이크하우스, 웨어하우스, KQL 데이터베이스 등 각 데이터 원본에 맞게 조정된 쿼리 예를 제공하면 Fabric 데이터 에이전트의 응답 정확도를 높일 수 있습니다. 생성형 AI에서 퓨샷 학습이라고 불리는 이 방식은 Fabric 데이터 에이전트가 사용자의 기대치에 더 잘 부합하는 응답을 생성하도록 안내하는 데 도움이 됩니다.
AI에 샘플 쿼리/질문 쌍을 제공하는 경우 향후 질문에 대답할 때 이러한 예제를 참조합니다. 가장 관련성이 큰 예제에 새 쿼리를 일치시키는 것은 AI가 비즈니스별 논리를 통합하고 일반적으로 묻는 질문에 효과적으로 응답하는 데 도움이 됩니다. 이 기능을 사용하면 개별 데이터 원본을 미세 조정할 수 있으며 보다 정확한 SQL 또는 KQL 쿼리를 생성할 수 있습니다.
Power BI 의미 체계 모델 데이터는 현재 샘플 쿼리/질문 쌍 추가를 지원하지 않습니다. 그러나 Lakehouse, Warehouse 및 KQL 데이터베이스와 같은 지원되는 데이터 원본의 경우 더 많은 예제를 제공하면 기본 성능을 조정해야 할 때 AI가 정확한 쿼리를 생성하는 기능을 크게 향상시킬 수 있습니다.
팁
다양한 쿼리 예 집합은 Fabric 데이터 에이전트가 정확하고 관련성 있는 SQL/KQL 쿼리를 생성하는 기능을 향상합니다.
예제 쿼리를 추가하거나 편집하려면 다음 스크린샷과 같이 예제 쿼리 단추를 선택하여 예제 쿼리 창을 엽니다.
이 창에서는 Power BI 의미 체계 모델을 제외한 지원되는 모든 데이터 원본에 대한 예제 쿼리를 추가하거나 편집하는 옵션을 제공합니다. 각 데이터 원본에 대해 다음 스크린샷과 같이 추가 또는 편집 예제 쿼리 선택하여 관련 예제를 입력할 수 있습니다.
참고
Fabric 데이터 에이전트는 유효한 SQL/KQL 구문을 포함하고 선택한 테이블의 스키마와 일치하는 쿼리만 참조하세요. Fabric 데이터 에이전트는 유효성 검사가 완료되지 않은 쿼리를 사용하지 않습니다. 모든 쿼리 예가 유효하고 스키마에 맞게 올바르게 정렬되어 있는지 확인하여 Fabric 데이터 에이전트가 이를 효과적으로 활용할 수 있도록 합니다.
다양한 질문에 걸쳐 Fabric 데이터 에이전트의 성능을 테스트하고 정확한 SQL, DAX 또는 KQL 쿼리를 생성하는지 확인한 후에는 이를 동료와 공유할 수 있습니다. 이때 다음 스크린샷과 같이 게시을 선택합니다.
이 단계에서는 Fabric 데이터 에이전트에 대한 설명을 요청하는 창이 열립니다. 여기에서는 Fabric 데이터 에이전트의 기능에 대한 자세한 설명을 제공합니다. 이러한 세부 정보는 동료들에게 Fabric 데이터 에이전트의 기능에 대한 정보를 제공하고, 다른 AI 시스템/오케스트레이터가 Fabric 데이터 에이전트를 효과적으로 호출하는 데 도움이 됩니다.
Fabric 데이터 에이전트를 게시하면 두 가지 버전이 생깁니다. 한 가지 버전은 현재 초안 버전으로, 계속 구체화하고 개선할 수 있습니다. 두 번째 버전은 게시된 버전으로, Fabric 데이터 에이전트에 쿼리를 보내 질문에 대한 답변을 가져오고자 하는 동료와 공유할 수 있습니다. Fabric 데이터 에이전트의 성능을 더욱 향상시키기 위해 개발하는 동안 동료의 피드백을 현재 초안 버전에 통합할 수 있습니다.