다음을 통해 공유


개념: Azure Databricks의 생성형 AI

GenAI 앱은 생성 AI 모델(예: 큰 언어 모델, 이미지 생성 모델 및 텍스트 음성 변환 모델)을 사용하여 새 출력을 만들거나, 복잡한 작업을 자동화하거나, 사용자 입력을 기반으로 지능형 상호 작용에 참여하는 애플리케이션입니다.

GENAI 앱은 LLM 또는 다른 GenAI 모델에 대한 간단한 호출 또는 복잡한 AI 에이전트를 통해 구동할 수 있습니다. 복잡성 수준에 대해 자세히 알아보세요.

GenAI 앱의 에이전트, 도구, 평가, 모델 및 기타 측면을 독점 데이터로 사용자 지정할 수 있습니다. 이러한 데이터 기반 사용자 지정은 데이터 인텔리전스로 이어지며, 이를 통해 통조림 AI 모델에서 제공하는 일반 인텔리전스를 넘어갈 수 있습니다.

GenAI 애플리케이션

사용자 연결 GenAI 애플리케이션은 다음과 같은 다양한 형식을 사용할 수 있습니다.

GenAI 애플리케이션을 성공적으로 사용하려면 애플리케이션 개발 및 AI 평가라는 두 가지 기술 집합이 필요한 경우가 많습니다. GenAI 앱 개발은 비 AI 애플리케이션을 개발하는 것과 매우 유사하며, 애플리케이션 유형에 따라 소프트웨어 기술이 필요합니다. 그러나 GenAI 애플리케이션에 대한 평가에는 GenAI의 복잡성 및 개방형 응답을 처리하기 위한 특수한 도구와 기술이 필요합니다.

Azure Databricks에서 산업별 GenAI 앱을 빌드하는 방법에 대한 자세한 내용은 다음을 참조하세요.

GenAI 평가

GenAI 모델, 에이전트 및 애플리케이션에는 종종 복잡한 개방형 동작이 있습니다. 사용자는 쿼리를 입력할 수 있습니다. AI 에이전트는 실행하는 동안 텍스트, 이미지 등을 수집할 수 있습니다. 출력은 임의의 텍스트, 이미지 또는 기타 미디어일 수 있으며 많은 "좋은" 답변이 있을 수 있습니다.

이러한 합병증으로 GenAI를 평가하기가 어렵습니다. 적절한 평가에는 다음이 필요합니다.

  • AI를 사용하여 AI를 평가하는 자동화
  • 전문가와 사용자의 피드백을 통해 근거를 수집하고 자동화된 평가를 보정합니다.
  • 복잡한 에이전트로 심층 분석하여 동작 이해 및 디버그

Azure Databricks 관리형 MLflow 및 관련 도구는 GenAI 평가의 기초를 제공합니다.

Agents

에이전트 또는 에이전트 시스템은 목표를 달성하기 위해 환경에서 자율적으로 인식, 결정 및 작동할 수 있는 AI 기반 시스템입니다. 메시지가 표시될 때만 출력을 생성하는 독립 실행형 GenAI 모델과 달리 에이전트 시스템은 어느 정도의 에이전시를 보유하고 있습니다. 최신 AI 에이전트는 GenAI 모델을 다음과 같은 시스템의 "브레인"으로 사용합니다.

  1. 다른 에이전트로부터 사용자 요청 또는 메시지를 받습니다.
  2. 진행 방법에 대한 이유: 가져올 데이터, 적용할 논리, 호출할 도구 또는 사용자에게 더 많은 입력을 요청할지 여부입니다.
  3. 계획을 실행하고, 필요에 따라 여러 도구를 사용하거나 대리업무를 하위 에이전트에 위임할 수 있습니다.
  4. 답변을 반환하거나 사용자에게 추가 설명을 묻는 메시지를 표시합니다.

에이전트 시스템은 일반 인텔리전스(GenAI 모델의 미리 학습된 기능) 및 데이터 인텔리전스(비즈니스와 관련된 전문 지식 및 API)를 브리징하여 고급 고객 서비스 흐름, 데이터가 풍부한 분석 봇 및 복잡한 운영 작업을 위한 다중 에이전트 오케스트레이션과 같은 영향력이 큰 엔터프라이즈 사용 사례를 가능하게 합니다.

간단한 GenAI 모델에서 복잡한 에이전트로의 연속체가 있습니다. 자세한 내용은 에이전트 시스템 디자인 패턴을 참조하세요.

Azure Databricks는 완전히 안내된 것부터 완전한 사용자 지정에 이르기까지 에이전트를 빌드하기 위한 다양한 옵션을 제공합니다.

  • 에이전트 Bricks는 지식 도우미 및 정보 추출과 같은 주요 애플리케이션에 대한 안내 에이전트 빌더를 제공합니다.
  • AI Playground 는 생성된 에이전트 코드를 내보낼 수 있는 프로토타입 도구 호출 에이전트를 위한 UI를 제공합니다.
  • 에이전트 프레임워크 를 사용하면 사용자 지정 코드 또는 타사 에이전트 작성 라이브러리를 사용하여 에이전트를 빌드하고 배포할 수 있습니다.

도구

AI 에이전트는 도구를 호출하여 정보를 수집하거나 작업을 수행할 수 있습니다. 도구는 잘 정의된 작업을 수행하기 위해 LLM이 호출할 수 있는 단일 상호 작용 함수입니다. AI 모델은 일반적으로 각 도구 호출에 대한 매개 변수를 생성하며 도구는 간단한 입력 출력 상호 작용을 제공합니다.

일반적인 도구 범주는 다음과 같습니다.

  • 데이터 검색하거나 분석하는 도구
    • 의미 체계 검색: 벡터 인덱스를 쿼리하여 관련 텍스트 또는 기타 구조화되지 않은 데이터를 찾습니다.
    • 구조적 검색: SQL 쿼리를 실행하거나 API를 사용하여 구조화된 정보를 검색합니다.
    • 웹 검색 도구: 인터넷 또는 내부 웹 모음을 검색합니다.
    • 클래식 ML 모델: 기계 학습 모델을 호출하여 분류, 회귀 또는 기타 예측을 수행합니다.
    • GenAI 모델: 코드 또는 이미지와 같은 특수 출력을 생성합니다.
  • 외부 시스템 상태를 수정하는 도구
    • API 호출: CRM 엔드포인트, 내부 서비스 또는 기타 타사 통합을 호출합니다.
    • 전자 메일 또는 메시징 앱 통합: 메시지를 게시하거나 알림을 보냅니다.
  • 논리를 실행하거나 특정 작업을 수행하는 도구
    • 코드 실행: 샌드박스에서 사용자 제공 또는 LLM 생성 코드를 실행합니다.

도구는 에이전트 논리에 기본 제공되거나 MCP와 같은 표준화된 인터페이스를 사용하여 액세스할 수 있습니다.

도구 및 에이전트:

  • 도구는 잘 정의된 단일 작업을 수행합니다. 에이전트는 더 많은 개방형 작업을 수행할 수 있습니다.
  • 도구는 일반적으로 상태가 없으며 각 호출 사이에 컨텍스트를 유지하지 않습니다. 에이전트는 반복적으로 작업을 해결하므로 상태를 유지 관리합니다.

도구 오류 처리 및 안전성:

각 도구 호출은 API 호출과 같은 외부 작업이므로 시스템에서 오류를 정상적으로 처리해야 합니다. 시간 제한, 잘못된 형식의 응답 또는 잘못된 입력으로 인해 에이전트 자체가 완전히 실패하지 않아야 합니다. 프로덕션 환경에서는 허용되는 도구 호출 수를 제한하고, 도구 호출이 실패할 경우 대체 응답을 수행하고, 가드레일을 적용하여 에이전트 시스템이 동일한 실패 작업을 반복적으로 시도하지 않도록 합니다.

Databricks의 AI 도구에 대해 자세히 알아보세요.

GenAI 모델 및 LLM

LLM(큰 언어 모델)은 인간 언어에 대한 이해, 생성 및 이유를 이해할 수 있는 대규모 텍스트 데이터 집합에 대해 학습된 AI 모델입니다. LLM은 입력 프롬프트를 기반으로 컨텍스트 관련 텍스트를 예측하고 생성하여 챗봇, 코드 도우미 및 콘텐츠 생성 도구와 같은 애플리케이션을 구동합니다.

일반적으로 GenAI 모델 또는 기본 모델은 텍스트 이외의 모드에 대해 알아보기 위해 대규모 텍스트, 이미지, 비디오, 오디오 또는 기타 데이터를 학습합니다. 다중 모달 모델은 이미지, 오디오 및 기타 미디어를 사용하여 인간의 언어를 연결하도록 학습합니다. LLM은 GenAI 또는 기본 모델의 한 유형이지만 이러한 용어는 종종 느슨하고 상호 교환적으로 사용됩니다.

GenAI 모델은 GenAI 에이전트 및 앱 뒤에 있는 인텔리전스를 제공합니다. 간단한 앱은 프롬프트 엔지니어링으로 사용자 지정된 단일 모델을 사용하여 빌드되는 경우가 많습니다.

Azure Databricks에서 GenAI 모델을 사용하는 방법에 대해 알아봅니다.

신속한 엔지니어링

GenAI 모델은 일반적으로 사용자에게 사용자 입력을 처리하는 방법을 알려주는 프롬프트 또는 지침을 사용합니다. 자세한 단계, 전문가 지식, 데이터 및 기타 정보로 프롬프트를 크게 사용자 지정할 수 있습니다.

Azure Databricks는 프롬프트 엔지니어링을 수행하는 유연한 방법을 제공합니다. 다음은 그 예입니다.

  • 에이전트 Bricks는 데이터 및 피드백에 따라 내부적으로 프롬프트 엔지니어링을 자동화합니다.

모델 미세 조정

GenAI 모델은 사용자 지정 데이터를 사용하여 특정 도메인 또는 애플리케이션에 대한 모델을 사용자 지정하는 미세 조정을 통해 사용자 지정할 수도 있습니다.

Azure Databricks는 모델을 미세 조정하는 유연한 방법을 제공합니다. 다음은 그 예입니다.

GenAI 플랫폼이란?

GenAI에는 결합된 데이터 + AI 플랫폼이 필요합니다. 개발자와 관리자 모두에게 GenAI의 주요 구성 요소는 간단하고 통합된 플랫폼에서 연결되고 관리되어야 합니다.

주요 구성 요소는 다음과 같습니다.

  • 모델, 에이전트 및 앱과 같은 AI 자산
  • 파일, 테이블, 처리 파이프라인, 벡터 인덱스 및 기능 저장소와 같은 데이터 자산
  • 모델 및 에이전트에 대한 엔드포인트와 같은 AI 배포
  • AI 및 데이터 자산 빌드 및 배포를 위한 도구

주요 거버넌스 기능은 다음과 같습니다.

  • AI 및 데이터 자산의 통합 거버넌스. Unity 카탈로그란?에서 자세히 알아보세요.
  • GenAI 모델 엔드포인트의 통합 거버넌스. Mosaic AI Gateway 소개에서 자세히 알아보세요.
  • 통합 보안 접근 방식. Databricks AI Security에 대해 자세히 알아보세요.
  • AI 및 데이터 도구의 통합 관리. 관리에서 자세히 알아보세요.

GenAI 및 Databricks 아키텍처에 대한 모자이크 AI 기능도 참조하세요.

더 알아보세요