다음을 통해 공유


Databricks에서의 AI 및 기계 학습

데이터 준비에서 프로덕션 모니터링에 이르기까지 전체 AI 수명 주기를 통합하는 통합 플랫폼인 Mosaic AI를 사용하여 AI 및 기계 학습 애플리케이션을 빌드, 배포 및 관리합니다.

시작하기 위한 자습서 집합은 AI 및 기계 학습 자습서를 참조하세요.

생성적 인공지능 애플리케이션 구축

미세 조정된 LLM, AI 에이전트 및 검색 보강된 세대와 같은 엔터프라이즈급 생성 AI 애플리케이션을 개발하고 배포합니다.

특징 설명
AI 플레이그라운드 코드 프롬프트가 없는 엔지니어링 및 매개 변수 튜닝을 사용하여 생성 AI 모델을 프로토타입하고 테스트합니다.
Agent Bricks 일반적인 AI 사용 사례에 대한 도메인별 고품질 AI 에이전트 시스템을 빌드하고 최적화하기 위한 간단한 코드 없는 접근 방식입니다.
파운데이션 모델 안전하고 확장 가능한 API를 통해 Meta Llama, Anthropic Claude 및 OpenAI GPT를 비롯한 최신 LLM을 제공합니다.
Mosaic AI 에이전트 프레임워크 PYTHON을 사용하여 RAG 애플리케이션 및 다중 에이전트 시스템을 비롯한 프로덕션 품질 에이전트를 빌드하고 배포합니다.
GenAI용 MLflow AI 기반 메트릭 및 포괄적인 추적 관찰 가능성을 사용하여 GenAI 애플리케이션 수명 주기 전반에 걸쳐 품질을 측정, 개선 및 모니터링합니다.
벡터 검색 RAG 애플리케이션에 대한 기술 자료에 자동 동기화를 사용하여 포함 벡터를 저장하고 쿼리합니다.
파운데이션 모델 미세 조정 사용자 고유의 데이터로 기본 모델을 사용자 지정하여 특정 애플리케이션의 성능을 최적화합니다.

클래식 기계 학습 모델 학습

자동화된 도구 및 공동 작업 개발 환경을 사용하여 기계 학습 모델을 만듭니다.

특징 설명
AutoML 자동화된 기능 엔지니어링 및 하이퍼 매개 변수 튜닝을 사용하여 최소한의 코드로 고품질 모델을 자동으로 빌드합니다.
Databricks Runtime for ML TensorFlow, PyTorch, Keras 및 GPU를 사용하여 미리 구성된 클러스터는 딥 러닝 개발을 지원합니다.
MLflow 추적 실험을 추적하고, 모델 성능을 비교하고, 전체 모델 개발 수명 주기를 관리합니다.
기능 엔지니어링 자동화된 데이터 파이프라인 및 기능 검색을 사용하여 기능을 만들고, 관리하고, 제공합니다.
Databricks 노트북 Python, R, Scala 및 SQL for ML 워크플로를 지원하는 공동 개발 환경입니다.

딥 러닝 모델 학습

기본 제공 프레임워크를 사용하여 딥 러닝 모델을 개발합니다.

특징 설명
분산 학습 Ray, TorchDistributor 및 DeepSpeed를 사용하는 분산 딥 러닝의 예입니다.
Databricks에 대한 딥 러닝 모범 사례 Databricks에 대한 딥 러닝에 대한 모범 사례입니다.
PyTorch PyTorch를 사용하는 단일 노드 및 분산 학습.
TensorFlow TensorFlow 및 TensorBoard를 사용하는 단일 노드 및 분산 학습입니다.
참조 솔루션 딥 러닝을 위한 참조 솔루션입니다.

모델 배포 및 제공

확장 가능한 엔드포인트, 실시간 유추 및 엔터프라이즈급 모니터링을 사용하여 프로덕션 환경에 모델을 배포합니다.

특징 설명
모델 서빙 자동 크기 조정 및 GPU 지원을 사용하여 사용자 지정 모델 및 LLM을 확장 가능한 REST 엔드포인트로 배포합니다.
AI 게이트웨이 사용량 추적, 페이로드 로깅 및 보안 제어를 사용하여 생성 AI 모델에 대한 액세스를 제어하고 모니터링합니다.
외부 모델 Databricks 외부에서 호스트되는 타사 모델을 통합된 거버넌스 및 모니터링과 통합합니다.
파운데이션 모델 API Databricks에서 호스트하는 최신 오픈 모델에 액세스하고 쿼리합니다.

ML 시스템 모니터링 및 관리

포괄적인 모니터링 및 거버넌스 도구를 사용하여 모델 품질, 데이터 무결성 및 규정 준수를 보장합니다.

특징 설명
Unity 카탈로그 통합 액세스 제어, 계보 추적 및 검색을 사용하여 데이터, 기능, 모델 및 함수를 제어합니다.
Lakehouse 모니터링 자동화된 경고 및 근본 원인 분석을 사용하여 데이터 품질, 모델 성능 및 예측 드리프트를 모니터링합니다.
모델용 MLflow 개발 수명 주기 내내 생성 AI 애플리케이션을 추적, 평가 및 모니터링합니다.

ML 워크플로 프로덕션화

자동화된 워크플로, CI/CD 통합 및 프로덕션 준비 파이프라인을 사용하여 기계 학습 작업의 크기를 조정합니다.

과업 설명
모델 레지스트리 중앙 집중식 모델 수명 주기 관리를 사용하여 모델 버전, 승인 및 배포를 관리합니다.
Lakeflow 작업 ML 데이터 처리를 위한 자동화된 워크플로 및 프로덕션 준비 ETL 파이프라인을 빌드합니다.
Databricks의 Ray 대규모 모델 학습 및 유추를 위해 분산 컴퓨팅을 사용하여 ML 워크로드 크기를 조정합니다.
MLOps 워크플로 자동화된 학습, 테스트 및 배포 파이프라인을 사용하여 엔드 투 엔드 MLOps를 구현합니다.
Git 통합 원활한 Git 통합 및 공동 개발로 ML 코드 및 Notebook을 버전 제어합니다.