AI 및 벡터 통합
SQL Server 2025에는 데이터베이스 개발자가 AI 기반 기능을 T-SQL에 직접 통합할 수 있는 새로운 AI 및 벡터 함수 집합이 도입되었습니다. 이러한 새로운 기능을 사용하면 SQL Server를 종료하지 않고도 포함을 생성하고, 벡터 유사성을 계산하고, AI 보강 데이터를 검색할 수 있습니다. 이 통합 수준은 외부 서비스에 대한 필요성을 줄이고, 애플리케이션 아키텍처를 간소화하며, 실시간 지능형 워크로드를 지원합니다.
AI 및 벡터 함수 개요
SQL Server 2025의 새로운 AI 기능은 AI 생성, 벡터 작업, 벡터 인덱싱 및 검색의 세 가지 주요 범주로 분류됩니다.
AI 생성 함수
- AI_GENERATE_CHUNKS – 대용량 텍스트 또는 문서를 의미상 일관된 청크로 분할합니다. 이 청크는 나중에 RAG(검색 보강 생성) 시나리오를 위해 포함하거나 저장할 수 있습니다.
- AI_GENERATE_EMBEDDINGS – SQL Server에 등록된 외부 모델을 사용하여 텍스트 입력에서 포함을 생성합니다. 이러한 포함은 벡터 검색, 유사성 분석 또는 의미 체계 순위에 사용하기 위해 테이블에 저장할 수 있습니다.
벡터 작업
- VECTOR_DISTANCE – 코사인, 유클리드 및 점 제품과 같은 거리 메트릭을 지원하는 두 벡터 값 사이의 거리를 계산합니다.
- VECTOR_NORM – 지정된 벡터에 대한 벡터 표준(크기)을 반환합니다.
- VECTOR_NORMALIZE – 일반적으로 비교 또는 유사성 검색 전에 사용되는 정규화된 버전의 벡터를 반환합니다.
- VECTORPROPERTY – 해당 차원 또는 요소 형식과 같은 벡터에 대한 메타데이터를 반환합니다.
외부 모델 및 벡터 인덱스
SQL Server 2025를 사용하면 T-SQL을 사용하여 외부 AI 모델을 등록하고 관리할 수 있습니다.
- CREATE EXTERNAL MODEL / ALTER EXTERNAL MODEL / DROP EXTERNAL MODEL – 로컬로 또는 지원되는 모델 공급자를 통해 호스트되는 AI 모델을 관리합니다.
- CREATE VECTOR INDEX – 유사성 검색을 가속화하기 위해 벡터 데이터에 최적화된 인덱스 만들기
- VECTOR_SEARCH – 벡터 인덱스를 사용하여 벡터 데이터에 대해 유사성 검색 작업을 수행하고 선택한 거리 메트릭에 따라 가장 가까운 일치 항목을 반환합니다.
이러한 기능을 통해 SQL Server는 데이터베이스 엔진 내에서 검색 보강된 생성, 권장 엔진 및 의미 체계 검색 애플리케이션의 기초 역할을 할 수 있습니다.
반정밀도 벡터 스토리지 및 이진 수집
이제 벡터는 fp16(반정밀도 부동 소수점) 요소를 사용하여 메모리 사용량을 줄이고 많은 워크로드를 포함할 때 검사 성능을 향상시킬 수 있습니다.
(SQL Server 외부에서 생성된 대용량 임베딩 집합을 가져오는 작업을) 와 BULK INSERT를 사용하여 이진 형식으로 벡터를 대량으로 로드하여 간소화할 수 있습니다.
예제 시나리오: 제품 권장 사항 쿼리 작성
SQL Server 2025 데이터베이스에 제품 설명을 저장하는 소매 회사에서 일한다고 가정해 보겠습니다. 마케팅 팀은 선택한 항목과 의미상 유사한 제품을 제안하는 추천 기능을 빌드하려고 합니다. 새 AI 및 벡터 기능을 사용하여 제품 설명에 대한 포함을 생성하고, 테이블에 저장하고, 외부 처리 없이 유사성 검색을 수행할 수 있습니다.
모델 만들기 및 등록
임베딩을 생성하기 전에 외부 모델을 등록해야 합니다.
CREATE EXTERNAL MODEL embedding_model
FROM OPENAI
WITH (ENDPOINT = 'https://api.openai.com/v1/embeddings',
API_KEY = SECRET('openai_key'),
MODEL_NAME = 'text-embedding-3-small');
임베딩 생성 및 저장
모델이 등록되면 제품 설명에 대한 포함을 생성하고 새 테이블에 저장할 수 있습니다.
CREATE TABLE ProductEmbeddings
(
ProductID INT PRIMARY KEY,
Description NVARCHAR(MAX),
Embedding VECTOR(1536)
);
INSERT INTO ProductEmbeddings (ProductID, Description, Embedding)
SELECT ProductID,
Description,
AI_GENERATE_EMBEDDINGS('embedding_model', Description)
FROM Products;
벡터 인덱스 만들기 및 검색 실행
검색 성능을 향상시키려면 유사성 검색 속도를 높이기 위해 벡터 인덱스 만들기
CREATE VECTOR INDEX idx_ProductEmbedding
ON ProductEmbeddings (Embedding)
WITH (DISTANCE_METRIC = 'cosine');
이제 관련 제품에 대한 의미 체계 검색을 수행할 수 있습니다.
DECLARE @query NVARCHAR(MAX) = 'waterproof hiking backpack';
DECLARE @vector VECTOR(1536) = AI_GENERATE_EMBEDDINGS('embedding_model', @query);
SELECT TOP 5 ProductID, Description,
VECTOR_DISTANCE(Embedding, @vector, 'cosine') AS SimilarityScore
FROM ProductEmbeddings
ORDER BY SimilarityScore ASC;
결과
| ProductID | Description | 유사도 점수 |
|---|---|---|
| 105 | "경량 방수 여행 배낭" | 0.07 |
| 116 | "비 커버와 수분 슬롯이 있는 하이킹 팩" | 0.10 |
| 117 | "방수가 있는 컴팩트 아웃도어 데이 팩" | 0.12 |
| 101 | "외부 스트랩이 있는 트레일 레디 백팩" | 0.15 |
| 119 | 여행 및 캠핑 방수 더플백 | 0.18 |
이 예제에서는 외부 AI 모델을 통합하고, T-SQL 내에서 직접 포함을 생성하며, 기본 제공 벡터 함수를 사용하여 유사성 검색을 수행하는 방법을 보여 줍니다. 모든 항목은 SQL Server 내에서 실행되므로 개발이 간소화되고 인텔리전트 워크로드가 기존 데이터베이스 정책에 따라 안전하게 관리될 수 있습니다.
요약
SQL Server 2025에는 개발자가 T-SQL에서 직접 지능형 데이터베이스 애플리케이션을 빌드할 수 있는 네이티브 AI 기능이 도입되었습니다. AI 모델과의 통합을 간소화하면서 성능과 보안을 유지하는 AI_GENERATE_EMBEDDINGS, VECTOR_DISTANCE, 및 VECTOR_SEARCH 기능을 수행합니다. 이러한 기능을 통해 SQL Server 2025는 외부 컴퓨팅 파이프라인에 의존하지 않고 의미 체계 검색, 권장 사항 및 컨텍스트 인식 분석을 위한 강력한 플랫폼이 됩니다.