PolyBase 소개

완료됨

PolyBase는 SQL Server에서 데이터 가상화 개념을 사용하도록 설정하는 데 사용하는 기능입니다. PolyBase는 원래 SQL Server 2016에서 릴리스되었으며 이후 버전의 각 SQL Server에서 개선되었습니다. 그러나 연결된 서버가 도입된 SQL Server 7.0에서 데이터 날짜를 복사하지 않고도 원격으로 데이터에 액세스하는 일반적인 개념입니다.

다음 표에서는 다양한 PolyBase 기능을 지원하는 첫 번째 SQL Server 버전을 나열합니다.

SQL Server 2016 SQL Server 2017 SQL Server 2019 SQL Server 2025
•Hadoop
• Azure Blob Storage (클라우드 블록 스토리지)
• OPENROWSET 향상된 기능
• Azure Blob Storage용 CSV
• 데이터베이스 범위 자격 증명
• SQL Server
•오라클
• Azure Cosmos DB
•Mongodb
•Teradata
• Linux 지원
• 일반적인 ODBC
• 새 커넥터 프레임워크
• 개체 스토리지 통합
•Csv
• Parquet
• 델타
• CETAS

PolyBase에 대한 자세한 내용은 PolyBase 기능 및 제한 사항을 참조하세요.

SQL Server 2025의 PolyBase 향상된 기능

  • CSV, Parquet, 및 Delta 1에 대한 기본 지원: 외부 데이터 설치를 위한 PolyBase 쿼리 서비스는 더 이상 Parquet, Delta, ABS(Azure Blob Storage), ADLS(Azure Data Lake Storage) 또는 S3-Compatible 개체 스토리지와 같은 외부 데이터 유형과 함께 OPENROWSET, CREATE EXTERNAL TABLE 또는 CREATE EXTERNAL TABLE AS SELECT를 사용할 필요가 없습니다.

  • Linux에서 제네릭 ODBC 데이터 원본 사용: 자세한 내용은 ODBC 제네릭 형식을 사용하여 외부 데이터에 액세스하도록 PolyBase 구성을 참조하세요.

  • TDS 8.0 지원: SQL Server용 Microsoft ODBC Driver 18을 사용하는 경우 TDS 8.0은 SQL Server를 외부 데이터 원본으로 지원하지 않습니다.

S3 호환 오브젝트 스토리지

SQL Server 2025는 S3 호환 개체 스토리지를 지원합니다. 이 통합을 사용하도록 설정하기 위해 SQL Server 2025는 S3 프레임워크를 따르는 REST API 커넥터 프레임워크 아키텍처를 사용합니다. S3 프레임워크를 지원하는 모든 개체 스토리지는 SQL Server 2025에서도 작동합니다. S3 호환 개체 스토리지 솔루션은 로컬, 네트워크, 클라우드 또는 하이브리드 환경에서 실행할 수 있습니다.

개체 기반 스토리지라고도 하는 개체 스토리지는 데이터 스토리지를 개체라고 하는 고유 단위로 관리하고 조작하는 전략입니다. 이러한 개체는 단일 저장소에 보관되며 다른 폴더 내의 파일에는 포함되지 않습니다. 대신 개체 스토리지는 파일을 구성하는 데이터 조각을 결합하고, 해당 파일에 모든 관련 메타데이터를 추가하고, 사용자 지정 식별자를 연결합니다.

기존 파일 시스템에 비해 개체 스토리지의 몇 가지 주요 기능은 다음과 같습니다.

  • 파일에 포함된 메타데이터를 유지합니다.
  • 파일에 태그와 같은 특성이 있을 수 있습니다.
  • 크기 조정에 더 비용 효율적이며 유지 관리가 용이합니다.
  • 빅 데이터, IoT(사물 인터넷), AI, Machine Learning 및 분석과 같은 많은 양의 데이터에 최적화되었습니다.
  • 높은 트랜잭션 또는 OLTP(온라인 트랜잭션 처리) 워크로드에는 권장되지 않습니다.

BACKUP TO URL 명령을 사용하여 백업 및 복원 시나리오에 S3 호환 개체 스토리지를 사용할 수도 있습니다. 자세한 내용은 S3 호환 개체 스토리지를 사용하여 SQL Server 백업 및 복원을 참조하세요.

S3 표준 프레임워크는 널리 채택되었으며, 많은 주요 스토리지 공급자는 이제 S3 호환 개체 스토리지 솔루션을 제공합니다. 솔루션이 S3 REST API와의 호환성을 제공하는 경우 SQL Server 2025와 호환됩니다. 지원되는 개체 스토리지 공급자 목록은 S3 호환 개체 스토리지 공급자를 참조하세요.

일부 개체 스토리지 파트너는 현재 스토리지를 가상화할 수 있는 소프트웨어로 솔루션을 실행하는 기능을 제공합니다. 사용자 고유의 컴퓨터 또는 VM(가상 머신)에 이러한 솔루션을 설치하고 사용해 볼 수 있습니다.

PolyBase 서비스와 PolyBase REST API 기능 비교

PolyBase를 사용하려면 외부 데이터에 대한 PolyBase 쿼리 서비스를 설치하고 다음을 사용하여 sp_configure인스턴스 수준에서 PolyBase를 사용하도록 설정해야 합니다. PolyBase 설치 프로그램은 두 개의 PolyBase 서비스인 SQL Server PolyBase 엔진SQL Server PolyBase 데이터 이동을 설치합니다.

  • SQL Server PolyBase 엔진

    • 서비스 실행 파일: mpdwsvc.exe -dweng
    • 쿼리를 구문 분석합니다.
    • 쿼리 계획을 생성합니다.
    • 작업을 컴퓨팅 노드에 배포합니다(SQL Server 2019).
    • 컴퓨팅 노드 결과 및 결과를 클라이언트로 다시 처리합니다(SQL Server 2019).
  • SQL Server PolyBase 데이터 이동

    • 서비스 실행 파일: mpdwsvc.exe -dms
    • 외부 데이터 원본과 PolyBase 헤드 및 컴퓨팅 노드 간에 데이터를 전송합니다(SQL Server 2019).
    • Azure Storage와 같은 다른 데이터 원본에 데이터를 삽입합니다.

SQL Server, Oracle, MongoDB 또는 ODBC 기반 원본과 같은 데이터 원본은 이러한 PolyBase 서비스를 사용합니다. SQL Server 2025 REST API 기반 PolyBase 아키텍처를 사용하는 데이터 원본은 이러한 서비스를 실행하거나 구성할 필요가 없지만 외부 데이터에 대한 PolyBase 쿼리 서비스를 계속 설치하고 사용하도록 설정해야 합니다.

PolyBase REST API를 사용하여 Azure Data Lake Storage, Azure Blob Storage, S3 호환 개체 스토리지 및 Parquet, Delta 및 CSV 파일과 같은 파일 형식에 액세스할 수 있습니다. 이전에 지원되었던 데이터 원본은 여전히 SQL Server PolyBase 엔진SQL Server PolyBase 데이터 이동 서비스를 사용합니다.

데이터 원본 PolyBase 서비스 PolyBase REST API 기능
Azure Blob Storage (애저 블롭 스토리지) 아니요 예
Azure Data Lake Storage 아니요 예
S3 호환 오브젝트 스토리지 아니요 예
SQL Server 예 아니요
Oracle 예 아니요
Teradata 예 아니요
MongoDB 또는 MongoDB용 Azure Cosmos DB API 예 아니요
제네릭 ODBC(Open Database Connectivity) 예 아니요
대량 작업 예 아니요