SQL Server 빅 데이터 클러스터의 마스터 풀 소개

아티클
03/28/2024

적용 대상: SQL Server 2019(15.x)

중요

Microsoft SQL Server 2019 빅 데이터 클러스터 추가 기능이 사용 중지됩니다. SQL Server 2019 빅 데이터 클러스터에 대한 지원은 2025년 2월 28일에 종료됩니다. Software Assurance를 사용하는 SQL Server 2019의 모든 기존 사용자는 플랫폼에서 완전히 지원되며, 소프트웨어는 지원 종료 시점까지 SQL Server 누적 업데이트를 통해 계속 유지 관리됩니다. 자세한 내용은 공지 블로그 게시물 및 Microsoft SQL Server 플랫폼의 빅 데이터 옵션을 참조하세요.

이 문서에서는 SQL Server 빅 데이터 클러스터에서 SQL Server 마스터 인스턴스의 역할을 설명합니다. 마스터 풀에는 SQL Server의 마스터 인스턴스가 포함됩니다. 마스터 인스턴스는 SQL Server 빅 데이터 클러스터에서 실행되는 SQL Server 인스턴스입니다. 마스터 인스턴스는 연결, 스케일 아웃 쿼리, 메타데이터 및 사용자 데이터베이스 및 Machine Learning Services를 관리합니다.

SQL Server 마스터 인스턴스는 다음과 같은 기능을 제공합니다.

연결

SQL Server 마스터 인스턴스는 클러스터에 대해 외부에서 액세스할 수 있는 TDS 엔드포인트를 제공합니다. 다른 SQL Server 인스턴스와 마찬가지로 애플리케이션 또는 SQL Server 도구(예: Azure Data Studio 또는 SQL Server Management Studio)를 이 엔드포인트에 연결할 수 있습니다.

스케일 아웃 쿼리 관리

SQL Server 마스터 인스턴스에는 컴퓨팅 풀의 노드에 있는 SQL Server 인스턴스 간에 쿼리를 분산하는 데 사용되는 스케일 아웃 쿼리 엔진이 포함되어 있습니다. 스케일 아웃 쿼리 엔진을 사용하면 추가 구성없이 Transact-SQL을 통해 클러스터의 모든 Hive 테이블에 액세스할 수도 있습니다.

메타데이터 및 사용자 데이터베이스

SQL 마스터 인스턴스에는 표준 SQL Server 시스템 데이터베이스 외에도 다음이 포함됩니다.

HDFS 테이블 메타데이터를 보유하는 메타데이터 데이터베이스입니다.
데이터 평면 분할된 데이터베이스 맵
클러스터 데이터 평면에 대한 액세스를 제공하는 외부 테이블의 세부 정보입니다.
사용자 데이터베이스에 정의된 PolyBase 외부 데이터 원본 및 외부 테이블입니다.

SQL Server 마스터 인스턴스에 사용자 데이터베이스를 추가하도록 선택할 수도 있습니다.

Machine Learning Services

SQL Server Machine Learning Services 기능은 데이터베이스 엔진에 대한 추가 기능입니다. Machine Learning Services 기능은 SQL Server에서 Java, R 및 Python 코드를 실행하는 데 사용됩니다. 이 기능은 핵심 엔진 프로세스에서 외부 프로세스를 분리하는 SQL Server 확장성 프레임워크를 기반으로 하지만 저장 프로시저, R 또는 Python 문을 포함하는 T-SQL 스크립트, T-SQL을 포함하는 Java, R 또는 Python 코드로 관계형 데이터와 완전히 통합됩니다.

SQL Server 빅 데이터 클러스터의 일부로써 기계 학습 서비스는 기본적으로 SQL Server 마스터 인스턴스에서 사용할 수 있습니다. SQL Server 마스터 인스턴스에서 외부 스크립트 실행을 사용하도록 설정하면 sp_execute_external_script를 사용하여 Java, R 및 Python 스크립트를 실행할 수 있습니다.

빅 데이터 클러스터에 있는 Machine Learning Services의 장점

SQL Server 빅 데이터 클러스터를 사용하면 일반적으로 엔터프라이즈 데이터베이스에 저장된 차원 데이터에 빅 데이터를 쉽게 조인할 수 있습니다. 빅 데이터의 가치는 조직의 일부만 사용하는 것이 아니라 보고서, 대시보드 및 애플리케이션에도 포함될 때 크게 증가합니다. 동시에 데이터 과학자는 Spark/HDFS 에코시스템 도구를 계속 사용하고 SQL Server 마스터 인스턴스 및 SQL Server 마스터 인스턴스를 통해 액세스할 수 있는 외부 데이터 원본의 데이터에 간편하게 실시간으로 액세스할 수 있습니다.

SQL Server 빅 데이터 클러스터를 사용하면 엔터프라이즈 데이터 레이크를 사용하여 더 많은 작업을 수행할 수 있습니다. SQL Server 개발자와 분석가는 다음 작업을 수행할 수 있습니다.

엔터프라이즈 데이터 레이크의 데이터를 사용하는 애플리케이션을 빌드합니다.
Transact-SQL 쿼리를 사용하는 모든 데이터를 추론합니다.
SQL Server 도구 및 애플리케이션의 기존 에코시스템을 사용하여 엔터프라이즈 데이터에 액세스하고 분석합니다.
데이터 가상화 및 데이터 마트를 통해 데이터 이동의 필요성을 줄입니다.
빅 데이터 시나리오에 Spark를 계속 사용합니다.
Spark 또는 SQL Server를 사용하여 데이터 레이크를 통해 모델을 학습시키는 지능형 엔터프라이즈 애플리케이션을 빌드합니다.
최상의 성능을 위해 프로덕션 데이터베이스에서 모델을 운영합니다.
실시간 분석을 위해 엔터프라이즈 데이터 마트로 직접 데이터를 스트리밍합니다.
대화형 분석 및 BI 도구를 사용하여 시각적으로 데이터를 탐색합니다.

다음 단계

SQL Server 빅 데이터 클러스터에 대한 자세한 내용은 다음 리소스를 참조하세요.