Azure Data Factory 또는 Synapse Analytics를 사용하여 Azure Database for PostgreSQL 데이터 복사 및 변환

적용 대상: Azure Data Factory Azure Synapse Analytics

팁

Microsoft Fabric의 데이터 팩토리는 더 간단한 아키텍처, 기본 제공 AI 및 새로운 기능을 갖춘 차세대 Azure 데이터 팩토리입니다. 데이터 통합을 접하는 경우 Fabric Data Factory부터 시작합니다. 기존 ADF 워크로드는 Fabric 업그레이드하여 데이터 과학, 실시간 분석 및 보고 전반에 걸쳐 새로운 기능에 액세스할 수 있습니다.

Fabric 무료 평가판을 시작합니다.
Microsoft Fabric의 Data Factory로 Azure Data Factory를 업그레이드합니다

이 문서에서는 Azure Data Factory 및 Synapse Analytics 파이프라인에서 복사 작업을 사용하여 Azure Database for PostgreSQL 데이터를 복사하는 방법을 간략하게 설명합니다. 또한 Data Flow 사용하여 Azure Database for PostgreSQL 데이터를 변환하는 방법입니다. 자세한 내용은 Azure Data Factory 및 Synapse Analytics 대한 소개 문서를 참조하세요.

중요합니다

Azure Database for PostgreSQL 버전 2.0은 향상된 네이티브 Azure Database for PostgreSQL 지원을 제공합니다. 솔루션에서 Azure Database for PostgreSQL 버전 1.0을 사용하는 경우 가장 빠른 편의를 위해 Azure Database for PostgreSQL 커넥터 업그레이드하는 것이 좋습니다.

이 커넥터는 Azure Database for PostgreSQL 서비스 특수화되어 있습니다. 온-프레미스 또는 클라우드에 있는 일반 PostgreSQL 데이터베이스에서 데이터를 복사하려면 PostgreSQL 커넥터를 사용하세요.

지원되는 기능

이 Azure Database for PostgreSQL 커넥터는 다음 기능에 대해 지원됩니다.

지원되는 기능	적외선	커넥터 지원 버전
복사 작업(소스/싱크)	(1) (2)	1.0 및 2.0
매핑 데이터 흐름(원본/싱크)	①	1.0 및 2.0
조회 작업	(1) (2)	1.0 및 2.0
스크립트 작업	(1) (2)	2.0

(1) Azure 통합 런타임(2) 자체 호스팅 통합 런타임

세 가지 활동은 Azure Database for PostgreSQL Single Server, Flexible Server, 및 Azure Cosmos DB for PostgreSQL에서 작동합니다.

중요합니다

Azure Database for PostgreSQL 단일 서버는 2025년 3월 28일에 사용 중지됩니다. 해당 날짜까지 유연한 서버로 마이그레이션합니다. 마이그레이션 지침은 이 문서 및 FAQ 를 참조할 수 있습니다.

시작

파이프라인에 복사 작업을 수행하려면 다음 도구 또는 SDK 중 하나를 사용하면 됩니다.

UI를 사용하여 Azure Database for PostgreSQL 연결된 서비스 만들기

Azure portal UI에서 PostgreSQL용 Azure 데이터베이스에 대한 연결된 서비스를 만들려면 다음 단계를 따르십시오.

Azure Data Factory 또는 Synapse 작업 영역에서 관리 탭으로 이동하고 연결된 서비스를 선택한 다음 새로 만들기를 선택합니다.
- Azure Data Factory
- Azure Synapse
PostgreSQL을 검색하고 PostgreSQL 커넥터에 대한 Azure 데이터베이스를 선택합니다.
서비스 세부 정보를 구성하고 연결을 테스트하고 새 연결된 서비스를 만듭니다.

커넥터 구성 세부 정보

다음 섹션에서는 Azure Database for PostgreSQL 커넥터에 한정된 Data Factory 엔터티를 정의하는 데 사용되는 속성에 대해 자세히 설명합니다.

연결된 서비스 속성

Azure Database for PostgreSQL 커넥터 버전 2.0 TLS(전송 계층 보안) 1.3 및 여러 SSL(Secureed Socket Layer) 모드를 지원합니다. 버전 1.0에서 Azure SQL Database 커넥터 버전을 업그레이드하려면 이 section을 참조하세요. 속성 세부 정보는 해당 섹션을 참조하세요.

버전 2.0
버전 1.0

버전 2.0

버전 2.0을 적용할 때 Azure Database for PostgreSQL 연결된 서비스에 대해 지원되는 속성은 다음과 같습니다.

속성	설명	필수
유형	type 속성은 AzurePostgreSql로 설정해야 합니다.	예
버전	지정한 버전입니다. 값은 `2.0`입니다.	예
인증유형	기본, 서비스 주체, 시스템 할당 관리 ID 또는 사용자 할당 관리 ID 인증 유형 중에서 선택	예
서버	호스트 이름과 Azure Database for PostgreSQL 실행 중인 포트를 선택적으로 지정합니다.	예
항구	Azure Database for PostgreSQL 서버의 TCP 포트입니다. 기본값은 `5432`입니다.	아니요
데이터베이스	연결할 Azure Database for PostgreSQL 데이터베이스의 이름입니다.	예
SSL 모드	서버 지원에 따라 SSL 사용 여부를 제어합니다. - 사용 안 함: SSL을 사용할 수 없습니다. 서버에 SSL이 필요한 경우 연결이 실패합니다. - 허용: 서버에서 허용하는 경우 SSL이 아닌 연결을 선호하지만 SSL 연결은 허용합니다. - 기본 설정: 서버에서 허용하는 경우 SSL 연결을 선호하지만 SSL 없이 연결을 허용합니다. - 필수: 서버가 SSL을 지원하지 않는 경우 연결이 실패합니다. - Verify_ca: 서버가 SSL을 지원하지 않으면 연결이 실패합니다. 또한 서버 인증서를 확인합니다. - Verify_full: 서버가 SSL을 지원하지 않으면 연결이 실패합니다. 또한 호스트 이름으로 서버 인증서를 확인합니다. 옵션: 비활성화 (Disabled) (0) / 허용 (Allow) (1) / 선호 (Preferred) (2) (기본 설정) / 필수 (Required) (3) / 검증_ca (Verify_ca) (4) / 검증_완료 (Verify_full) (5)	아니요
커넥트비아	이 속성은 데이터 저장소에 연결하는 데 사용할 통합 런타임을 나타냅니다. 데이터 저장소가 프라이빗 네트워크에 있는 경우 Azure Integration Runtime 또는 자체 호스팅 Integration Runtime 사용할 수 있습니다. 지정하지 않으면 기본 Azure Integration Runtime 사용합니다.	아니요
추가 연결 속성:
schema(스키마)	스키마 검색 경로를 설정합니다.	아니요
풀링	연결 풀링을 사용해야 하는지 여부를 나타냅니다.	아니요
connectionTimeout	연결을 시도하다가 중단하고 오류를 생성하기 전에 대기할 시간(초 단위)입니다.	아니요
commandTimeout	명령을 실행하려고 시도할 때 기다릴 시간(초 단위)으로, 시도가 종료되고 오류가 생성되기 전까지의 시간을 나타냅니다. 무한대를 나타내려면 영으로 설정하십시오.	아니요
trustServerCertificate	서버 인증서의 유효성을 검사하지 않고 신뢰할지 여부를 나타냅니다.	아니요
읽기 버퍼 크기	Npgsql이 읽을 때 사용하는 내부 버퍼의 크기를 결정합니다. 데이터베이스에서 큰 값을 전송하는 경우 증가시키면 성능이 개선될 수 있습니다.	아니요
시간대	세션 시간대를 가져오거나 설정합니다.	아니요
인코딩	PostgreSQL 문자열 데이터를 인코딩/디코딩하기 위한 .NET 인코딩을 가져오거나 설정합니다.	아니요

기본 인증

속성	설명	필수
사용자 이름	연결할 사용자 이름. IntegratedSecurity를 사용하는 경우에는 필요하지 않습니다.	예
암호	연결에 사용하는 암호. IntegratedSecurity를 사용하는 경우에는 필요하지 않습니다. 이 필드를 SecureString으로 표시하여 안전하게 저장합니다. 또는 Azure Key Vault 저장된 비밀을 참조할 수 있습니다.	예

예:

{
    "name": "AzurePostgreSqlLinkedService",
    "properties": {
        "type": "AzurePostgreSql",
        "version": "2.0",
        "typeProperties": {
            "server": "<server name>",
            "port": "5432",
            "database": "<database name>",
            "sslMode": 2,
            "username": "<user name>",
            "password": {
                "type": "SecureString",
                "value": "<password>"
            }
        }
    }
}

예:

Azure Key Vault에 암호를 저장합니다

{
    "name": "AzurePostgreSqlLinkedService",
    "properties": {
        "type": "AzurePostgreSql",
        "version": "2.0",
        "typeProperties": {
            "server": "<server name>",
            "port": "5432",
            "database": "<database name>",
            "sslMode": 2,
            "username": "<user name>",
            "password": { 
                "type": "AzureKeyVaultSecret", 
                "store": { 
                    "referenceName": "<Azure Key Vault linked service name>", 
                    "type": "LinkedServiceReference" 
                }, 
                "secretName": "<secretName>" 
            }
        }
    }
}

시스템이 할당한 관리 ID 인증

데이터 팩터리 또는 Synapse 작업 영역은 Azure의 다른 리소스에 인증할 때 서비스를 나타내는 시스템 할당 관리 ID와 연결할 수 있습니다. PostgreSQL 인증을 위해 Azure 데이터베이스에 이 관리 ID를 사용할 수 있습니다. 지정된 Factory 또는 Synapse 작업 영역은 이 ID를 사용하여 데이터베이스에 액세스하고 해당 데이터베이스 간에 데이터를 복사할 수 있습니다.

시스템 할당 관리 ID를 사용하려면 다음 단계를 수행합니다.

데이터 팩터리 또는 Synapse 작업 영역을 시스템 할당 관리 ID와 연결할 수 있습니다. 자세한 정보, 시스템 할당 관리 ID 생성
시스템이 할당한 관리 ID On PostgreSQL에 대한 Azure 데이터입니다.

Azure 데이터베이스의 PostgreSQL 서버에 대한 시스템에 할당된 관리 ID 구성의 스크린샷.
보안에 있는 Azure Database for PostgreSQL 리소스
1. 인증 선택
2. Microsoft Entra 인증만 또는 PostgreSQL 및 Microsoft Entra 인증 인증 방법 중 하나를 선택합니다.
3. + Microsoft Entra 관리자 추가를 선택하세요.
4. Azure Data Factory 리소스에 대한 시스템 할당 관리 ID를 Microsoft Entra Administrators
  
  Azure Database for PostgreSQL 구성에서 시스템 할당 관리 ID를 추가하는 스크린샷입니다.
PostgreSQL 연결된 서비스에 대한 Azure 데이터베이스를 구성합니다.

예제:

{
    "name": "AzurePostgreSqlLinkedService",
    "type": "Microsoft.DataFactory/factories/linkedservices",
    "properties": {
        "annotations": [],
        "type": "AzurePostgreSql",
        "version": "2.0",
        "typeProperties": {
            "server": "<server name>",
            "port": 5432,
            "database": "<database name>",
            "sslMode": 2,
            "authenticationType": "SystemAssignedManagedIdentity"
        }
    }
}

비고

이 인증 유형은 자체 호스팅 통합 런타임에서 지원되지 않습니다.

사용자가 할당한 관리 ID 인증

데이터 팩터리나 Synapse 작업 영역은 Azure의 다른 리소스에 인증할 때 서비스를 나타내는 사용자 할당 관리 ID와 연결할 수 있습니다. PostgreSQL 인증을 위해 Azure 데이터베이스에 이 관리 ID를 사용할 수 있습니다. 지정된 Factory 또는 Synapse 작업 영역은 이 ID를 사용하여 데이터베이스에 액세스하고 해당 데이터베이스 간에 데이터를 복사할 수 있습니다.

사용자가 할당한 관리 ID를 사용하려면 앞 섹션에서 설명한 일반 속성 외에 다음 속성을 지정합니다.

속성	설명	필수
자격 증명(credential)	사용자가 할당한 관리 ID를 자격 증명 개체로 지정합니다.	예

또한 다음 단계를 수행해야 합니다.

Azure Portal에서 사용자 할당 관리 ID 리소스를 생성해야 합니다. 자세한 내용은 사용자 할당 관리 ID 관리로 이동합니다.
postgreSQL 리소스에 대한 Azure 데이터베이스에 사용자 할당 관리 ID 할당
1. Azure 데이터베이스의 PostgreSQL 서버 리소스에서 보안 아래
2. 인증 선택
3. 인증 방법이 Microsoft Entra 인증만 또는 PostgreSQL 및 Microsoft Entra 인증인지 확인합니다
4. + Microsoft Entra 관리자 추가 링크를 선택하고 사용자 할당 관리 ID를 선택합니다.
Azure Data Factory 리소스에 사용자 할당 관리 ID 할당
1. 설정을 선택한 다음 관리 ID 선택
2. 사용자 할당 탭 아래에 있습니다. + 링크 추가를 선택하고 사용자 관리 ID를 선택합니다.
  
  Azure Data Factory 리소스에서 사용자 할당 관리 ID 구성의 스크린샷.
PostgreSQL 연결된 서비스에 대한 Azure 데이터베이스를 구성합니다.

예제:

{
    "name": "AzurePostgreSqlLinkedService",
    "type": "Microsoft.DataFactory/factories/linkedservices",
    "properties": {
        "annotations": [],
        "type": "AzurePostgreSql",
        "version": "2.0",
        "typeProperties": {
            "server": "<server name>",
            "port": 5432,
            "database": "<database name>",
            "sslMode": 2,
            "authenticationType": "UserAssignedManagedIdentity",
            "credential": {
                "referenceName": "<your credential>",
                "type": "CredentialReference"
            }
        }
    }
}

서비스 주체 인증

속성	설명	필수
사용자 이름	서비스 주체의 표시 이름	예
테넌트	Azure Database for PostgreSQL 서버가 있는 테넌트	예
servicePrincipalId	서비스 주체의 애플리케이션 ID	예
servicePrincipalCredentialType	서비스 주체 인증서 또는 서비스 주체 키가 원하는 인증 방법인지 선택 - ServicePrincipalCert: 서비스 주체 인증서에 대한 서비스 주체 인증서로 설정합니다. - ServicePrincipalKey: 서비스 주체 키 인증을 위한 서비스 주체 키로 설정합니다.	예
servicePrincipalKey	클라이언트 비밀 값입니다. 서비스 주체 키를 선택할 때 사용됩니다.	예
Azure 클라우드 유형	Azure Database for PostgreSQL 서버의 Azure 클라우드 유형 선택	예
servicePrincipalEmbeddedCert	서비스 주체 인증서 파일	예
servicePrincipalEmbeddedCertPassword	필요한 경우 서비스 주체 인증서 암호	아니요

예:

서비스 주체 키

{
    "name": "AzurePostgreSqlLinkedService",
    "type": "Microsoft.DataFactory/factories/linkedservices",
    "properties": {
        "annotations": [],
        "type": "AzurePostgreSql",
        "version": "2.0",
        "typeProperties": {
            "server": "<server name>",
            "port": 5432,
            "database": "<database name>",
            "sslMode": 2,
            "username": "<service principal name>",
            "authenticationType": "<authentication type>",
            "tenant": "<tenant>",
            "servicePrincipalId": "<service principal ID>",
            "azureCloudType": "<azure cloud type>",
            "servicePrincipalCredentialType": "<service principal type>",
            "servicePrincipalKey": "<service principal key>"
        }
    }
}

예:

서비스 주체 인증서

{
    "name": "AzurePostgreSqlLinkedService",
    "type": "Microsoft.DataFactory/factories/linkedservices",
    "properties": {
        "annotations": [],
        "type": "AzurePostgreSql",
        "version": "2.0",
        "typeProperties": {
            "server": "<server name>",
            "port": 5432,
            "database": "<database name>",
            "sslMode": 2,
            "username": "<service principal name>",
            "authenticationType": "<authentication type>",
            "tenant": "<tenant>",
            "servicePrincipalId": "<service principal ID>",
            "azureCloudType": "<azure cloud type>",
            "servicePrincipalCredentialType": "<service principal type>",
            "servicePrincipalEmbeddedCert": "<service principal certificate>",
            "servicePrincipalEmbeddedCertPassword": "<service principal embedded certificate password>"
        }
    }
}

비고

서비스 주체 및 사용자 할당 관리 ID를 사용하는 Microsoft Entra ID 인증은 자체 호스팅 통합 런타임 버전 5.50 이상에서 지원됩니다.

버전 1.0

버전 1.0을 적용할 때 Azure Database for PostgreSQL 연결된 서비스에 대해 지원되는 속성은 다음과 같습니다.

속성	설명	필수
유형	type 속성은 AzurePostgreSql로 설정해야 합니다.	예
버전	지정한 버전입니다. 값은 `1.0`입니다.	예
connectionString	Azure Database for PostgreSQL에 연결하기 위한 Npgsql 연결 문자열입니다. Azure Key Vault에 암호를 저장하고 connection string에서 `password` 구성을 추출할 수도 있습니다. 자세한 내용은 다음 샘플 및 Azure Key Vault의 저장소 자격 증명을 참조하세요.	예
커넥트비아	이 속성은 데이터 저장소에 연결하는 데 사용할 통합 런타임을 나타냅니다. 데이터 저장소가 프라이빗 네트워크에 있는 경우 Azure Integration Runtime 또는 자체 호스팅 Integration Runtime 사용할 수 있습니다. 지정하지 않으면 기본 Azure Integration Runtime 사용합니다.	아니요

일반적인 연결 문자열은 host=<server>.postgres.database.azure.com;database=<database>;port=<port>;uid=<username>;password=<password>입니다. 사례에 따라 설정할 수 있는 추가 속성은 다음과 같습니다.

속성	설명	옵션	필수
EncryptionMethod(EM)	드라이버와 데이터베이스 서버 간에 전송되는 데이터를 암호화하기 위해 드라이버에서 사용하는 메서드입니다. 예를 들어 `EncryptionMethod=<0/1/6>;`	0(암호화 없음)(기본값) / 1(SSL) / 6(RequestSSL)	아니요
ValidateServerCertificate(VSC)	SSL 암호화를 사용할 때(암호화 메서드=1) 데이터베이스 서버에서 보내는 인증서의 유효성을 드라이버가 검사하는지 여부를 결정합니다. 예를 들어 `ValidateServerCertificate=<0/1>;`	0(사용 안 함)(기본값) / 1(사용)	아니요

예:

{
    "name": "AzurePostgreSqlLinkedService",
    "properties": {
        "type": "AzurePostgreSql",
        "version": "1.0",
        "typeProperties": {
            "connectionString": "host=<server>.postgres.database.azure.com;database=<database>;port=<port>;uid=<username>;password=<password>"
        }
    }
}

예:

Azure Key Vault에 암호를 저장합니다

{
    "name": "AzurePostgreSqlLinkedService",
    "properties": {
        "type": "AzurePostgreSql",
        "version": "1.0",
        "typeProperties": {
            "connectionString": "host=<server>.postgres.database.azure.com;database=<database>;port=<port>;uid=<username>;",
            "password": { 
                "type": "AzureKeyVaultSecret", 
                "store": { 
                    "referenceName": "<Azure Key Vault linked service name>", 
                    "type": "LinkedServiceReference" 
                }, 
                "secretName": "<secretName>" 
            }
        }
    }
}

데이터 세트 속성

데이터 세트 정의에 사용할 수 있는 섹션 및 속성의 전체 목록은 데이터 세트를 참조하세요. 이 섹션에서는 Azure Database for PostgreSQL 데이터 세트에 지원하는 속성 목록을 제공합니다.

Azure Database for PostgreSQL 데이터를 복사하려면 데이터 세트의 type 속성을 AzurePostgreSqlTable로 설정합니다. 다음과 같은 속성이 지원됩니다.

속성	설명	필수
유형	데이터 세트의 type 속성을 AzurePostgreSqlTable로 설정해야 합니다.	예
schema(스키마)	스키마의 이름입니다.	아니요(작업 원본에서 "query"가 지정된 경우)
테이블	테이블/뷰의 이름입니다.	아니요(작업 원본에서 "query"가 지정된 경우)
테이블 이름	테이블 이름. 이 속성은 이전 버전과의 호환성을 위해 지원됩니다. 새 워크로드의 경우 `schema` 및 `table`을 사용합니다.	아니요(작업 원본에서 "query"가 지정된 경우)

예:

{
    "name": "AzurePostgreSqlDataset",
    "properties": {
        "type": "AzurePostgreSqlTable",
        "linkedServiceName": {
            "referenceName": "<AzurePostgreSql linked service name>",
            "type": "LinkedServiceReference"
        },
        "typeProperties": {
            "schema": "<schema_name>",
            "table": "<table_name>"
        }
    }
}

Copy activity 속성

작업 정의에 사용할 수 있는 섹션 및 속성의 전체 목록은 파이프라인 및 작업을 참조하세요. 이 섹션에서는 Azure Database for PostgreSQL 원본에서 지원하는 속성 목록을 제공합니다.

Azure Database for PostgreSql을 원본으로

Azure Database for PostgreSQL 데이터를 복사하려면 복사 작업의 원본 형식을 AzurePostgreSqlSource로 설정합니다. 복사 작업 source 섹션에서 다음 속성이 지원됩니다.

속성	설명	필수
유형	복사 작업 원본의 type 속성은 AzurePostgreSqlSource로 설정해야 합니다.	예
문의	사용자 지정 SQL 쿼리를 사용하여 데이터를 읽습니다. 예를 들어 `SELECT * FROM mytable` 또는 `SELECT * FROM "MyTable"`입니다. PostgreSQL에서 엔터티 이름은 따옴표로 묶지 않은 경우 대/소문자를 구분하지 않는 것으로 취급됩니다.	아니요(데이터 세트에서 tableName 속성이 지정된 경우)
queryTimeout	명령 실행 시도를 종료하고 오류를 생성하기 전의 대기 시간이며 기본값은 120분입니다. 이 속성에 대해 매개 변수가 설정된 경우 허용되는 값은 "02:00:00"(120분)과 같은 시간 범위입니다. 자세한 내용은 CommandTimeout을 참조하세요.	아니요
파티션 옵션	Azure SQL Database 데이터를 로드하는 데 사용되는 데이터 분할 옵션을 지정합니다. 허용되는 값은 None(기본값), PhysicalPartitionsOfTable 및 DynamicRange입니다. 파티션 옵션을 사용하는 경우(즉, `None` 아님) Azure SQL Database 데이터를 동시에 로드하는 병렬 처리 수준은 복사 작업의 `parallelCopies` 설정에 의해 제어됩니다.	아니요
파티션 설정	데이터 분할에 대한 설정 그룹을 지정합니다. 파티션 옵션이 `None`이 아닌 경우 적용됩니다.	아니요
`partitionSettings`에서:
파티션 이름	복사해야 하는 물리적 파티션 목록입니다. 파티션 옵션이 `PhysicalPartitionsOfTable`인 경우에 적용됩니다. 쿼리를 사용하여 원본 데이터를 검색하는 경우 WHERE 절에서 `?AdfTabularPartitionName`를 후크합니다. 예를 들어 Azure Database for PostgreSQL 섹션의 병렬 복사를 참조하세요.	아니요
partitionColumnName	병렬 복사를 위해 범위 분할에서 사용할 원본 열의 이름을 정수, 날짜 또는 날짜/시간 형식(`int`, `smallint`, `bigint`, `date`, `timestamp without time zone`, `timestamp with time zone` 또는 `time without time zone`)으로 지정합니다. 지정하지 않으면 테이블의 기본 키가 자동으로 검색되어 파티션 열로 사용됩니다. 파티션 옵션이 `DynamicRange`인 경우에 적용됩니다. 쿼리를 사용하여 원본 데이터를 검색하는 경우 WHERE 절에서 `?AdfRangePartitionColumnName` 를 후크합니다. 예를 들어 Azure Database for PostgreSQL 섹션의 병렬 복사를 참조하세요.	아니요
파티션 상한值	데이터를 복사할 파티션 열의 최대값입니다. 파티션 옵션이 `DynamicRange`인 경우에 적용됩니다. 쿼리를 사용하여 원본 데이터를 검색하는 경우 WHERE 절에서 `?AdfRangePartitionUpbound`를 후크합니다. 예를 들어 Azure Database for PostgreSQL 섹션의 병렬 복사를 참조하세요.	아니요
파티션 하한값 (partitionLowerBound)	데이터를 복사할 파티션 열의 최소값입니다. 파티션 옵션이 `DynamicRange`인 경우에 적용됩니다. 쿼리를 사용하여 원본 데이터를 검색하는 경우 WHERE 절에서 `?AdfRangePartitionLowbound`를 후크합니다. 예를 들어 Azure Database for PostgreSQL 섹션의 병렬 복사를 참조하세요.	아니요

예:

"activities":[
    {
        "name": "CopyFromAzurePostgreSql",
        "type": "Copy",
        "inputs": [
            {
                "referenceName": "<AzurePostgreSql input dataset name>",
                "type": "DatasetReference"
            }
        ],
        "outputs": [
            {
                "referenceName": "<output dataset name>",
                "type": "DatasetReference"
            }
        ],
        "typeProperties": {
            "source": {
                "type": "AzurePostgreSqlSource",
                "query": "<custom query e.g. SELECT * FROM mytable>",
                "queryTimeout": "00:10:00"
            },
            "sink": {
                "type": "<sink type>"
            }
        }
    }
]

Azure Database for PostgreSQL를 싱크로 사용하기

데이터를 Azure Database for PostgreSQL 복사하려면 복사 작업의 싱크 형식을 SqlSink로 설정합니다. 복사 작업 sink 섹션에서 다음 속성이 지원됩니다.

속성	설명	필수	커넥터 지원 버전
유형	복사 작업 싱크의 type 속성은 AzurePostgreSQLSink로 설정해야 합니다.	예	버전 1.0 및 버전 2.0
프리카피스크립트	각 실행에서 데이터를 Azure Database for PostgreSQL 쓰기 전에 실행할 복사 작업에 대한 SQL 쿼리를 지정합니다. 이 속성을 사용하여 미리 로드된 데이터를 정리할 수 있습니다.	아니요	버전 1.0 및 버전 2.0
writeMethod	Azure Database for PostgreSQL 데이터를 쓰는 데 사용되는 메서드입니다. 허용되는 값은 CopyCommand (기본값, 성능이 더 높음), BulkInsert 및 Upsert (버전 2.0에만 해당)입니다.	아니요	버전 1.0 및 버전 2.0
upsertSettings	쓰기 동작에 대한 설정 그룹을 지정합니다. WriteBehavior 옵션이 `Upsert`인 경우 적용합니다.	아니요	버전 2.0
`upsertSettings`에서:
키	고유한 행 식별을 위한 열 이름을 지정합니다. 단일 키 또는 일련의 키를 사용할 수 있습니다. 키는 기본 키 또는 고유 열이어야 합니다. 지정하지 않으면 기본 키가 사용됩니다.	아니요	버전 2.0
writeBatchSize	일괄 처리당 Azure Database for PostgreSQL 로드된 행 수입니다. 허용되는 값은 행 수를 나타내는 정수입니다.	아니요(기본값: 1,000,000)	버전 1.0 및 버전 2.0
writeBatchTimeout	시간이 초과되기 전에 완료하려는 배치 삽입 작업을 위한 대기 시간입니다. 허용되는 값은 시간 범위 문자열입니다. 예를 들어 "00:30:00"(30분)입니다.	아니요(기본값: 00:00:30)	버전 1.0 및 버전 2.0

예제 1: 복사 명령

"activities":[
    {
        "name": "CopyToAzureDatabaseForPostgreSQL",
        "type": "Copy",
        "inputs": [
            {
                "referenceName": "<input dataset name>",
                "type": "DatasetReference"
            }
        ],
        "outputs": [
            {
                "referenceName": "<Azure PostgreSQL output dataset name>",
                "type": "DatasetReference"
            }
        ],
        "typeProperties": {
            "source": {
                "type": "<source type>"
            },
            "sink": {
                "type": "AzurePostgreSqlSink",
                "preCopyScript": "<custom SQL script>",
                "writeMethod": "CopyCommand",
                "writeBatchSize": 1000000
            }
        }
    }
]

예제 2: 데이터 Upsert

"activities":[
    {
        "name": "CopyToAzureDatabaseForPostgreSQL",
        "type": "Copy",
        "inputs": [
            {
                "referenceName": "<input dataset name>",
                "type": "DatasetReference"
            }
        ],
        "outputs": [
            {
                "referenceName": "<Azure PostgreSQL output dataset name>",
                "type": "DatasetReference"
            }
        ],
        "typeProperties": {
            "source": {
                "type": "<source type>"
            },
            "sink": {
                "type": "AzurePostgreSQLSink",
                "writeMethod": "Upsert",
                "upsertSettings": {
                    "keys": [
                        "<column name>"
                    ]
                },
            }
        }
    }
]

데이터 Upsert

Copy activity 기본적으로 upsert 작업을 지원합니다. upsert를 수행하려면 사용자는 기본 키 또는 고유한 열인 키 열을 제공해야 합니다. 사용자가 키 열을 제공하지 않으면 싱크 테이블의 기본 키 열이 사용됩니다. 복사 작업은 키 열 값이 원본 테이블의 값과 일치하는 싱크 테이블의 키가 아닌 열을 업데이트합니다. 그렇지 않으면 새 데이터를 삽입합니다.

Azure Database for PostgreSQL에서 병렬 복사

복사 작업의 Azure Database for PostgreSQL 커넥터는 데이터를 병렬로 복사하는 기본 제공 데이터 분할을 제공합니다. 복사 작업의 원본 탭에서 데이터 분할 옵션을 찾을 수 있습니다.

파티션 옵션의 스크린샷

분할된 복사를 사용하도록 설정하면 복사 작업은 Azure Database for PostgreSQL 원본에 대해 병렬 쿼리를 실행하여 파티션별로 데이터를 로드합니다. 병렬 수준은 복사 작업의 parallelCopies 설정에 의해 제어됩니다. 예를 들어 parallelCopies 4로 설정하면 서비스는 지정된 파티션 옵션 및 설정에 따라 4개의 쿼리를 동시에 생성하고 실행하며 각 쿼리는 Azure Database for PostgreSQL 데이터의 일부를 검색합니다.

특히 Azure Database for PostgreSQL 대량의 데이터를 로드할 때 데이터 분할을 사용하여 병렬 복사를 사용하도록 설정하는 것이 좋습니다. 다양한 시나리오에 대해 권장되는 구성은 다음과 같습니다. 데이터를 파일 기반 데이터 저장소로 복사할 때는 폴더에 여러 파일(폴더 이름만 지정)으로 쓰는 것이 좋습니다. 이 경우 단일 파일에 쓰는 것보다 성능이 더 좋습니다.

시나리오	제안된 설정
실제 파티션이 있는 대형 테이블에서 전체 로드	파티션 옵션: 테이블의 실제 파티션 실행하는 동안 서비스에서 실제 파티션을 자동으로 검색하여 데이터를 파티션별로 복사합니다.
데이터 분할을 위해 물리적 파티션을 사용하지 않지만 정수 열을 사용하여 대형 테이블에서 전체 로드합니다.	파티션 옵션: 동적 범위 파티션입니다. 파티션 열: 데이터를 분할하는 데 사용되는 열을 지정합니다. 지정하지 않으면 기본 키 열이 사용됩니다.
사용자 지정 쿼리를 사용하여 물리적 파티션과 함께 대량의 데이터를 로드합니다.	파티션 옵션: 테이블의 실제 파티션 쿼리:`SELECT * FROM ?AdfTabularPartitionName WHERE <your_additional_where_clause>`. 파티션 이름: 데이터를 복사할 하나 이상의 파티션 이름을 지정합니다. 지정하지 않으면 서비스는 PostgreSQL 데이터 세트에서 지정한 테이블의 물리적 파티션을 자동으로 검색합니다. 실행하는 동안 서비스는 `?AdfTabularPartitionName` 실제 파티션 이름으로 바꾸고 Azure Database for PostgreSQL 보냅니다.
물리적 파티션이 없는 사용자 지정 쿼리를 사용하여 대량의 데이터를 로드하는 동시에 데이터 분할을 위한 정수 열을 사용합니다.	파티션 옵션: 동적 범위 파티션입니다. 쿼리:`SELECT * FROM ?AdfTabularPartitionName WHERE ?AdfRangePartitionColumnName <= ?AdfRangePartitionUpbound AND ?AdfRangePartitionColumnName >= ?AdfRangePartitionLowbound AND <your_additional_where_clause>`. 파티션 열: 데이터를 분할하는 데 사용되는 열을 지정합니다. 정수, 날짜 또는 날짜/시간 데이터 형식의 열에 대해 분할할 수 있습니다. 파티션 상한 및 파티션 하한: 파티션 열에 대해 필터링하려는 하한과 상한 범위 사이에서만 데이터를 검색하도록 지정합니다. 실행하는 동안 서비스는 `?AdfRangePartitionColumnName`, `?AdfRangePartitionUpbound` 및 `?AdfRangePartitionLowbound` 각 파티션에 대한 실제 열 이름 및 값 범위로 대체하고 Azure Database for PostgreSQL 보냅니다. 예를 들어 파티션 열 "ID"가 하한을 1로 설정하고 상한을 80으로 설정하고 병렬 복사가 4로 설정된 경우 서비스는 4개의 파티션으로 데이터를 검색합니다. 해당 ID는 [1, 20], [21, 40], [41, 60] 및 [61, 80] 사이에 각각 있습니다.

파티션 옵션을 사용하여 데이터를 로드하는 모범 사례:

데이터 기울이기를 방지하려면 고유한 열(예: 기본 키 또는 고유 키)을 분할 열로 선택합니다.
테이블에 기본 제공 파티션이 있는 경우 "테이블의 실제 파티션" 파티션 옵션을 사용하여 성능을 향상시킵니다.
Azure Integration Runtime 사용하여 데이터를 복사하는 경우 더 큰 "데이터 통합 단위)"(>4)를 설정하여 더 많은 컴퓨팅 리소스를 활용할 수 있습니다. 여기서 적용 가능한 시나리오를 확인합니다.
"복사 병렬 처리 수준"은 파티션 번호를 제어하여 이 숫자를 너무 크게 설정하면 성능이 저하될 수 있습니다. 이 숫자를 (DIU 또는 자체 호스팅 IR 노드 수) * (2~4)로 설정하는 것이 좋습니다.

예제: 실제 파티션이 있는 대형 테이블에서 전체 로드

"source": {
    "type": "AzurePostgreSqlSource",
    "partitionOption": "PhysicalPartitionsOfTable"
}

예: 동적 범위 파티션이 있는 쿼리

"source": {
    "type": "AzurePostgreSqlSource",
    "query": "SELECT * FROM <TableName> WHERE ?AdfDynamicRangePartitionCondition AND <your_additional_where_clause>",
    "partitionOption": "DynamicRange",
    "partitionSettings": {
        "partitionColumnName": "<partition_column_name>",
        "partitionUpperBound": "<upper_value_of_partition_column (optional) to decide the partition stride, not as data filter>",
        "partitionLowerBound": "<lower_value_of_partition_column (optional) to decide the partition stride, not as data filter>"
    }
}

매핑 데이터 흐름 속성

매핑 데이터 흐름에서 데이터를 변환할 때 Azure Database for PostgreSQL 테이블을 읽고 쓸 수 있습니다. 자세한 내용은 매핑 데이터 흐름에서 원본 변환 및 싱크 변환을 참조하세요. Azure Database for PostgreSQL 데이터 세트 또는 인라인 데이터 세트를 원본 및 싱크 형식으로 사용하도록 선택할 수 있습니다.

비고

현재 매핑 데이터 흐름에서 V1 및 V2 버전의 Azure Database for PostgreSQL 커넥터 모두에 대해 기본 인증만 지원됩니다.

원본 변환

아래 표에서는 Azure Database for PostgreSQL 원본에서 지원하는 속성을 나열합니다. 이러한 속성은 원본 옵션 탭에서 편집할 수 있습니다.

이름	설명	필수	허용되는 값	데이터 흐름 스크립트 속성
테이블	테이블을 입력으로 선택하는 경우 데이터 흐름은 데이터 세트에 지정된 테이블에서 모든 데이터를 가져옵니다.	아니요	-	(인라인 데이터 세트에만 해당) 테이블 이름
쿼리	쿼리를 입력으로 선택하는 경우 원본에서 데이터를 가져올 SQL 쿼리를 지정하면 데이터 세트에서 지정한 테이블이 재정의됩니다. 쿼리를 사용하면 테스트 또는 조회를 위한 행을 줄일 수 있습니다. Order By 절은 지원되지 않지만 전체 SELECT FROM 문을 설정할 수 있습니다. 사용자 정의 테이블 함수를 사용할 수도 있습니다. *select from udfGetData()*는 데이터 흐름에서 사용할 수 있는 테이블을 반환하는 SQL의 UDF입니다. 쿼리 예: `select from mytable where customerId > 1000 and customerId < 2000` 또는 `select * from "MyTable"` PostgreSQL에서 엔터티 이름은 따옴표로 묶지 않은 경우 대/소문자를 구분하지 않는 것으로 취급됩니다.	아니요	String	문의
스키마 이름	저장 프로시저를 입력으로 선택하는 경우 저장 프로시저의 스키마 이름을 지정하거나 새로 고침을 선택하여 서비스에 스키마 이름을 검색하도록 요청합니다.	아니요	String	스키마이름
저장 프로시저	저장 프로시저를 입력으로 선택하는 경우 원본 테이블에서 데이터를 읽을 저장 프로시저의 이름을 지정하거나 새로 고침을 선택하여 서비스에 프로시저 이름을 검색하도록 요청합니다.	예(저장 프로시저를 입력으로 선택하는 경우)	String	procedureName
프로시저 매개 변수	저장 프로시저를 입력으로 선택하는 경우 프로시저에 설정된 순서대로 저장 프로시저에 대한 입력 매개 변수를 지정하거나 가져오기를 선택하여 `@paraName` 양식을 사용하여 모든 프로시저 매개 변수를 가져옵니다.	아니요	Array	입력
Batch 크기	일괄 처리 크기를 지정하여 대량 데이터를 일괄 처리로 청크합니다.	아니요	정수	batchSize
격리 수준	다음 격리 수준 중 하나를 선택합니다. - 커밋된 읽기 - 커밋되지 않은 읽기(기본값) - 반복 읽기 - 직렬화 가능 - 없음(격리 수준 무시)	아니요	READ_COMMITTED (읽기_커밋됨) READ_UNCOMMITTED 반복 가능한 읽기 직렬화 가능 없음	격리 수준

Azure Database for PostgreSQL 원본 스크립트 예제

Azure Database for PostgreSQL 원본 형식으로 사용하는 경우 연결된 데이터 흐름 스크립트는 다음과 같습니다.

source(allowSchemaDrift: true,
    validateSchema: false,
    isolationLevel: 'READ_UNCOMMITTED',
    query: 'select * from mytable',
    format: 'query') ~> AzurePostgreSQLSource

싱크 변환

아래 표에서는 Azure Database for PostgreSQL 싱크에서 지원하는 속성을 나열합니다. 해당 속성은 싱크 옵션 탭에서 편집할 수 있습니다.

이름	설명	필수	허용되는 값	데이터 흐름 스크립트 속성
Update 메서드	데이터베이스 대상에서 허용되는 작업을 지정합니다. 기본값은 삽입만 허용하는 것입니다. 행을 업데이트, upsert 또는 삭제하려면 해당 작업을 위해 행에 태그를 지정하는 데 행 변경 변환이 필요합니다.	예	`true` 또는 `false`	삭제할 수 있는 insertable 업데이트 가능 upsertable
키 열	업데이트, 삽입 및 삭제의 경우 변경할 행을 결정하기 위해 키 열을 설정해야 합니다. 키로 선택한 열 이름은 후속 업데이트인 upsert, delete의 일부로 사용됩니다. 따라서 싱크 매핑에 있는 열을 선택해야 합니다.	아니요	Array	키
키 열 쓰기 건너뛰기	키 열에 값을 쓰지 않으려면 “키 열 작성 건너뛰기”를 선택합니다.	아니요	`true` 또는 `false`	skipKeyWrites
테이블 작업	쓰기 전에 대상 테이블에서 모든 행을 다시 만들거나 제거할지 여부를 결정합니다. - 없음: 테이블에 대한 작업이 수행되지 않습니다. - 다시 만들기: 테이블이 삭제되고 다시 만들어집니다. 동적으로 새 테이블을 만드는 경우 필요합니다. - 자르기: 대상 테이블의 모든 행이 제거됩니다.	아니요	`true` 또는 `false`	재창조하다 절단하다
Batch 크기	각 일괄 처리에 작성되는 행 수를 지정합니다. 일괄 처리 크기가 클수록 압축 및 메모리 최적화가 향상되지만 데이터를 캐시할 때 메모리 부족 예외가 발생할 위험이 있습니다.	아니요	정수	batchSize
사용자 DB 스키마 선택	기본적으로 임시 테이블은 싱크 스키마 아래에 스테이징으로 만들어집니다. 또는 싱크 스키마 사용 옵션을 선택 취소하고 대신 Data Factory에서 스테이징 테이블을 만들어 업스트림 데이터를 로드하고 완료 시 자동으로 정리하는 스키마 이름을 지정할 수 있습니다. 데이터베이스에 대한 테이블 만들기 권한과 스키마에 대한 변경 권한이 있는지 확인합니다.	아니요	String	stagingSchemaName
사전 및 사후 SQL 스크립트	싱크 데이터베이스에 데이터를 기록하기 전(전처리) 및 후(후처리) 실행될 여러 줄 SQL 스크립트를 지정합니다.	아니요	String	preSQLs postSQLs

팁

여러 명령으로 단일 일괄 처리 스크립트를 여러 일괄 처리로 분할합니다.
단순 업데이트 횟수를 반환하는 DDL(데이터 정의 언어) 및 DML(데이터 조작 언어) 문만 일괄 처리의 일부로 실행할 수 있습니다. 일괄 처리 작업 수행의 자세한 정보

증분 추출 사용: 이 옵션을 사용하여 파이프라인이 마지막으로 실행된 이후 변경된 행만 처리하도록 ADF에 지시합니다.
증분 열: 증분 추출 기능을 사용하는 경우 원본 테이블에서 워터마크로 사용할 날짜/시간 또는 숫자 열을 선택해야 합니다.
처음부터 읽기 시작: 증분 추출을 사용하여 이 옵션을 설정하면 증분 추출이 켜져 있는 파이프라인의 첫 실행 시 ADF가 모든 행을 읽도록 지시합니다.

Azure Database for PostgreSQL 싱크 스크립트 예제

싱크 형식으로 Azure Database for PostgreSQL 사용하는 경우 연결된 데이터 흐름 스크립트는 다음과 같습니다.

IncomingStream sink(allowSchemaDrift: true,
    validateSchema: false,
    deletable:false,
    insertable:true,
    updateable:true,
    upsertable:true,
    keys:['keyColumn'],
    format: 'table',
    skipDuplicateMapInputs: true,
    skipDuplicateMapOutputs: true) ~> AzurePostgreSqlSink

스크립트 작업

중요합니다

스크립트 작업은 버전 2.0 커넥터에서만 지원됩니다.

중요합니다

출력 매개 변수를 사용하는 다중 쿼리 문은 지원되지 않습니다. 출력 쿼리를 동일하거나 다른 스크립트 작업 내에서 별도의 스크립트 블록으로 분할하는 것이 좋습니다.

위치 매개 변수를 사용하는 다중 쿼리 문은 지원되지 않습니다. 위치 쿼리를 동일하거나 다른 스크립트 작업 내에서 별도의 스크립트 블록으로 분할하는 것이 좋습니다.

스크립트 작업에 대한 자세한 내용은 스크립트 작업을 참조하세요.

조회 작업 속성

속성에 대한 자세한 내용은 조회 작업을 참조하세요.

PostgreSQL용 Azure Database 커넥터 업그레이드

연결된 서비스 편집 페이지에서 버전 아래에서 2.0을 선택하고 연결된 서비스 속성 버전 2.0을 참조하여 연결된 서비스를 구성합니다.

복사 작업에서 원본 및 싱크로 지원되는 데이터 저장소 목록은 지원되는 데이터 저장소를 참조하세요.

피드백

이 페이지가 도움이 되었나요?

Last updated on 2026-02-09

Azure Data Factory 또는 Synapse Analytics를 사용하여 Azure Database for PostgreSQL 데이터 복사 및 변환

지원되는 기능

시작

UI를 사용하여 Azure Database for PostgreSQL 연결된 서비스 만들기

커넥터 구성 세부 정보

연결된 서비스 속성

버전 2.0

기본 인증

시스템이 할당한 관리 ID 인증

사용자가 할당한 관리 ID 인증

서비스 주체 인증

버전 1.0

데이터 세트 속성

Copy activity 속성

Azure Database for PostgreSql을 원본으로

Azure Database for PostgreSQL를 싱크로 사용하기

데이터 Upsert

Azure Database for PostgreSQL에서 병렬 복사

매핑 데이터 흐름 속성

원본 변환

Azure Database for PostgreSQL 원본 스크립트 예제

싱크 변환

Azure Database for PostgreSQL 싱크 스크립트 예제

스크립트 작업

조회 작업 속성

PostgreSQL용 Azure Database 커넥터 업그레이드

관련 콘텐츠

피드백

추가 리소스