Azure Data Factory または Azure Synapse Analytics を使用して Amazon RDS for SQL Server からデータをコピーする

2024-06-17

この記事では、Azure Data Factory および Azure Synapse パイプラインのコピーアクティビティを使用して、Amazon RDS for SQL Server データベースからデータをコピーする方法について説明します。詳細については、Azure Data Factory または Azure Synapse Analytics の概要記事を参照してください。

サポートされる機能

この Amazon RDS for SQL Server コネクタは、次の機能でサポートされます。

サポートされる機能	IR
Copy アクティビティ (ソース/-)	① ②
Lookup アクティビティ	① ②
GetMetadata アクティビティ	① ②
ストアドプロシージャアクティビティ	① ②

① Azure 統合ランタイム ② セルフホステッド統合ランタイム

コピーアクティビティによってソースまたはシンクとしてサポートされるデータストアの一覧については、サポートされるデータストアに関する記事の表をご覧ください。

具体的には、この Amazon RDS for SQL Server コネクタでは以下がサポートされています。

SQL Server バージョン 2005 以降。
SQL または Windows 認証を使用したデータのコピー。
ソースとして、SQL クエリまたはストアドプロシージャを使用してデータを取得する。 Amazon RDS for SQL Server ソースからの並列コピーを選択することもできます。詳細については、「SQL データベースからの並列コピー」を参照してください。

SQL Server Express LocalDB はサポートされていません。

前提条件

データストアがオンプレミスネットワーク、Azure 仮想ネットワーク、または Amazon Virtual Private Cloud 内にある場合は、それに接続するようセルフホステッド統合ランタイムを構成する必要があります。

データストアがマネージドクラウドデータサービスである場合は、Azure Integration Runtime を使用できます。ファイアウォール規則で承認されている IP にアクセスが制限されている場合は、Azure Integration Runtime の IP を許可リストに追加できます。

また、Azure Data Factory のマネージド仮想ネットワーク統合ランタイム機能を使用すれば、セルフホステッド統合ランタイムをインストールして構成しなくても、オンプレミスネットワークにアクセスすることができます。

Data Factory によってサポートされるネットワークセキュリティメカニズムやオプションの詳細については、「データアクセス戦略」を参照してください。

はじめに

パイプラインでコピーアクティビティを実行するには、次のいずれかのツールまたは SDK を使用します。

UI を使用して Amazon RDS for SQL Server のリンクサービスを作成する

次の手順を使用して、Azure portal UI で Amazon RDS for SQL Server のリンクサービスを作成します。

Azure Data Factory または Synapse ワークスペースの [管理] タブに移動し、[リンクされたサービス] を選択して、[新規] をクリックします。
- Azure Data Factory
- Azure Synapse
Amazon RDS for SQL Server を検索し、Amazon RDS for SQL Server コネクタを選択します。
サービスの詳細を構成し、接続をテストして、新しいリンクサービスを作成します。

コネクタの構成の詳細

以下のセクションでは、Amazon RDS for SQL Server データベースコネクタに固有の Data Factory および Synapse パイプラインエンティティの定義に使用されるプロパティについて詳しく説明します。

リンクされたサービスプロパティ

Amazon RDS for SQL Server コネクタの推奨バージョンでは、TLS 1.3 がサポートされています。 Amazon RDS for SQL Server コネクタのバージョンをレガシのものからアップグレードするには、このセクションを参照してください。プロパティの詳細については、対応するセクションを参照してください。

推奨されるバージョン
レガシバージョン

Note

Amazon RDS for SQL Server の Always Encrypted は、データフローではサポートされていません。

ヒント

エラーコード "UserErrorFailedToConnectToSqlServer" および "The session limit for the database is XXX and has been reached" (データベースのセッション制限 XXX に達しました) のようなメッセージのエラーが発生する場合は、Pooling=false を接続文字列に追加して、もう一度試してください。

推奨されるバージョン

推奨バージョンを適用すると、Amazon RDS for SQL Server のリンクサービスで次の汎用プロパティがサポートされます。

プロパティ	内容	必須
type	type プロパティは、AmazonRdsForSqlServer に設定する必要があります。	はい
サーバー	接続先の SQL Server インスタンスの名前またはネットワークアドレス。	はい
database	データベースの名前。	はい
authenticationType	認証に使用される型。使用できる値は SQL (既定値)、Windows です。特定のプロパティと前提条件に関する関連する認証セクションに移動します。	はい
alwaysEncryptedSettings	マネージド ID またはサービスプリンシパルを使用して、Amazon RDS for SQL Server に格納されている機密データを保護する Always Encrypted を有効にするために必要な alwaysencryptedsettings 情報を指定します。詳細については、この表の後にある JSON の例および「Always Encrypted の使用」を参照してください。指定されていない場合、既定の always encrypted 設定は無効になります。	いいえ
encrypt	クライアントとサーバーの間で送信されるすべてのデータに TLS 暗号化が必要かどうかを示します。オプション: 必須 (true の場合、既定値)/省略可能 (false の場合)/strict。	いいえ
trustServerCertificate	信頼を検証するための証明書チェーンをバイパスする間、チャネルが暗号化されるかどうかを示します。	いいえ
hostNameInCertificate	接続のサーバー証明書を検証するときに使用するホスト名。指定しない場合、サーバー名が証明書の検証に使用されます。	いいえ
connectVia	この統合ランタイムは、データストアに接続するために使用されます。詳細については、「前提条件」セクションを参照してください。指定されていない場合は、既定の Azure Integration Runtime が使用されます。	いいえ

その他の接続プロパティについては、次の表を参照してください。

プロパティ	内容	必須
applicationIntent	サーバーに接続するときのアプリケーションのワークロードの種類。使用できる値は `ReadOnly` と `ReadWrite` です。	いいえ
connectTimeout	試行を終了してエラーを生成するまでに、サーバーへの接続を待機する時間 (秒)。	いいえ
connectRetryCount	アイドル状態の接続の失敗を特定した後に試された再接続の数。値は 0 から 255 までの整数である必要があります。	いいえ
connectRetryInterval	アイドル状態の接続エラーを特定した後の、再接続試行の時間間隔 (秒)。 SQL Server のバージョンをアップグレードする値は 1 から 60 までの整数である必要があります。	いいえ
loadBalanceTimeout	接続が破棄される前に接続が接続プールに存在する最小時間 (秒)。	いいえ
commandTimeout	コマンド実行の試行を終了してエラーを生成するまでの既定の待機時間 (秒)。	いいえ
integratedSecurity	使用できる値は `true` または `false` です。 `false` を指定する場合は、接続に userName とパスワードが指定されるかどうかを示します。 `true` を指定する場合は、現在の Windows アカウントの資格情報が認証に使用されるかどうかを示します。	いいえ
failoverPartner	プライマリサーバーがダウンしている場合に接続するパートナーサーバーの名前またはアドレス。	いいえ
maxPoolSize	特定の接続について、接続プールで許可される接続の最大数。	いいえ
minPoolSize	特定の接続について、接続プールで許可される接続の最小数。	いいえ
multipleActiveResultSets	使用できる値は `true` または `false` です。 `true` を指定すると、アプリケーションは複数のアクティブな結果セット (MARS) を維持できます。 `false` を指定すると、アプリケーションは、その接続で他のバッチを実行する前に、1 つのバッチからすべての結果セットを処理または取り消す必要があります。	いいえ
multiSubnetFailover	使用できる値は `true` または `false` です。アプリケーションが異なるサブネット上の AlwaysOn 可用性グループ (AG) に接続する場合、このプロパティを `true` に設定すると、現在アクティブなサーバーの検出と接続が速くなります。	いいえ
packetSize	サーバーのインスタンスとの通信に使用されるネットワークパケットのサイズ (バイト)。	いいえ
プール	使用できる値は `true` または `false` です。 `true` を指定すると、接続がプールされます。 `false` を指定すると、接続が要求されるたびに接続が明示的に開かれます。	いいえ

SQL 認証

SQL 認証を使用するには、前のセクションで説明した汎用プロパティに加えて、次のプロパティを指定します。

プロパティ	内容	必要
userName	サーバーへの接続に使用されるユーザー名。	はい
password	該当するユーザー名のパスワード。安全に保存するには、このフィールドを SecureString としてマークします。また、Azure Key Vault に格納されているシークレットを参照することもできます。	はい

例: SQL 認証を使用する

{
    "name": "AmazonSqlLinkedService",
    "properties": {
        "type": "AmazonRdsForSqlServer",
        "typeProperties": {
            "server": "<name or network address of the SQL server instance>",
            "database": "<database name>",
            "encrypt": "<encrypt>",
            "trustServerCertificate": false,
            "authenticationType": "SQL",
            "userName": "<user name>",
            "password": {
                "type": "SecureString",
                "value": "<password>"
            }
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

例: Azure Key Vault 内のパスワードで SQL 認証を使用する

{
    "name": "AmazonSqlLinkedService",
    "properties": {
        "type": "AmazonRdsForSqlServer",
        "typeProperties": {
            "server": "<name or network address of the SQL server instance>",
            "database": "<database name>",
            "encrypt": "<encrypt>",
            "trustServerCertificate": false,
            "authenticationType": "SQL",
            "userName": "<user name>",
            "password": { 
                "type": "AzureKeyVaultSecret", 
                "store": { 
                    "referenceName": "<Azure Key Vault linked service name>", 
                    "type": "LinkedServiceReference" 
                }, 
                "secretName": "<secretName>" 
            }
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

例: Always Encrypted の使用

{
    "name": "AmazonSqlLinkedService",
    "properties": {
        "type": "AmazonRdsForSqlServer",
        "typeProperties": {
            "server": "<name or network address of the SQL server instance>",
            "database": "<database name>",
            "encrypt": "<encrypt>",
            "trustServerCertificate": false,
            "authenticationType": "SQL",
            "userName": "<user name>",
            "password": {
                "type": "SecureString",
                "value": "<password>"
            },
            "alwaysEncryptedSettings": {
                "alwaysEncryptedAkvAuthType": "ServicePrincipal",
                "servicePrincipalId": "<service principal id>",
                "servicePrincipalKey": {
                    "type": "SecureString",
                    "value": "<service principal key>"
                }
            }
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

Windows 認証

前のセクションで説明した汎用的なプロパティに加えて、Windows 認証を使用するには、次のプロパティを指定します。

プロパティ	内容	必要
userName	ユーザー名を指定します。例: domainname\username。	はい
password	ユーザー名に指定したユーザーアカウントのパスワードを指定します。安全に保存するには、このフィールドを SecureString としてマークします。また、Azure Key Vault に格納されているシークレットを参照することもできます。	はい

例: Windows 認証を使用する

{
    "name": "AmazonSqlLinkedService",
    "properties": {
        "type": "AmazonRdsForSqlServer",
        "typeProperties": {
            "server": "<name or network address of the SQL server instance>",
            "database": "<database name>",
            "encrypt": "<encrypt>",
            "trustServerCertificate": false,
            "authenticationType": "Windows",
            "userName": "<domain\\username>",
            "password": {
                "type": "SecureString",
                "value": "<password>"
            }
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

レガシバージョン

レガシ バージョンを適用すると、Amazon RDS for SQL Server のリンクサービスで次の汎用プロパティがサポートされます。

プロパティ	内容	必須
type	type プロパティは、AmazonRdsForSqlServer に設定する必要があります。	はい
alwaysEncryptedSettings	マネージド ID またはサービスプリンシパルを使用して、Amazon RDS for SQL Server に格納されている機密データを保護する Always Encrypted を有効にするために必要な alwaysencryptedsettings 情報を指定します。詳しくは、「Always Encrypted の使用」セクションをご覧ください。指定されていない場合、既定の always encrypted 設定は無効になります。	いいえ
connectVia	この統合ランタイムは、データストアに接続するために使用されます。詳細については、「前提条件」セクションを参照してください。指定されていない場合は、既定の Azure Integration Runtime が使用されます。	いいえ

この Amazon RDS for SQL Server コネクタでは、次の認証の種類がサポートされています。詳細については、対応するセクションをご覧ください。

レガシバージョンの SQL 認証
レガシバージョンの Windows 認証

レガシバージョンの SQL 認証

SQL 認証を使用するには、前のセクションで説明した汎用プロパティに加えて、次のプロパティを指定します。

プロパティ	内容	必須
connectionString	Amazon RDS for SQL Server データベースに接続するために必要な connectionString 情報を指定します。ユーザー名としてログイン名を指定し、接続するデータベースがこのログインにマップされていることを確認します。	はい
password	パスワードを Azure Key Vault に格納する場合、接続文字列から `password` 構成をプルします。詳細については、「Azure Key Vault への資格情報の格納」を参照してください。	いいえ

レガシバージョンの Windows 認証

前のセクションで説明した汎用的なプロパティに加えて、Windows 認証を使用するには、次のプロパティを指定します。

プロパティ	内容	必須
connectionString	Amazon RDS for SQL Server データベースに接続するために必要な connectionString 情報を指定します。	はい
userName	ユーザー名を指定します。例: domainname\username。	はい
password	ユーザー名に指定したユーザーアカウントのパスワードを指定します。安全に保存するには、このフィールドを SecureString としてマークします。また、Azure Key Vault に格納されているシークレットを参照することもできます。	はい

データセットのプロパティ

データセットを定義するために使用できるセクションとプロパティの完全な一覧については、データセットに関する記事をご覧ください。このセクションでは、Amazon RDS for SQL Server データセットでサポートされるプロパティの一覧を示します。

Amazon RDS for SQL Server データベースからデータをコピーするために、次のプロパティがサポートされています。

プロパティ	内容	必須
type	データセットの type プロパティは、AmazonRdsForSqlServerTable に設定する必要があります。	はい
schema	スキーマの名前。	いいえ
table	テーブル/ビューの名前。	いいえ
tableName	スキーマがあるテーブル/ビューの名前。このプロパティは下位互換性のためにサポートされています。新しいワークロードでは、`schema` と `table` を使用します。	いいえ

例

{
    "name": "AmazonRdsForSQLServerDataset",
    "properties":
    {
        "type": "AmazonRdsForSqlServerTable",
        "linkedServiceName": {
            "referenceName": "<Amazon RDS for SQL Server linked service name>",
            "type": "LinkedServiceReference"
        },
        "schema": [ < physical schema, optional, retrievable during authoring > ],
        "typeProperties": {
            "schema": "<schema_name>",
            "table": "<table_name>"
        }
    }
}

コピーアクティビティのプロパティ

アクティビティの定義に利用できるセクションとプロパティの完全な一覧については、パイプラインに関する記事を参照してください。このセクションでは、Amazon RDS for SQL Server ソースでサポートされるプロパティの一覧を示します。

ソースとしての Amazon RDS for SQL Server

ヒント

データパーティション分割を使用して、Amazon RDS for SQL Server からデータを効率的に読み込む方法の詳細については、「SQL データベースからの並列コピー」を参照してください。

Amazon RDS for SQL Server からデータをコピーするには、コピーアクティビティのソースの種類を AmazonRdsForSqlServerSource に設定します。コピーアクティビティの source セクションでは、次のプロパティがサポートされます。

プロパティ	内容	必須
type	コピーアクティビティのソースの type プロパティは、AmazonRdsForSqlServerSource に設定する必要があります。	はい
sqlReaderQuery	カスタム SQL クエリを使用してデータを読み取ります。たとえば `select * from MyTable` です。	いいえ
sqlReaderStoredProcedureName	このプロパティは、ソーステーブルからデータを読み取るストアドプロシージャの名前です。最後の SQL ステートメントはストアドプロシージャの SELECT ステートメントにする必要があります。	いいえ
storedProcedureParameters	これらのパラメーターは、ストアドプロシージャ用です。使用可能な値は、名前または値のペアです。パラメーターの名前とその大文字と小文字は、ストアドプロシージャのパラメーターの名前とその大文字小文字と一致する必要があります。	いいえ
isolationLevel	SQL ソースのトランザクションロック動作を指定します。使用できる値は、次のとおりです。ReadCommitted、ReadUncommitted、RepeatableRead、Serializable、Snapshot。指定しなかった場合は、データベースの既定の分離レベルが使用されます。詳細についてはこちらのドキュメントをご覧ください。	いいえ
partitionOptions	Amazon RDS for SQL Server からのデータの読み込みに使用されるデータパーティション分割オプションを指定します。使用できる値は、以下のとおりです。None (既定値)、PhysicalPartitionsOfTable、および DynamicRange。パーティションオプションが有効になっている場合 (つまり、`None` ではない場合)、Amazon RDS for SQL Server から同時にデータを読み込む並列処理の次数は、コピーアクティビティの `parallelCopies` 設定によって制御されます。	いいえ
partitionSettings	データパーティション分割の設定のグループを指定します。パーティションオプションが `None` でない場合に適用されます。	いいえ
`partitionSettings` の下:
partitionColumnName	並列コピーの範囲パーティション分割で使用される整数型または日付/日時型 (`int`、`smallint`、`bigint`、`date`、`smalldatetime`、`datetime`、`datetime2`、または `datetimeoffset`) のソース列の名前を指定します。指定されない場合は、テーブルのインデックスまたは主キーが自動検出され、パーティション列として使用されます。パーティションオプションが `DynamicRange` である場合に適用されます。クエリを使用してソースデータを取得する場合は、WHERE 句で `?DfDynamicRangePartitionCondition` をフックします。例については、「SQL データベースからの並列コピー」セクションを参照してください。	いいえ
partitionUpperBound	パーティション範囲の分割のための、パーティション列の最大値。この値は、テーブル内の行のフィルター処理用ではなく、パーティションのストライドを決定するために使用されます。テーブルまたはクエリ結果に含まれるすべての行がパーティション分割され、コピーされます。指定されていない場合は、コピーアクティビティによって値が自動検出されます。パーティションオプションが `DynamicRange` である場合に適用されます。例については、「SQL データベースからの並列コピー」セクションを参照してください。	いいえ
partitionLowerBound	パーティション範囲の分割のための、パーティション列の最小値。この値は、テーブル内の行のフィルター処理用ではなく、パーティションのストライドを決定するために使用されます。テーブルまたはクエリ結果に含まれるすべての行がパーティション分割され、コピーされます。指定されていない場合は、コピーアクティビティによって値が自動検出されます。パーティションオプションが `DynamicRange` である場合に適用されます。例については、「SQL データベースからの並列コピー」セクションを参照してください。	いいえ

以下の点に注意してください。

AmazonRdsForSqlServerSource に sqlReaderQuery が指定されている場合、コピーアクティビティでは、データを取得するために Amazon RDS for SQL Server ソースに対してこのクエリを実行します。 sqlReaderStoredProcedureName と storedProcedureParameters を指定して、ストアドプロシージャを指定することもできます (ストアドプロシージャでパラメーターを使用する場合)。
ソースのストアドプロシージャを使用してデータを取得する場合、異なるパラメーター値が渡されたときに別のスキーマを返すようにストアドプロシージャが設計されていると、UI からスキーマをインポートするときや、テーブルの自動作成を使用して SQL データベースにデータをコピーするときに、エラーが発生したり、予期しない結果になったりする可能性があります。

例:SQL クエリを使用する

"activities":[
    {
        "name": "CopyFromAmazonRdsForSQLServer",
        "type": "Copy",
        "inputs": [
            {
                "referenceName": "<Amazon RDS for SQL Server input dataset name>",
                "type": "DatasetReference"
            }
        ],
        "outputs": [
            {
                "referenceName": "<output dataset name>",
                "type": "DatasetReference"
            }
        ],
        "typeProperties": {
            "source": {
                "type": "AmazonRdsForSqlServerSource",
                "sqlReaderQuery": "SELECT * FROM MyTable"
            },
            "sink": {
                "type": "<sink type>"
            }
        }
    }
]

例:ストアドプロシージャの使用

"activities":[
    {
        "name": "CopyFromAmazonRdsForSQLServer",
        "type": "Copy",
        "inputs": [
            {
                "referenceName": "<Amazon RDS for SQL Server input dataset name>",
                "type": "DatasetReference"
            }
        ],
        "outputs": [
            {
                "referenceName": "<output dataset name>",
                "type": "DatasetReference"
            }
        ],
        "typeProperties": {
            "source": {
                "type": "AmazonRdsForSqlServerSource",
                "sqlReaderStoredProcedureName": "CopyTestSrcStoredProcedureWithParameters",
                "storedProcedureParameters": {
                    "stringData": { "value": "str3" },
                    "identifier": { "value": "$$Text.Format('{0:yyyy}', <datetime parameter>)", "type": "Int"}
                }
            },
            "sink": {
                "type": "<sink type>"
            }
        }
    }
]

ストアドプロシージャの定義

CREATE PROCEDURE CopyTestSrcStoredProcedureWithParameters
(
    @stringData varchar(20),
    @identifier int
)
AS
SET NOCOUNT ON;
BEGIN
    select *
    from dbo.UnitTestSrcTable
    where dbo.UnitTestSrcTable.stringData != stringData
    and dbo.UnitTestSrcTable.identifier != identifier
END
GO

SQL データベースからの並列コピー

Amazon RDS for SQL Server コネクタでは、コピーアクティビティの際に、データを並列でコピーするための組み込みのデータパーティション分割が提供されます。データパーティション分割オプションは、コピーアクティビティの [ソース] タブにあります。

パーティションのオプションのスクリーンショット

パーティション分割されたコピーを有効にすると、コピーアクティビティによって Amazon RDS for SQL Server ソースに対する並列クエリが実行され、パーティションごとにデータが読み込まれます。並列度は、コピーアクティビティの parallelCopies 設定によって制御されます。たとえば、parallelCopies を 4 に設定した場合、指定したパーティションオプションと設定に基づいて 4 つのクエリが同時に生成され、実行されます。各クエリでは、Amazon RDS for SQL Server からデータの一部を取得します。

特に、Amazon RDS for SQL Server から大量のデータを読み込む場合は、データパーティション分割を使用した並列コピーを有効にすることをお勧めします。さまざまなシナリオの推奨構成を以下に示します。ファイルベースのデータストアにデータをコピーする場合は、複数のファイルとしてフォルダーに書き込む (フォルダー名のみを指定する) ことをお勧めします。この場合、1 つのファイルに書き込むよりもパフォーマンスが優れています。

シナリオ	推奨設定
物理パーティションに分割された大きなテーブル全体から読み込む。	パーティションオプション: テーブルの物理パーティション。実行中に、サービスによって物理パーティションが自動的に検出され、パーティションごとにデータがコピーされます。テーブルに物理パーティションがあるかどうかを確認するには、こちらのクエリを参照してください。
物理パーティションがなく、データパーティション分割用の整数または日時の列がある大きなテーブル全体から読み込む。	パーティションオプション: 動的範囲パーティション。パーティション列 (省略可能):データのパーティション分割に使用される列を指定します。指定されていない場合は、主キー列が使用されます。パーティションの上限とパーティションの下限 (省略可能):パーティションのストライドを決定する場合に指定します。これは、テーブル内の行のフィルター処理用ではなく、テーブル内のすべての行がパーティション分割されてコピーされます。指定されていない場合は、Copy アクティビティによって値が自動検出されます。最小値と最大値によっては時間がかかることがあります。上限と下限を指定することをお勧めします。たとえば、パーティション列「ID」の値の範囲が 1 ～ 100 で、下限を 20 に、上限を 80 に設定し、並列コピーを 4 にした場合、サービスによって 4 つのパーティションでデータが取得されます。ID の範囲は、それぞれ、20 以下、21 ～ 50、51 ～ 80、81 以上となります。
物理パーティションがなく、データパーティション分割用の整数列または日付/日時列がある大量のデータを、カスタムクエリを使用して読み込む。	パーティションオプション: 動的範囲パーティション。クエリ: `SELECT * FROM <TableName> WHERE ?DfDynamicRangePartitionCondition AND <your_additional_where_clause>` パーティション列: データのパーティション分割に使用される列を指定します。パーティションの上限とパーティションの下限 (省略可能):パーティションのストライドを決定する場合に指定します。これは、テーブル内の行のフィルター処理用ではなく、クエリ結果のすべての行がパーティション分割されてコピーされます。指定されていない場合は、Copy アクティビティによって値が自動検出されます。たとえば、パーティション列「ID」の値の範囲が 1 ～ 100 で、下限を 20 に、上限を 80 に設定し、並列コピーを 4 にした場合、サービスによって 4 つのパーティションでデータが取得されます。ID の範囲は、それぞれ、20 以下、21 ～ 50、51 ～ 80、81 以上となります。さまざまなシナリオのサンプルクエリを次に示します。 1.テーブル全体に対してクエリを実行する: `SELECT * FROM <TableName> WHERE ?DfDynamicRangePartitionCondition` 2.列の選択と追加の where 句フィルターが含まれるテーブルからのクエリ: `SELECT <column_list> FROM <TableName> WHERE ?DfDynamicRangePartitionCondition AND <your_additional_where_clause>` 3.サブクエリを使用したクエリ: `SELECT <column_list> FROM (<your_sub_query>) AS T WHERE ?DfDynamicRangePartitionCondition AND <your_additional_where_clause>` 4.サブクエリにパーティションがあるクエリ: `SELECT <column_list> FROM (SELECT <your_sub_query_column_list> FROM <TableName> WHERE ?DfDynamicRangePartitionCondition) AS T`

パーティションオプションを使用してデータを読み込む場合のベストプラクティス:

データスキューを回避するため、パーティション列 (主キーや一意キーなど) には特徴のある列を選択します。
テーブルに組み込みパーティションがある場合は、パフォーマンスを向上させるためにパーティションオプションとして "テーブルの物理パーティション" を使用します。
Azure Integration Runtime を使用してデータをコピーする場合は、より大きな (4 より大きい) "データ統合単位 (DIU)" (>4) を設定すると、より多くのコンピューティングリソースを利用できます。そこで、該当するシナリオを確認してください。
パーティション数は、"コピーの並列処理の次数" によって制御されます。この数値を大きくしすぎるとパフォーマンスが低下するため、この数値は、(DIU またはセルフホステッド IR ノードの数) x (2 から 4) に設定することをお勧めします。

例: 複数の物理パーティションがある大きなテーブル全体から読み込む

"source": {
    "type": "AmazonRdsForSqlServerSource",
    "partitionOption": "PhysicalPartitionsOfTable"
}

例: 動的範囲パーティションを使用してクエリを実行する

"source": {
    "type": "AmazonRdsForSqlServerSource",
    "query": "SELECT * FROM <TableName> WHERE ?DfDynamicRangePartitionCondition AND <your_additional_where_clause>",
    "partitionOption": "DynamicRange",
    "partitionSettings": {
        "partitionColumnName": "<partition_column_name>",
        "partitionUpperBound": "<upper_value_of_partition_column (optional) to decide the partition stride, not as data filter>",
        "partitionLowerBound": "<lower_value_of_partition_column (optional) to decide the partition stride, not as data filter>"
    }
}

物理パーティションを確認するためのサンプルクエリ

SELECT DISTINCT s.name AS SchemaName, t.name AS TableName, pf.name AS PartitionFunctionName, c.name AS ColumnName, iif(pf.name is null, 'no', 'yes') AS HasPartition
FROM sys.tables AS t
LEFT JOIN sys.objects AS o ON t.object_id = o.object_id
LEFT JOIN sys.schemas AS s ON o.schema_id = s.schema_id
LEFT JOIN sys.indexes AS i ON t.object_id = i.object_id 
LEFT JOIN sys.index_columns AS ic ON ic.partition_ordinal > 0 AND ic.index_id = i.index_id AND ic.object_id = t.object_id 
LEFT JOIN sys.columns AS c ON c.object_id = ic.object_id AND c.column_id = ic.column_id 
LEFT JOIN sys.partition_schemes ps ON i.data_space_id = ps.data_space_id 
LEFT JOIN sys.partition_functions pf ON pf.function_id = ps.function_id 
WHERE s.name='[your schema]' AND t.name = '[your table name]'

テーブルに物理パーティションがある場合、次のように、"HasPartition" は "yes" と表示されます。

SQL クエリの結果

Lookup アクティビティのプロパティ

プロパティの詳細については、Lookup アクティビティに関するページを参照してください。

GetMetadata アクティビティのプロパティ

プロパティの詳細については、GetMetadata アクティビティに関するページを参照してください。

Always Encrypted の使用

Always Encrypted を使用して Amazon RDS for SQL Server との間でデータをコピーする場合は、次の手順に従います。

列マスターキー (CMK) を Azure Key Vault に保存します。詳細については、Azure Key Vault を使用して Always Encrypted を構成する方法に関する記事を参照してください
列マスターキー (CMK) が格納されているキーコンテナーへのアクセス権を付与します。必要なアクセス許可については、こちらの記事を参照してください。
リンクサービスを作成して SQL データベースに接続し、マネージド ID またはサービスプリンシパルを使用して "Always Encrypted" 機能を有効にします。

接続の問題のトラブルシューティング

リモート接続を受け入れるように、Amazon RDS for SQL Server インスタンスを構成します。 Amazon RDS for SQL Server Management Studio を起動し、サーバーを右クリックして、 [プロパティ] を選択します。一覧から [接続] を選択し、 [このサーバーへのリモート接続を許可する] チェックボックスをオンにします。

詳細な手順については、「remote access サーバー構成オプションの構成」をご覧ください。
Amazon RDS for SQL Server 構成マネージャー を起動します。目的のインスタンスの [Amazon RDS for SQL Server ネットワークの構成] を展開し、 [MSSQLSERVER のプロトコル] を選択します。右側のウィンドウにプロトコルが表示されます。 [TCP/IP] を右クリックして [有効化] を選択し、TCP/IP を有効にします。

TCP/IP プロトコルの有効化の詳細および別の方法については、「サーバーネットワークプロトコルの有効化または無効化」をご覧ください。
同じウィンドウで、 [TCP/IP] をダブルクリックして、 [TCP/IP のプロパティ] ウィンドウを起動します。
[IP アドレス] タブに切り替えます。下へスクロールして [IPAll] セクションを表示します。 [TCP ポート] を書き留めます。既定値は 1433 です。
コンピューターに Windows Firewall のルール を作成し、このポート経由の受信トラフィックを許可します。
接続の確認: 完全修飾名を使って Amazon RDS for SQL Server に接続するには、別のマシンから Amazon RDS for SQL Server Management Studio を使用します。たとえば "<machine>.<domain>.corp.<company>.com,1433" です。

Amazon RDS for SQL Server のバージョンをアップグレードする

Amazon RDS for SQL Server のバージョンをアップグレードするには、[リンクサービスの編集] ページで [バージョン] の [推奨] を選択し、推奨バージョンのリンクサービスプロパティを参照してリンクサービスを構成します。

推奨バージョンとレガシバージョンの違い

以下の表は、推奨バージョンとレガシーバージョンを使用した Amazon RDS for SQL Server の違いを示しています。

推奨されるバージョン	レガシバージョン
`encrypt` を `strict` とすることで TLS 1.3 をサポートします。	TLS 1.3 はサポートされません。

コピーアクティビティによってソース、シンクとしてサポートされるデータストアの一覧については、サポートされるデータストアに関するセクションを参照してください。

次の方法で共有

Azure Data Factory または Azure Synapse Analytics を使用して Amazon RDS for SQL Server からデータをコピーする

サポートされる機能

前提条件

はじめに

UI を使用して Amazon RDS for SQL Server のリンク サービスを作成する

コネクタの構成の詳細

リンクされたサービス プロパティ

推奨されるバージョン

SQL 認証

Windows 認証

レガシ バージョン

レガシ バージョンの SQL 認証

レガシ バージョンの Windows 認証