Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
VZTAHUJE SE NA:
Azure Data Factory
Azure Synapse Analytics
Tip
Data Factory v Microsoft Fabric je nová generace Azure Data Factory s jednodušší architekturou, integrovanou AI a novými funkcemi. Pokud s integrací dat začínáte, začněte Fabric Data Factory. Stávající úlohy ADF lze upgradovat na Fabric pro přístup k novým funkcím v oblastech datové vědy, analýz v reálném čase a vytváření sestav.
Tento článek popisuje, jak používat aktivitu kopírování v kanálech Azure Data Factory a Azure Synapse ke kopírování dat z databáze a k SQL Server databázi a použití Data Flow k transformaci dat v databázi SQL Server. Další informace najdete v úvodním článku Azure Data Factory nebo Azure Synapse Analytics.
Podporované funkce
Tento konektor SQL Server je podporovaný pro následující funkce:
| Podporované funkce | IR |
|---|---|
| Copy activity (zdroj/jímka) | (1) (2) |
| Mapování toku dat (zdroj/jímka) | (1) |
| Vyhledávací aktivita | (1) (2) |
| Aktivita GetMetadata | (1) (2) |
| Aktivita skriptu | (1) (2) |
| Aktivita uložené procedury | (1) (2) |
(1) Azure Integration Runtime (2) Lokálně hostované Integration Runtime
Seznam úložišť dat podporovaných jako zdroje nebo jímky aktivitou kopírování najdete v tabulce Podporované úložiště dat.
Konkrétně tento konektor SQL Server podporuje:
- SQL Server verze 2005 a novější.
- Kopírování dat pomocí SQL nebo Windows authentication
- Jako zdroj načítá data pomocí dotazu SQL nebo uložené procedury. Můžete také zvolit paralelní kopírování ze zdroje SQL Server, podrobnosti najdete v části Parallel z databáze SQL.
- Jako jímka automaticky vytváří cílovou tabulku, pokud neexistuje na základě zdrojového schématu; připojení dat k tabulce nebo vyvolání uložené procedury s vlastní logikou během kopírování
SQL Server Express LocalDB se nepodporuje.
Důležité
Zdroj dat musí podporovat datový typ NVARCHAR, protože ovlivňuje kódování dat, pokud se na data používá jiné než univerzální kódování.
Požadavky
Pokud se vaše úložiště dat nachází uvnitř místní sítě, Azure virtuální sítě, nebo Amazon Virtual Private Cloud, musíte pro připojení nakonfigurovat self-hosted Integration Runtime.
Pokud je vaše úložiště dat spravovanou cloudovou datovou službou, můžete použít Azure Integration Runtime. Pokud je přístup omezený na IP adresy schválené v pravidlech brány firewall, můžete do seznamu povolených přidat ip adresy Azure Integration Runtime.
Funkci managed virtual network Integration Runtime můžete také použít v Azure Data Factory pro přístup k místní síti bez nutnosti instalace a konfigurace místního prostředí Integration Runtime.
Další informace o mechanismech zabezpečení sítě a možnostech podporovaných službou Data Factory najdete v tématu Strategie přístupu k datům.
Začínáme
K provedení aktivity kopírování pomocí datového kanálu můžete použít jeden z následujících nástrojů nebo sad SDK:
- Nástroj pro kopírování dat
- portál Azure
- .NET SDK
- Python SDK
- Azure PowerShell
- REST API
- šablona Azure Resource Manager
Vytvoření propojené služby SQL Server pomocí uživatelského rozhraní
Pomocí následujícího postupu vytvořte v uživatelském rozhraní portálu Azure propojenou službu SQL Server.
Přejděte na kartu Spravovat v pracovním prostoru Azure Data Factory nebo Synapse a vyberte Propojené služby a potom klikněte na Nový:
Vyhledejte SQL a vyberte konektor SQL Server.
Nakonfigurujte podrobnosti o službě, otestujte připojení a vytvořte novou propojenou službu.
Podrobnosti konfigurace konektoru
Následující části obsahují podrobnosti o vlastnostech, které slouží k definování entit kanálu Data Factory a Synapse specifických pro konektor databáze SQL Server.
Vlastnosti propojené služby
Verze SQL Server Recommended podporuje protokol TLS 1.3. Pokud používáte verzi původní, projděte si tuto část a aktualizujte propojenou službu SQL Server. Podrobnosti vlastností najdete v odpovídajících sekcích.
Tip
Pokud se setkáte s chybou s kódem "UserErrorFailedToConnectToSqlServer" a zobrazí se zpráva ve smyslu "Limit relace pro databázi je XXX a byl dosažen", přidejte Pooling=false do svého connection stringu a zkuste to znovu.
Doporučená verze
Pokud použijete doporučenou verzi, podporují se pro propojenou službu SQL Serveru tyto obecné vlastnosti:
| Vlastnost | Popis | Povinné |
|---|---|---|
| typ | Vlastnost typu musí být nastavena na SqlServer. | Ano |
| server | Název nebo síťová adresa instance SQL Serveru, ke které se chcete připojit. | Ano |
| databáze | Název databáze. | Ano |
| typ autentizace | Typ použitý k ověřování. Povolené hodnoty jsou SQL (výchozí), Windows a UserAssignedManagedIdentity (jenom pro SQL Server na virtuálních počítačích Azure). Přejděte do příslušné části ověřování týkající se konkrétních vlastností a požadavků. | Ano |
| vždyŠifrovanáNastavení | Zadejte informace o alwaysencryptedsettings , které jsou potřeba k povolení funkce Always Encrypted k ochraně citlivých dat uložených na SQL Serveru pomocí spravované identity nebo instančního objektu. Další informace najdete v příkladu JSON za tabulkou a v části Always Encrypted. Pokud není zadáno, výchozí nastavení "always encrypted" je zakázané. | Ne |
| šifrovat | Určete, jestli je vyžadováno šifrování TLS pro všechna data odesílaná mezi klientem a serverem. Možnosti: povinné (pro true, výchozí)/volitelné (pro false)/přísné. | Ne |
| důvěřovatServerovémuCertifikátu | Určete, jestli bude kanál při obejití řetězu certifikátů zašifrovaný, aby se ověřil vztah důvěryhodnosti. | Ne |
| hostNameInCertificate | Název hostitele, který se má použít při ověřování certifikátu serveru pro připojení. Pokud není zadaný, název serveru se použije k ověření certifikátu. | Ne |
| connectVia | Tento Integration Runtime slouží k připojení k úložišti dat. Další informace najdete v části Požadavky . Pokud není zadaný, použije se výchozí Azure Integration Runtime. | Ne |
Další vlastnosti připojení najdete v následující tabulce:
| Vlastnost | Popis | Povinné |
|---|---|---|
| účel aplikace | Typ úlohy aplikace při připojování k serveru. Povolené hodnoty jsou ReadOnly a ReadWrite. |
Ne |
| Připojovací časový limit (connectTimeout) | Doba (v sekundách) čekání na připojení k serveru před ukončením pokusu a vygenerováním chyby. | Ne |
| početPokusuOPřipojení | Počet pokusů o opětovné připojení po identifikaci selhání připojení při nečinnosti. Hodnota by měla být celé číslo mezi 0 a 255. | Ne |
| connectRetryInterval (interval opakování připojení) | Doba (v sekundách) mezi jednotlivými pokusy o opětovné připojení po identifikaci selhání nečinného připojení. Hodnota by měla být celé číslo mezi 1 a 60. | Ne |
| loadBalanceTimeout | Minimální doba (v sekundách), po kterou má připojení zůstat aktivní ve fondu připojení před jeho ukončením. | Ne |
| časový limit příkazu | Výchozí doba čekání (v sekundách) před ukončením pokusu o spuštění příkazu a vygenerováním chyby. | Ne |
| integrované zabezpečení | Povolené hodnoty jsou true nebo false. Při zadávání false uveďte, zda jsou v připojení zadány uživatelské jméno a heslo. Při zadávání true určuje, jestli se k ověřování používají aktuální přihlašovací údaje účtu Windows. |
Ne |
| failoverPartner | Název nebo adresa partnerského serveru, ke kterému se má připojit, pokud je primární server v výpadku. | Ne |
| maxPoolSize | Maximální počet připojení povolených ve fondu připojení pro konkrétní připojení. | Ne |
| minimálníVelikostPoolu | Minimální počet připojení povolených ve fondu připojení pro konkrétní připojení. | Ne |
| multipleActiveResultSets | Povolené hodnoty jsou true nebo false. Při zadávání truemůže aplikace udržovat více aktivních sad výsledků (MARS). Když zadáte false, aplikace musí zpracovat nebo zrušit všechny sady výsledků z jedné dávky, aby bylo možné v daném připojení spustit jakékoli jiné dávky. |
Ne |
| multiSubnetFailover | Povolené hodnoty jsou true nebo false. Pokud se vaše aplikace připojuje ke skupině dostupnosti AlwaysOn v různých podsítích, nastavením této vlastnosti true zajistíte rychlejší detekci a připojení k aktuálně aktivnímu serveru. |
Ne |
| velikost paketu | Velikost v bajtech síťových paketů používaných ke komunikaci s instancí serveru. | Ne |
| sdružování | Povolené hodnoty jsou true nebo false. Po zadání true bude připojení zařazeno do fondu. Když zadáte false, připojení se explicitně otevře při každém vyžádání připojení. |
Ne |
Ověřování SQL
Pokud chcete použít ověřování SQL, kromě obecných vlastností popsaných v předchozí části zadejte následující vlastnosti:
| Vlastnost | Popis | Povinné |
|---|---|---|
| userName | Uživatelské jméno, které se má použít při připojování k serveru. | Ano |
| heslo | Heslo pro uživatelské jméno. Označte toto pole jako SecureString , abyste ho bezpečně uložili. Nebo můžete odložit tajný kód uložený v Azure Key Vault. | Ne |
Příklad: Použití ověřování SQL
{
"name": "SqlServerLinkedService",
"properties": {
"type": "SqlServer",
"typeProperties": {
"server": "<name or network address of the SQL server instance>",
"database": "<database name>",
"encrypt": "<encrypt>",
"trustServerCertificate": false,
"authenticationType": "SQL",
"userName": "<user name>",
"password": {
"type": "SecureString",
"value": "<password>"
}
},
"connectVia": {
"referenceName": "<name of Integration Runtime>",
"type": "IntegrationRuntimeReference"
}
}
}
Příklad: Použití ověřování SQL s heslem v Azure Key Vault
{
"name": "SqlServerLinkedService",
"properties": {
"type": "SqlServer",
"typeProperties": {
"server": "<name or network address of the SQL server instance>",
"database": "<database name>",
"encrypt": "<encrypt>",
"trustServerCertificate": false,
"authenticationType": "SQL",
"userName": "<user name>",
"password": {
"type": "AzureKeyVaultSecret",
"store": {
"referenceName": "<Azure Key Vault linked service name>",
"type": "LinkedServiceReference"
},
"secretName": "<secretName>"
}
},
"connectVia": {
"referenceName": "<name of Integration Runtime>",
"type": "IntegrationRuntimeReference"
}
}
}
Příklad: Použití funkce Always Encrypted
{
"name": "SqlServerLinkedService",
"properties": {
"type": "SqlServer",
"typeProperties": {
"server": "<name or network address of the SQL server instance>",
"database": "<database name>",
"encrypt": "<encrypt>",
"trustServerCertificate": false,
"authenticationType": "SQL",
"userName": "<user name>",
"password": {
"type": "SecureString",
"value": "<password>"
}
},
"alwaysEncryptedSettings": {
"alwaysEncryptedAkvAuthType": "ServicePrincipal",
"servicePrincipalId": "<service principal id>",
"servicePrincipalKey": {
"type": "SecureString",
"value": "<service principal key>"
}
},
"connectVia": {
"referenceName": "<name of Integration Runtime>",
"type": "IntegrationRuntimeReference"
}
}
}
Windows ověřování
Pokud chcete použít Windows authentication, kromě obecných vlastností popsaných v předchozí části zadejte následující vlastnosti:
| Vlastnost | Popis | Povinné |
|---|---|---|
| userName | Zadejte uživatelské jméno. Příkladem je název_domény\uživatelské_jméno. | Ano |
| heslo | Zadejte heslo pro uživatelský účet, který jste zadali pro uživatelské jméno. Označte toto pole jako SecureString , abyste ho bezpečně uložili. Nebo můžete odložit tajný kód uložený v Azure Key Vault. | Ano |
Poznámka:
Ověřování Windows není podporováno v toku dat.
Example: Použijte Windows authentication
{
"name": "SqlServerLinkedService",
"properties": {
"type": "SqlServer",
"typeProperties": {
"server": "<name or network address of the SQL server instance>",
"database": "<database name>",
"encrypt": "<encrypt>",
"trustServerCertificate": false,
"authenticationType": "Windows",
"userName": "<domain\\username>",
"password": {
"type": "SecureString",
"value": "<password>"
}
},
"connectVia": {
"referenceName": "<name of Integration Runtime>",
"type": "IntegrationRuntimeReference"
}
}
}
Příklad: Použijte ověřování systému Windows s heslem v Azure Key Vault
{
"name": "SqlServerLinkedService",
"properties": {
"annotations": [],
"type": "SqlServer",
"typeProperties": {
"server": "<name or network address of the SQL server instance>",
"database": "<database name>",
"encrypt": "<encrypt>",
"trustServerCertificate": false,
"authenticationType": "Windows",
"userName": "<domain\\username>",
"password": {
"type": "AzureKeyVaultSecret",
"store": {
"referenceName": "<Azure Key Vault linked service name>",
"type": "LinkedServiceReference"
},
"secretName": "<secretName>"
}
},
"connectVia": {
"referenceName": "<name of Integration Runtime>",
"type": "IntegrationRuntimeReference"
}
}
}
Ověřování spravované identity přiřazené uživatelem
Poznámka:
Ověřování spravované identity přiřazené uživatelem se vztahuje pouze na SQL Server na virtuálních počítačích Azure.
Pracovní prostor datové továrny nebo Synapse lze přidružit ke spravovaným identitám, které jsou přiřazeny uživatelem
Pokud chcete použít ověřování spravované identity přiřazené uživatelem, kromě obecných vlastností popsaných v předchozí části zadejte následující vlastnosti:
| Vlastnost | Popis | Povinné |
|---|---|---|
| přihlašovací údaje | Jako objekt přihlašovacích údajů zadejte spravovanou identitu přiřazenou uživatelem. | Ano |
Musíte také postupovat podle následujících kroků:
Udělte oprávnění spravované identitě přiřazené uživatelem.
Povolit ověřování Microsoft Entra pro váš SQL Server na virtuálních počítačích Azure.
Vytvořte uživatele omezené databáze pro spravovanou identitu přiřazenou uživatelem. Připojte se k databázi, do které chcete kopírovat data, pomocí nástrojů, jako je SQL Server Management Studio, s identitou Microsoft Entra, která má oprávnění alespoň na úrovni ALTER ANY USER. Spusťte následující příkaz T-SQL:
CREATE USER [your_resource_name] FROM EXTERNAL PROVIDER;Vytvořte jednu nebo více spravovaných identit přiřazených uživatelem a udělte spravované identitě přiřazené uživatelem potřebná oprávnění jako obvykle pro uživatele SQL a další. Spusťte následující kód. Další možnosti najdete v tomto dokumentu.
ALTER ROLE [role name] ADD MEMBER [your_resource_name];Přiřaďte k datové továrně jednu nebo více spravovaných identit přiřazených uživatelem a vytvořte přihlašovací údaje pro každou spravovanou identitu přiřazenou uživatelem.
Nakonfigurujte propojenou službu SQL Server.
Příklad
{
"name": "SqlServerLinkedService",
"properties": {
"type": "SqlServer",
"typeProperties": {
"server": "<name or network address of the SQL server instance>",
"database": "<database name>",
"encrypt": "<encrypt>",
"trustServerCertificate": false,
"authenticationType": "UserAssignedManagedIdentity",
"credential": {
"referenceName": "credential1",
"type": "CredentialReference"
}
},
"connectVia": {
"referenceName": "<name of Integration Runtime>",
"type": "IntegrationRuntimeReference"
}
}
}
Starší verze
Pro propojenou službu SQL Serveru jsou při použití verze Legacy podporovány tyto generické vlastnosti:
| Vlastnost | Popis | Povinné |
|---|---|---|
| typ | Vlastnost typu musí být nastavena na SqlServer. | Ano |
| vždyŠifrovanáNastavení | Zadejte informace o alwaysencryptedsettings , které jsou potřeba k povolení funkce Always Encrypted k ochraně citlivých dat uložených na SQL Serveru pomocí spravované identity nebo instančního objektu. Další informace najdete v části Použití funkce Always Encrypted . Pokud není zadáno, výchozí nastavení "always encrypted" je zakázané. | Ne |
| connectVia | Tento Integration Runtime slouží k připojení k úložišti dat. Další informace najdete v části Požadavky . Pokud není zadaný, použije se výchozí Azure Integration Runtime. | Ne |
Tento konektor SQL Serveru podporuje následující typy ověřování. Podrobnosti najdete v odpovídajících částech.
Ověřování SQL pro starší verzi
Pokud chcete použít ověřování SQL, kromě obecných vlastností popsaných v předchozí části zadejte následující vlastnosti:
| Vlastnost | Popis | Povinné |
|---|---|---|
| připojovací řetězec | Zadejte informace connectionString potřebné pro připojení k databázi SQL Server. Zadejte přihlašovací jméno jako uživatelské jméno a ujistěte se, že databáze, ke které se chcete připojit, je namapovaná na toto přihlášení. | Ano |
| heslo | Pokud chcete vložit heslo do Azure Key Vault, stáhněte konfiguraci password z connection string. Další informace najdete v tématu Storové přihlašovací údaje v Azure Key Vault. |
Ne |
Windows authentication pro starší verzi
Pokud chcete použít Windows authentication, kromě obecných vlastností popsaných v předchozí části zadejte následující vlastnosti:
| Vlastnost | Popis | Povinné |
|---|---|---|
| připojovací řetězec | Zadejte informace connectionString potřebné pro připojení k databázi SQL Server. | Ano |
| userName | Zadejte uživatelské jméno. Příkladem je název_domény\uživatelské_jméno. | Ano |
| heslo | Zadejte heslo pro uživatelský účet, který jste zadali pro uživatelské jméno. Označte toto pole jako SecureString , abyste ho bezpečně uložili. Nebo můžete odložit tajný kód uložený v Azure Key Vault. | Ano |
Vlastnosti datové sady
Úplný seznam oddílů a vlastností dostupných pro definování datových sad najdete v článku o datových sadách . Tato část obsahuje seznam vlastností podporovaných datovou sadou SQL Server.
Pokud chcete kopírovat data z databáze a do databáze SQL Server, podporují se následující vlastnosti:
| Vlastnost | Popis | Povinné |
|---|---|---|
| typ | Vlastnost typu datové sady musí být nastavena na SqlServerTable. | Ano |
| schéma | Název schématu | Ne pro zdroj, Ano pro jímku |
| tabulka | Název tabulky nebo zobrazení | Ne pro zdroj, Ano pro jímku |
| tableName | Název tabulky nebo zobrazení se schématem Tato vlastnost je podporována pro zpětnou kompatibilitu. Pro nové úlohy použijte schema a table. |
Ne pro zdroj, Ano pro jímku |
Příklad
{
"name": "SQLServerDataset",
"properties":
{
"type": "SqlServerTable",
"linkedServiceName": {
"referenceName": "<SQL Server linked service name>",
"type": "LinkedServiceReference"
},
"schema": [ < physical schema, optional, retrievable during authoring > ],
"typeProperties": {
"schema": "<schema_name>",
"table": "<table_name>"
}
}
}
Vlastnosti kopírovací aktivity
Úplný seznam oddílů a vlastností dostupných k definování aktivit najdete v článku Pipelines . Tato část obsahuje seznam vlastností podporovaných zdrojem SQL Server a jímkou.
SQL Server jako zdroj
Tip
Pokud chcete efektivně načítat data z SQL Server pomocí dělení dat, přečtěte si další informace z Parallel copy z databáze SQL.
Pokud chcete kopírovat data z SQL Server, nastavte typ zdroje v aktivitě kopírování na SqlSource. Ve zdrojové části aktivity kopírování jsou podporovány následující vlastnosti:
| Vlastnost | Popis | Povinné |
|---|---|---|
| typ | Vlastnost typu zdroje aktivity kopírování musí být nastavena na SqlSource. | Ano |
| sqlReaderQuery | Ke čtení dat použijte vlastní dotaz SQL. Příklad: select * from MyTable. |
Ne |
| sqlReaderStoredProcedureName | Tato vlastnost je název uložené procedury, která čte data ze zdrojové tabulky. Poslední příkaz SQL musí být příkaz SELECT v uložené proceduře. | Ne |
| parametry uložené procedury | Tyto parametry jsou určené pro uloženou proceduru. Povolené hodnoty jsou dvojice názvů nebo hodnot. Názvy a velikost písmen parametrů musí odpovídat názvům a velikostem písmen parametrů uložené procedury. |
Ne |
| úroveň izolace | Určuje chování uzamčení transakce pro zdroj SQL. Povolené hodnoty jsou: ReadCommitted, ReadUncommitted, RepeatableRead, Serializable, Snapshot. Pokud není zadáno, použije se výchozí úroveň izolace databáze. Další podrobnosti najdete v tomto dokumentu . | Ne |
| možnosti oddílu | Určuje možnosti dělení dat, které se používají k načtení dat z SQL Server. Povolené hodnoty jsou: None (výchozí), PhysicalPartitionsOfTable a DynamicRange. Pokud je povolená možnost oddílu (tj. ne None), je stupeň paralelismu souběžného načítání dat z SQL Server řízen nastavením parallelCopies aktivity kopírování. |
Ne |
| nastavení oddílu | Zadejte skupinu nastavení pro dělení dat. Použít, pokud možnost oddílu není None. |
Ne |
V části partitionSettings: |
||
| název sloupce pro dělení (partitionColumnName) | Zadejte název zdrojového sloupce v typu celé číslo nebo date/datetime (int, smallint, bigint, date, smalldatetime, datetime, datetime2 nebo datetimeoffset), který bude použit dělením rozsahu pro paralelní kopírování. Pokud není zadán, index nebo primární klíč tabulky se automaticky rozpozná a použije jako partiční sloupec.Použít, pokud je možnost oddílu DynamicRange. Pokud k načtení zdrojových dat použijete dotaz, začněte s ?DfDynamicRangePartitionCondition v klauzuli WHERE. Příklad najdete v části Paralelní kopírování z databáze SQL. |
Ne |
| partitionUpperBound | Maximální hodnota sloupce oddílu pro rozdělení rozsahu oddílu. Tato hodnota se používá k určení kroku oddílu, nikoli k filtrování řádků v tabulce. Všechny řádky v tabulce nebo výsledku dotazu se rozdělí a zkopírují. Pokud není zadáno, aktivita kopírování automaticky rozpozná hodnotu. Použít, pokud je možnost oddílu DynamicRange. Příklad najdete v části Paralelní kopírování z databáze SQL. |
Ne |
| partitionLowerBound | Minimální hodnota sloupce oddílu pro rozdělení rozsahů. Tato hodnota se používá k určení kroku oddílu, nikoli k filtrování řádků v tabulce. Všechny řádky v tabulce nebo výsledku dotazu se rozdělí a zkopírují. Pokud není zadáno, aktivita kopírování automaticky rozpozná hodnotu. Použít, pokud je možnost oddílu DynamicRange. Příklad najdete v části Paralelní kopírování z databáze SQL. |
Ne |
Je třeba počítat s následujícím:
- Pokud je pro SqlSource zadán sqlReaderQuery, aktivita kopírování spustí tento dotaz na zdroj SQL Serveru, aby získala data. Uloženou proceduru můžete také zadat zadáním sqlReaderStoredProcedureName a storedProcedureParameters , pokud uložená procedura přebírá parametry.
- Při použití uložené procedury ve zdroji k načtení dat si všimněte, že uložená procedura je navržena jako vrácení jiného schématu, pokud je předána jiná hodnota parametru, může dojít k selhání nebo může dojít k neočekávanému výsledku při importu schématu z uživatelského rozhraní nebo při kopírování dat do databáze SQL s automatickým vytvořením tabulky.
Příklad: Použití dotazu SQL
"activities":[
{
"name": "CopyFromSQLServer",
"type": "Copy",
"inputs": [
{
"referenceName": "<SQL Server input dataset name>",
"type": "DatasetReference"
}
],
"outputs": [
{
"referenceName": "<output dataset name>",
"type": "DatasetReference"
}
],
"typeProperties": {
"source": {
"type": "SqlSource",
"sqlReaderQuery": "SELECT * FROM MyTable"
},
"sink": {
"type": "<sink type>"
}
}
}
]
Příklad: Použití uložené procedury
"activities":[
{
"name": "CopyFromSQLServer",
"type": "Copy",
"inputs": [
{
"referenceName": "<SQL Server input dataset name>",
"type": "DatasetReference"
}
],
"outputs": [
{
"referenceName": "<output dataset name>",
"type": "DatasetReference"
}
],
"typeProperties": {
"source": {
"type": "SqlSource",
"sqlReaderStoredProcedureName": "CopyTestSrcStoredProcedureWithParameters",
"storedProcedureParameters": {
"stringData": { "value": "str3" },
"identifier": { "value": "$$Text.Format('{0:yyyy}', <datetime parameter>)", "type": "Int"}
}
},
"sink": {
"type": "<sink type>"
}
}
}
]
Definice uložené procedury
CREATE PROCEDURE CopyTestSrcStoredProcedureWithParameters
(
@stringData varchar(20),
@identifier int
)
AS
SET NOCOUNT ON;
BEGIN
select *
from dbo.UnitTestSrcTable
where dbo.UnitTestSrcTable.stringData != stringData
and dbo.UnitTestSrcTable.identifier != identifier
END
GO
SQL Server jako jímka
Tip
Přečtěte si další informace o podporovaných chováních při zápisu, konfiguracích a osvědčených postupech v Best practice for loading data into SQL Server.
Pokud chcete kopírovat data do SQL Server, nastavte typ jímky v aktivitě kopírování na SqlSink. V části jímky aktivity kopírování jsou podporovány následující vlastnosti:
| Vlastnost | Popis | Povinné |
|---|---|---|
| typ | Vlastnost typu jímky aktivity kopírování musí být nastavena na SqlSink. | Ano |
| preCopyScript | Tato vlastnost určuje dotaz SQL pro aktivitu kopírování, která se má spustit před zápisem dat do SQL Server. Vyvolá se pouze jednou za každé spuštění kopírování. Tuto vlastnost můžete použít k vyčištění předem načtených dat. | Ne |
| možnostTabulky | Určuje, zda se má automaticky vytvořit tabulka jímky, pokud na základě zdrojového schématu neexistuje. Automatické vytváření tabulek není podporováno, pokud jímka určuje uloženou proceduru. Povolené hodnoty jsou: none (výchozí), autoCreate. |
Ne |
| sqlWriterStoredProcedureName | Název uložené procedury, která definuje, jak použít zdrojová data do cílové tabulky. Tato uložená procedura se vyvolá pro každou dávku. Pro operace, které běží pouze jednou a nemají nic společného se zdrojovými daty, například odstranit nebo zkrátit, použijte preCopyScript vlastnost.Viz příklad vyvolání uložené procedury ze SQL sinku. |
Ne |
| názevParametruTypuTabulkyProUloženouProceduru | Název parametru typu tabulky zadaného v uložené proceduře. | Ne |
| sqlWriterTableType | Název typu tabulky, který se má použít v uložené proceduře. Aktivita kopírování zpřístupní data přesunutá v dočasné tabulce s tímto typem tabulky. Kód uložené procedury pak může sloučit data, která se kopírují s existujícími daty. | Ne |
| parametry uložené procedury | Parametry pro uloženou proceduru. Povolené hodnoty jsou dvojice názvů a hodnot. Názvy a velikost písmen parametrů musí odpovídat názvům a velikostem písmen parametrů uložené procedury. |
Ne |
| writeBatchSize | Počet řádků, které se mají vložit do SQL tabulky na dávku Povolené hodnoty jsou celá čísla pro počet řádků. Ve výchozím nastavení služba dynamicky určuje odpovídající velikost dávky na základě velikosti řádku. |
Ne |
| writeBatchTimeout | Doba čekání na dokončení operace vložení, upsertu a uložené procedury před vypršením časového limitu. Povolené hodnoty jsou pro časový rozsah. Příkladem je 00:30:00 po dobu 30 minut. Pokud není zadána žádná hodnota, časový limit je výchozí hodnota 00:30:00. |
Ne |
| maximální počet současných připojení | Horní limit souběžných připojení vytvořených k úložišti dat během spuštění aktivity. Zadejte hodnotu pouze v případech, kdy chcete omezit souběžná připojení. | Ne |
| WriteBehavior | Určete způsob zápisu v rámci kopírovací aktivity pro načtení dat do databáze SQL Server. Povolená hodnota je Insert a Upsert. Ve výchozím nastavení služba používá k načtení dat operaci insert. |
Ne |
| upsertSettings | Zadejte skupinu nastavení pro chování zápisu. Použít, pokud je možnost Upsert WriteBehavior. |
Ne |
V části upsertSettings: |
||
| useTempDB | Určete, zda se má jako dočasná tabulka pro upsert použít globální dočasná tabulka nebo fyzická tabulka. Ve výchozím nastavení služba používá jako globální dočasnou tabulku. hodnota je true. |
Ne |
| interimSchemaName | Zadejte dočasné schéma pro vytvoření dočasné tabulky, pokud se použije fyzická tabulka. Poznámka: Uživatel musí mít oprávnění k vytváření a odstraňování tabulek. Ve výchozím nastavení bude dočasná tabulka sdílet stejné schéma jako tabulka jímky. Použít, pokud je Falseparametr useTempDB . |
Ne |
| klíče | Zadejte názvy sloupců pro jedinečnou identifikaci řádků. Můžete použít jeden klíč nebo řadu klíčů. Pokud není zadaný, použije se primární klíč. | Ne |
Příklad 1: Připojení dat
"activities":[
{
"name": "CopyToSQLServer",
"type": "Copy",
"inputs": [
{
"referenceName": "<input dataset name>",
"type": "DatasetReference"
}
],
"outputs": [
{
"referenceName": "<SQL Server output dataset name>",
"type": "DatasetReference"
}
],
"typeProperties": {
"source": {
"type": "<source type>"
},
"sink": {
"type": "SqlSink",
"tableOption": "autoCreate",
"writeBatchSize": 100000
}
}
}
]
Příklad 2: Vyvolání uložené procedury během kopírování
Další informace naleznete v Volání uložené procedury ze SQL cílového úložiště.
"activities":[
{
"name": "CopyToSQLServer",
"type": "Copy",
"inputs": [
{
"referenceName": "<input dataset name>",
"type": "DatasetReference"
}
],
"outputs": [
{
"referenceName": "<SQL Server output dataset name>",
"type": "DatasetReference"
}
],
"typeProperties": {
"source": {
"type": "<source type>"
},
"sink": {
"type": "SqlSink",
"sqlWriterStoredProcedureName": "CopyTestStoredProcedureWithParameters",
"storedProcedureTableTypeParameterName": "MyTable",
"sqlWriterTableType": "MyTableType",
"storedProcedureParameters": {
"identifier": { "value": "1", "type": "Int" },
"stringData": { "value": "str1" }
}
}
}
}
]
Příklad 3: Upsert data
"activities":[
{
"name": "CopyToSQLServer",
"type": "Copy",
"inputs": [
{
"referenceName": "<input dataset name>",
"type": "DatasetReference"
}
],
"outputs": [
{
"referenceName": "<SQL Server output dataset name>",
"type": "DatasetReference"
}
],
"typeProperties": {
"source": {
"type": "<source type>"
},
"sink": {
"type": "SqlSink",
"tableOption": "autoCreate",
"writeBehavior": "upsert",
"upsertSettings": {
"useTempDB": true,
"keys": [
"<column name>"
]
},
}
}
}
]
Paralelní kopírování z databáze SQL
Konektor SQL Server v aktivitě kopírování poskytuje integrované dělení dat pro paralelní kopírování dat. Možnosti dělení dat najdete na kartě Zdroj kopírovací aktivity.
Když povolíte dělené kopírování, aktivita kopírování spouští paralelní dotazy na váš SQL Server zdroj pro načtení dat podle oddílů. Paralelní stupeň se řídí nastavením aktivity kopírování parallelCopies. Pokud například nastavíte parallelCopies na čtyři, služba současně generuje a spouští čtyři dotazy na základě zadané možnosti a nastavení oddílu a každý dotaz načte část dat z vašeho SQL Server.
Doporučujeme povolit paralelní kopírování s dělením dat, zejména pokud načtete velké množství dat z SQL Server. Následující konfigurace jsou navržené pro různé scénáře. Při kopírování dat do souborového úložiště dat se doporučuje zapisovat do složky jako více souborů (zadat pouze název složky), v takovém případě je výkon lepší než zápis do jednoho souboru.
| Scénář | Navrhovaná nastavení |
|---|---|
| Načtení všech dat z velké tabulky s fyzickými partícemi |
Možnost oddílu: Fyzické oddíly tabulky. Během provádění služba automaticky rozpozná fyzické oddíly a kopíruje data podle oddílů. Pokud chcete zkontrolovat, jestli má vaše tabulka fyzický oddíl, můžete použít tento dotaz. |
| Úplné načtení z velké tabulky bez fyzického dělení, ale s využitím celočíselného nebo datetime sloupce pro dělení dat. |
Možnosti oddílu: Oddíl dynamického rozsahu Sloupec pro oddílování (volitelné): Zadejte sloupec použitý pro oddílování dat. Pokud není zadaný, použije se sloupec primárního klíče. Horní mez oddílu a dolní mez oddílu (volitelné): Určete, jestli chcete určit krok oddílu. To není pro filtrování řádků v tabulce, všechny řádky v tabulce budou rozděleny a zkopírovány. Pokud není zadáno, aktivita kopírování automaticky zjistí hodnoty a může trvat dlouhou dobu v závislosti na hodnotách MIN a MAX. Doporučuje se zadat horní mez a dolní mez. Pokud má například sloupec oddílu ID hodnoty od 1 do 100 a dolní mez nastavíte jako 20 a horní mez jako 80, přičemž paralelní kopírování je 4, služba načte data o 4 oddílech – ID v rozsahu <=20, [21, 50], [51, 80] a >=81. |
| Načtěte velké množství dat pomocí vlastního dotazu bez fyzického dělení, s použitím celočíselného sloupce nebo sloupce s datem či datem a časem pro rozdělení dat. |
Možnosti oddílu: Oddíl dynamického rozsahu Dotaz: SELECT * FROM <TableName> WHERE ?DfDynamicRangePartitionCondition AND <your_additional_where_clause>.Sloupec pro rozdělení: Zadejte sloupec použitý k rozdělení dat. Horní mez oddílu a dolní mez oddílu (volitelné): Určete, jestli chcete určit krok oddílu. To není pro filtrování řádků v tabulce, všechny řádky ve výsledku dotazu budou rozděleny a zkopírovány. Pokud není zadáno, aktivita kopírování automaticky rozpozná hodnotu. Pokud má například sloupec oddílu 'ID' hodnoty od 1 do 100 a dolní mez nastavíte jako 20 a horní mez 80, s paralelním kopírováním nastaveným na 4, služba načte data pomocí 4 oddílů s ID v rozsahu <=20, [21, 50], [51, 80] a >=81. Tady jsou další ukázkové dotazy pro různé scénáře: 1. Dotaz na celou tabulku: SELECT * FROM <TableName> WHERE ?DfDynamicRangePartitionCondition2. Dotaz z tabulky s výběrem sloupce a dalšími filtry klauzule where: SELECT <column_list> FROM <TableName> WHERE ?DfDynamicRangePartitionCondition AND <your_additional_where_clause>3. Dotaz s poddotazy: SELECT <column_list> FROM (<your_sub_query>) AS T WHERE ?DfDynamicRangePartitionCondition AND <your_additional_where_clause>4. Dotaz s partiční v poddotazu: SELECT <column_list> FROM (SELECT <your_sub_query_column_list> FROM <TableName> WHERE ?DfDynamicRangePartitionCondition) AS T |
Osvědčené postupy pro načtení dat s možností dělení:
- Zvolte výrazný sloupec jako sloupec oddílu (například primární klíč nebo jedinečný klíč), abyste se vyhnuli nerovnoměrné distribuci dat.
- Pokud má tabulka vestavěný oddíl, použijte možnost "Fyzické oddíly tabulky" ke zlepšení výkonu.
- Pokud ke kopírování dat používáte Azure Integration Runtime, můžete nastavit větší jednotky integrace dat Data Integration Units (DIU)" (>4) tak, aby využívaly více výpočetních prostředků. Zkontrolujte tam příslušné scénáře.
- "Stupeň paralelismu kopírování" určuje počet oddílů; pokud je tato hodnota nastavena příliš vysoko, může někdy snížit výkon. Doporučujeme nastavit tuto hodnotu na (DIU nebo počet uzlů místního prostředí IR) krát (2 až 4)."
Příklad: Úplné načtení z velké tabulky s fyzickými oddíly
"source": {
"type": "SqlSource",
"partitionOption": "PhysicalPartitionsOfTable"
}
Příklad: Dotaz s particí dynamického rozsahu
"source": {
"type": "SqlSource",
"query": "SELECT * FROM <TableName> WHERE ?DfDynamicRangePartitionCondition AND <your_additional_where_clause>",
"partitionOption": "DynamicRange",
"partitionSettings": {
"partitionColumnName": "<partition_column_name>",
"partitionUpperBound": "<upper_value_of_partition_column (optional) to decide the partition stride, not as data filter>",
"partitionLowerBound": "<lower_value_of_partition_column (optional) to decide the partition stride, not as data filter>"
}
}
Ukázkový dotaz pro kontrolu fyzického oddílu
SELECT DISTINCT s.name AS SchemaName, t.name AS TableName, pf.name AS PartitionFunctionName, c.name AS ColumnName, iif(pf.name is null, 'no', 'yes') AS HasPartition
FROM sys.tables AS t
LEFT JOIN sys.objects AS o ON t.object_id = o.object_id
LEFT JOIN sys.schemas AS s ON o.schema_id = s.schema_id
LEFT JOIN sys.indexes AS i ON t.object_id = i.object_id
LEFT JOIN sys.index_columns AS ic ON ic.partition_ordinal > 0 AND ic.index_id = i.index_id AND ic.object_id = t.object_id
LEFT JOIN sys.columns AS c ON c.object_id = ic.object_id AND c.column_id = ic.column_id
LEFT JOIN sys.partition_schemes ps ON i.data_space_id = ps.data_space_id
LEFT JOIN sys.partition_functions pf ON pf.function_id = ps.function_id
WHERE s.name='[your schema]' AND t.name = '[your table name]'
Pokud má tabulka fyzické rozdělení, zobrazí se "HasPartition" jako "ano", jak je vidět níže.
Osvědčený postup při načítání dat do SQL Server
Při kopírování dat do SQL Server můžete vyžadovat jiné chování při zápisu:
- Připojit: Zdrojová data mají pouze nové záznamy.
- Upsert: Zdrojová data obsahují vložení i aktualizace.
- Přepsat: Pokaždé chci znovu načíst celou tabulku dimenzí.
- Psaní s vlastní logikou: Potřebuji další zpracování před posledním vložením do cílové tabulky.
Informace o konfiguraci a osvědčených postupech najdete v příslušných částech.
Připojení dat
Připojování dat je výchozím chováním tohoto sink konektoru SQL Server. Služba uskuteční hromadné vložení pro efektivní zápis do vaší tabulky. Zdroj a jímku můžete odpovídajícím způsobem nakonfigurovat v aktivitě kopírování.
Upsert dat
Copy activity teď podporuje nativní načítání dat do dočasné databázové tabulky a následně aktualizujte data v cílové tabulce, pokud existuje klíč, nebo jinak vložte nová data. Další informace o nastavení upsertu v aktivitách kopírování najdete v tématu SQL Server jako jímka.
Přepsat celou tabulku
Vlastnost preCopyScript můžete nakonfigurovat v jímce aktivity kopírování. V tomto případě pro každou aktivitu kopírování, která se spouští, služba nejprve spustí skript. Potom spustí kopii pro vložení dat. Pokud chcete například přepsat celou tabulku nejnovějšími daty, zadejte skript, který nejprve odstraní všechny záznamy před hromadným načtením nových dat ze zdroje.
Zápis dat pomocí vlastní logiky
Postup zápisu dat s vlastní logikou je podobný krokům popsaným v části Upsert data . Pokud potřebujete použít dodatečné zpracování před konečným vložením zdrojových dat do cílové tabulky, můžete načíst pracovní tabulku a pak vyvolat aktivitu uložené procedury nebo vyvolat uloženou proceduru v jímce aktivity kopírování, která použije data.
Vyvolání uložené procedury z jímky SQL
Při kopírování dat do SQL Server databáze můžete také nakonfigurovat a vyvolat uživatelem zadanou uloženou proceduru s dalšími parametry v každé dávce zdrojové tabulky. Funkce uložených procedur využívá parametry s typem tabulky. Všimněte si, že služba automaticky zabalí uloženou proceduru do své vlastní transakce, takže jakákoli transakce vytvořená uvnitř uložené procedury se stane vnořenou transakcí a může mít vliv na zpracování výjimek.
Uloženou proceduru můžete použít, když předdefinované mechanismy kopírování neslouží k účelu. Příkladem je, když chcete použít dodatečné zpracování před posledním vložením zdrojových dat do cílové tabulky. Některé další příklady zpracování jsou, když chcete sloučit sloupce, vyhledat další hodnoty a vložit do více než jedné tabulky.
Následující ukázka ukazuje, jak pomocí uložené procedury provést upsert do tabulky v SQL Server databázi. Předpokládejme, že vstupní data a tabulka Marketing jako cílové místo mají tři sloupce: ProfileID, State a Category. Proveďte upsert založený na sloupci ProfileID a použijte ho pouze pro konkrétní kategorii s názvem ProductA.
V databázi definujte typ tabulky se stejným názvem jako sqlWriterTableType. Schéma typu tabulky je stejné jako schéma vrácené vstupními daty.
CREATE TYPE [dbo].[MarketingType] AS TABLE( [ProfileID] [varchar](256) NOT NULL, [State] [varchar](256) NOT NULL, [Category] [varchar](256) NOT NULL )V databázi definujte uloženou proceduru se stejným názvem jako sqlWriterStoredProcedureName. Zpracovává vstupní data ze zadaného zdroje a slučuje se do výstupní tabulky. Název parametru typu tabulky v uložené proceduře je stejný jako tableName definovaný v datové sadě.
CREATE PROCEDURE spOverwriteMarketing @Marketing [dbo].[MarketingType] READONLY, @category varchar(256) AS BEGIN MERGE [dbo].[Marketing] AS target USING @Marketing AS source ON (target.ProfileID = source.ProfileID and target.Category = @category) WHEN MATCHED THEN UPDATE SET State = source.State WHEN NOT MATCHED THEN INSERT (ProfileID, State, Category) VALUES (source.ProfileID, source.State, source.Category); ENDV aktivitě kopírování definujte oddíl jímky SQL následujícím způsobem:
"sink": { "type": "SqlSink", "sqlWriterStoredProcedureName": "spOverwriteMarketing", "storedProcedureTableTypeParameterName": "Marketing", "sqlWriterTableType": "MarketingType", "storedProcedureParameters": { "category": { "value": "ProductA" } } }
Mapování vlastností toku dat
Při transformaci dat při mapování toku dat můžete číst a zapisovat do tabulek z SQL Server Database. Další informace najdete v tématu transformace zdroje a transformace jímky v mapování toků dat.
Poznámka:
Pokud chcete získat přístup k místnímu SQL Serveru, musíte použít Azure Data Factory nebo pracovní prostor Synapse Spravovaná virtuální síť pomocí privátního koncového bodu. Podrobný postup najdete v tomto kurzu .
Transformace zdroje
Následující tabulka uvádí vlastnosti podporované SQL Server zdrojem. Tyto vlastnosti můžete upravit na kartě Možnosti zdroje.
| Název | Popis | Povinné | Povolené hodnoty | Vlastnost skriptu toku dat |
|---|---|---|---|---|
| Tabulka | Pokud jako vstup vyberete tabulku, tok dat načte všechna data z tabulky zadané v datové sadě. | Ne | - | - |
| Dotaz | Pokud jako vstup vyberete Dotaz, zadejte dotaz SQL pro načtení dat ze zdroje, který přepíše jakoukoli tabulku, kterou zadáte v datové sadě. Použití dotazů je skvělý způsob, jak snížit počet řádků pro testování nebo vyhledávání. Klauzule Order By není podporovaná, ale můžete nastavit úplný příkaz SELECT FROM. Můžete také použít uživatelem definované funkce tabulek. select * from udfGetData() je UDF v SQL, která vrací tabulku, kterou můžete použít v toku dat. Příklad dotazu: Select * from MyTable where customerId > 1000 and customerId < 2000 |
Ne | String | dotaz |
| Velikost dávky | Zadejte velikost dávky pro rozdělení velkých dat do úseků. | Ne | Celé číslo | batchSize (velikost dávky) |
| Úroveň izolace | Zvolte jednu z následujících úrovní izolace: - Přečteno potvrzeno – Read Uncommitted (nepotvrzené čtení, výchozí) - Opakovatelné čtení -Serializovatelný – Žádné (ignorovat úroveň izolace) |
Ne | READ_COMMITTED (čtení potvrzené) READ_UNCOMMITTED Opakovatelná čtení SERIALIZOVATELNÝ ŽÁDNÝ |
úroveň izolace |
| Povolení přírůstkové extrakce | Pomocí této možnosti můžete informovat službu ADF, aby zpracovávala pouze řádky, které se změnily od posledního spuštění tohoto datového kanálu. | Ne | - | - |
| Přírůstkový sloupec kalendářních dat | Při použití funkce přírůstkového extrakce musíte zvolit sloupec data a času, který chcete použít jako vodoznak ve zdrojové tabulce. | Ne | - | - |
| Povolení nativního zachytávání dat změn (Preview) | Pomocí této možnosti můžete službě ADF sdělit, aby zpracovávala pouze data přírůstkových změn zachycená pomocí SQL Change Data Capture od posledního spuštění kanálu. S touto možností se delta data, včetně vložení, aktualizace a odstranění, načtou automaticky bez nutnosti sloupce pro přírůstkové datum. Před použitím této možnosti v ADF je potřeba povolit zachytávání změny dat na SQL Server. Další informace o této možnosti v ADF najdete v nativním zachytávání dat změn. | Ne | - | - |
| Začít číst od začátku | Nastavení této možnosti s přírůstkovým extrahováním dá ADF pokyn ke čtení všech řádků při prvním spuštění kanálu se zapnutým přírůstkovým extrahováním. | Ne | - | - |
Tip
Běžný výraz tabulky (CTE) v SQL není podporován v režimu dotazu mapování toku dat, protože předpokladem použití tohoto režimu je, že dotazy lze použít v klauzuli FROM dotazu SQL, ale CTE toto nedokáže. Pokud chcete používat CTE, musíte vytvořit uloženou proceduru pomocí následujícího dotazu:
CREATE PROC CTESP @query nvarchar(max)
AS
BEGIN
EXECUTE sp_executesql @query;
END
Pak použijte režim Uložená procedura ve zdrojové transformaci mapování toku dat a nastavte @query jako v příkladu with CTE as (select 'test' as a) select * from CTE. Pak můžete použít CTE podle očekávání.
příklad zdrojového skriptu SQL Server
Pokud jako typ zdroje použijete SQL Server, přidružený skript toku dat:
source(allowSchemaDrift: true,
validateSchema: false,
isolationLevel: 'READ_UNCOMMITTED',
query: 'select * from MYTABLE',
format: 'query') ~> SQLSource
Transformace jímky
Následující tabulka uvádí vlastnosti podporované SQL Server jímkou. Tyto vlastnosti můžete upravit na kartě Možnosti jímky.
| Název | Popis | Povinné | Povolené hodnoty | Vlastnost skriptu toku dat |
|---|---|---|---|---|
| Metoda aktualizace | Určete, jaké operace jsou povolené v cíli databáze. Výchozí hodnota je povolit pouze vkládání. Pokud chcete aktualizovat, upsertovat nebo odstranit řádky, je potřeba použít transformaci upravit řádek k označení řádků pro tyto akce. |
Ano |
true nebo false |
smazatelný vložitelné aktualizovatelné upsertable |
| Klíčové sloupce | U aktualizací, upsertů a odstranění je nutné nastavit klíčové sloupce, aby bylo možné určit, který řádek se má změnit. Název sloupce, který vyberete jako klíč, se použije jako součást následných aktualizací, upsertů a odstranění. Proto je nutné vybrat sloupec, který existuje v mapování jímky. |
Ne | Pole | klíče |
| Přeskočte zadávání klíčových sloupců | Pokud chcete hodnotu nezapsat do klíčového sloupce, vyberte Přeskočit psaní klíčových sloupců. | Ne |
true nebo false |
skipKeyWrites |
| Akce pro tabulku | Určuje, zda se mají před zápisem znovu vytvořit nebo odebrat všechny řádky z cílové tabulky. - Žádná akce: Na tabulce nebude provedena žádná akce. - Znovu vytvořte: Tabulka bude odstraněna a znovu vytvořena. Vyžaduje se při dynamickém vytváření nové tabulky. - Truncovat: Všechny řádky z cílové tabulky budou odstraněny. |
Ne |
true nebo false |
znovu vytvořit zkrátit |
| Velikost dávky | Určete, kolik řádků se zapisuje v každé dávce. Větší velikosti dávek zlepšují kompresi a optimalizaci paměti, ale při ukládání dat do mezipaměti může dojít k chybám kvůli vyčerpání paměti. | Ne | Celé číslo | batchSize (velikost dávky) |
| Skripty před-SQL a po-SQL | Zadejte víceřádkové skripty SQL, které se spustí před (předzpracováním) a po (případném zpracování), než se data zapíší do vaší cílové databáze. | Ne | String | předSQL dotazy postSQLs |
Tip
- Doporučujeme rozdělit jednotlivé skripty s více příkazy do několika samostatných dávek.
- Pouze příkazy DDL (Data Definition Language) a DML (Data Manipulation Language), které vracejí jednoduchý počet aktualizací, mohou být spuštěny jako součást dávky. Další informace o provádění dávkových operací
Příklad skriptu jímky SQL Server
Pokud jako typ jímky použijete SQL Server, přidružený skript toku dat:
IncomingStream sink(allowSchemaDrift: true,
validateSchema: false,
deletable:false,
insertable:true,
updateable:true,
upsertable:true,
keys:['keyColumn'],
format: 'table',
skipDuplicateMapInputs: true,
skipDuplicateMapOutputs: true) ~> SQLSink
Mapování datových typů pro SQL Server
Při kopírování dat z i do SQL Serveru se používá následující mapování datových typů z SQL Serveru na dočasné datové typy Azure Data Factory. Kanály Synapse, které implementují službu Data Factory, používají stejné mapování. Informace o tom, jak aktivita kopírování mapuje zdrojové schéma a datový typ na jímku, najdete v tématu Mapování schématu a datového typu.
| datový typ SQL Server | Dočasný datový typ služby Data Factory |
|---|---|
| bigint | Int64 |
| binární | Bajt[] |
| bitové | logický |
| char | Řetězec, Znak[] |
| datum | DatumČas |
| Datum a čas | DatumČas |
| datetime2 | DatumČas |
| Datetimeoffset | DateTimeOffset |
| Desetinné číslo | Desetinné číslo |
| Atribut FILESTREAM (varbinary(max)) | Bajt[] |
| Float | Hodnota s dvojitou přesností |
| bitová kopie | Bajt[] |
| int | Int32 |
| peníze | Desetinné číslo |
| nchar | Řetězec, Znak[] |
| ntext | Řetězec, Znak[] |
| numerické | Desetinné číslo |
| nvarchar | Řetězec, Znak[] |
| skutečný | Jednotlivý |
| rowversion | Bajt[] |
| smalldatetime | DatumČas |
| smallint | Int16 |
| drobné peníze | Desetinné číslo |
| sql_variant | Objekt |
| poslat SMS | Řetězec, Znak[] |
| čas | TimeSpan |
| časové razítko | Bajt[] |
| tinyint | Int16 |
| jedinečný identifikátor | Guid |
| varbinary | Bajt[] |
| varchar | Řetězec, Znak[] |
| xml | String |
Poznámka:
U datových typů mapovaných na dočasný typ Decimal aktuálně Copy activity podporuje přesnost až 28. Pokud máte data, která vyžadují přesnost větší než 28, zvažte převod na řetězec v dotazu SQL.
Při kopírování dat z SQL Server pomocí Azure Data Factory se bitový datový typ mapuje na logický dočasný datový typ. Pokud máte data, která je potřeba uchovávat jako datový typ bitu, použijte dotazy s T-SQL CAST nebo CONVERT.
Vlastnosti aktivity vyhledávání
Zjistit podrobnosti o vlastnostech můžete v aktivitě Vyhledávání.
Vlastnosti aktivity GetMetadata
Podrobnosti o vlastnostech najdete v aktivitě GetMetadata.
Použití funkce Always Encrypted
Při kopírování dat z/do SQL Server pomocí Always Encrypted postupujte následovně:
Uložte sloupcový hlavní klíč (CMK) do Azure Key Vault. Zjistěte více o tom, jak nakonfigurovat funkci Always Encrypted pomocí Azure Key Vault.
Nezapomeňte udělit přístup k trezoru klíčů, kde je uložený hlavní klíč sloupce (CMK ). Požadovaná oprávnění najdete v tomto článku .
Vytvořte propojenou službu pro připojení k databázi SQL a povolte funkci 'Always Encrypted' pomocí spravované identity nebo služebního principálu.
Poznámka:
SQL Server Always Encrypted podporuje následující scénáře:
- Úložiště dat zdroje nebo vstupně-výstupní úložiště používá spravovanou identitu nebo aplikační identitu jako typ ověřování poskytovatele klíčů.
- Úložiště dat zdrojů i cílová úložiště používají spravovanou identitu jako typ ověřování poskytovatele klíčů.
- Úložiště dat zdrojů a cílů používají stejného služebního uživatele jako typ ověřování pro poskytovatele klíčů.
Poznámka:
V současné době se SQL Server Always Encrypted podporuje pouze transformace zdroje v mapování toků dat.
Nativní zachytávání dat změn
Azure Data Factory může podporovat nativní možnosti zachytávání dat změn pro SQL Server, Azure SQL DB a Azure SQL MI. Změněná data, včetně vložení, aktualizace a odstranění řádků v úložištích SQL, je možné automaticky rozpoznat a extrahovat mapováním toku dat ADF. Bez zkušeností s kódem při mapování toku dat můžou uživatelé snadno dosáhnout scénáře replikace dat z úložišť SQL připojením databáze jako cílového úložiště. Kromě toho mohou uživatelé také vytvořit libovolnou logiku transformace dat mezi tím, aby dosáhli scénáře přírůstkového ETL z úložišť SQL.
Ujistěte se, že název kanálu a aktivity zůstane beze změny, aby bylo možné kontrolní bod zaznamenat službou ADF, abyste získali změněná data z posledního spuštění automaticky. Pokud změníte název kanálu nebo aktivity, kontrolní bod bude resetován, což znamená, že při příštím spuštění začnete od začátku, nebo se změny zapracují od tohoto okamžiku. Pokud chcete změnit název kanálu nebo název aktivity, ale přesto zachovat kontrolní bod, abyste získali změněná data z posledního spuštění automaticky, použijte k tomu vlastní klíč kontrolního bodu v aktivitě toku dat.
Při ladění kanálu funguje tato funkce stejně. Mějte na paměti, že kontrolní bod bude obnoven při obnovení prohlížeče během spuštění ladění. Jakmile budete spokojeni s výsledkem potrubí z ladicího spuštění, můžete pokračovat v publikaci a spuštění potrubí. V okamžiku, kdy poprvé spustíte publikovanou pipeline, se buď automaticky restartuje od začátku, nebo se změny uplatní od této chvíle.
V části monitorování máte vždy možnost znovu spustit pipeline. Když tak učiníte, změněná data se vždy zaznamenávají z předchozího kontrolního bodu vybraného datového toku.
Příklad 1:
Když přímo zřetězíte zdrojovou transformaci, která odkazuje na datovou sadu s povoleným SQL CDC, s cílovou transformací, která odkazuje na databázi v datovém toku, změny provedené ve zdroji SQL se automaticky použijí na cílovou databázi. To vám snadno umožní vytvořit scénář replikace dat mezi databázemi. Metodu aktualizace v transformaci jímky můžete použít k výběru, jestli chcete povolit vložení, povolit aktualizaci nebo povolit odstranění v cílové databázi. Ukázkový skript mapování toku dat je následující.
source(output(
id as integer,
name as string
),
allowSchemaDrift: true,
validateSchema: false,
enableNativeCdc: true,
netChanges: true,
skipInitialLoad: false,
isolationLevel: 'READ_UNCOMMITTED',
format: 'table') ~> source1
source1 sink(allowSchemaDrift: true,
validateSchema: false,
deletable:true,
insertable:true,
updateable:true,
upsertable:true,
keys:['id'],
format: 'table',
skipDuplicateMapInputs: true,
skipDuplicateMapOutputs: true,
errorHandlingOption: 'stopOnFirstError') ~> sink1
Příklad 2:
Pokud chcete povolit scénář ETL místo replikace dat mezi databází prostřednictvím SLUŽBY CDC SQL, můžete použít výrazy v mapování toku dat včetně isInsert(1), isUpdate(1) a isDelete(1) k rozlišení řádků s různými typy operací. Následuje jeden z ukázkových skriptů pro mapování toku dat, který odvozuje jeden sloupec s hodnotou: 1 pro označení vložených řádků, 2 pro označení aktualizovaných řádků a 3 pro označení odstraněných řádků, aby podřízené transformace mohly zpracovat delta data.
source(output(
id as integer,
name as string
),
allowSchemaDrift: true,
validateSchema: false,
enableNativeCdc: true,
netChanges: true,
skipInitialLoad: false,
isolationLevel: 'READ_UNCOMMITTED',
format: 'table') ~> source1
source1 derive(operationType = iif(isInsert(1), 1, iif(isUpdate(1), 2, 3))) ~> derivedColumn1
derivedColumn1 sink(allowSchemaDrift: true,
validateSchema: false,
skipDuplicateMapInputs: true,
skipDuplicateMapOutputs: true) ~> sink1
Známé omezení:
- ADF načte pouze čisté změny z SQL CDC prostřednictvím cdc.fn_cdc_get_net_changes_.
Odstraňování potíží s připojením
Nakonfigurujte instanci SQL Server tak, aby přijímala vzdálená připojení. Spusťte SQL Server Management Studio, klikněte pravým tlačítkem na server a vyberte Properties. V seznamu vyberte Připojení a zaškrtněte políčko Povolit vzdálená připojení k tomuto serveru.
Podrobný postup najdete v tématu Konfigurace možnosti konfigurace serveru vzdáleného přístupu.
Spusťte SQL Server Configuration Manager. Rozbalte Síťová konfigurace SQL Serveru pro požadovanou instanci a vyberte Protokoly pro MSSQLSERVER. Protokoly se zobrazí v pravém podokně. Povolte tcp/IP tak, že kliknete pravým tlačítkem na TCP/IP a vyberete Povolit.
Další informace a alternativní způsoby povolení protokolu TCP/IP naleznete v tématu Povolení nebo zakázání síťového protokolu serveru.
Ve stejném okně poklikejte na tcp/IP a spusťte okno Vlastnosti protokolu TCP/IP.
Přepněte na záložku IP Addresses. Posuňte se dolů, abyste viděli část IPAll. Napište si TCP port. Výchozí hodnota je 1433.
Vytvořte na počítači pravidlo pro bránu firewall Windows, abyste umožnili příchozí provoz přes tento port.
Ověřit připojení: Pokud se chcete připojit k SQL Serveru pomocí plně kvalifikovaného názvu, použijte SQL Server Management Studio z jiného počítače. Příklad:
"<machine>.<domain>.corp.<company>.com,1433".
Upgrade verze SQL Server
Pokud chcete upgradovat verzi SQL Server, na stránce Editovat propojenou službu vyberte Doporučeno v části Verze a nakonfigurujte propojenou službu podle Vlastností propojené služby pro doporučenou verzi.
Rozdíly mezi doporučenou a starší verzí
Následující tabulka ukazuje rozdíly mezi SQL Server používáním doporučené a starší verze.
| Doporučená verze | Starší verze |
|---|---|
Podpora protokolu TLS 1.3 prostřednictvím encrypt jako strict. |
Protokol TLS 1.3 se nepodporuje. |
Související obsah
Seznam úložišť dat podporovaných jako zdroje a cíle pro aktivitu kopírování najdete v tématu Podporované úložiště dat.