Konfigurácia služby Azure Synapse Analytics do kopírovanej aktivity
Tento článok popisuje, ako používať aktivitu kopírovania v kanáli údajov na kopírovanie údajov zo služby Azure Synapse Analytics a do tejto služby.
Podporovaná konfigurácia
Ak chcete nastaviť každú kartu v časti Aktivita kopírovania, prejdite do nasledujúcich sekcií.
Všeobecné
Ak chcete nakonfigurovať kartu Všeobecné nastavenia, prečítajte si tému Všeobecné pokyny na nastavenie.
Source
Azure Synapse Analytics na karte Zdroj kopírovanej aktivity sú podporované nasledujúce vlastnosti.
Vyžadujú sa nasledujúce vlastnosti:
Typ ukladacieho priestoru údajov: Vyberte položku Externé.
Pripojenie ion: Zo zoznamu pripojení vyberte pripojenie k službe Azure Synapse Analytics. Ak pripojenie neexistuje, vytvorte nové pripojenie k službe Azure Synapse Analytics výberom položky Nové.
typ Pripojenie ion: vyberte položku Azure Synapse Analytics.
Použiť dotaz: Zdrojové údaje môžete prečítať výberom položky Tabuľka, Dotaz alebo Uložená procedúra . Nasledujúci zoznam popisuje konfiguráciu každého nastavenia:
Table: Ak vyberiete toto tlačidlo, prečítajte údaje z tabuľky, ktorú ste zadali v tabuľke Table . Z rozbaľovacieho zoznamu vyberte tabuľku alebo výberom položky Upraviť zadajte schému a názov tabuľky manuálne.
Dotaz: zadajte vlastný dotaz SQL na čítanie údajov. Príkladom je adresa
select * from MyTable
. Môžete tiež vybrať ikonu ceruzky a upraviť ju v editore kódu.Uložená procedúra: použite uloženú procedúru, ktorá číta údaje zo zdrojovej tabuľky. Posledným príkazom SQL musí byť príkaz SELECT v uloženej procedúre.
- Uložený názov procedúry: Vyberte uloženú procedúru alebo manuálne zadajte názov uloženej procedúry pri výbere položky Upraviť.
- Uložené parametre procedúry: Vyberte parametre importu na importovanie parametra do zadanej uloženej procedúry alebo pridajte parametre pre uloženú procedúru výberom položky + Nové. Povolené hodnoty sú páry názvov alebo hodnôt. Názvy a puzdro parametrov sa musia zhodovať s názvami a puzdrom parametrov uloženej procedúry.
V časti Rozšírené môžete zadať nasledujúce polia:
Časový limit dotazu (minúty): Zadajte časový limit pre vykonanie príkazu dotazu, predvolená hodnota je 120 minút. Ak je parameter nastavený pre túto vlastnosť, povolené hodnoty sú časové rozpätie, napríklad 02:00:00 (120 minút).
Úroveň izolácie: Určuje správanie uzamknutia transakcií pre zdroj SQL. Povolené hodnoty sú: None, Read committed, Read uncommitted, Repeatable read, Serializable alebo Snapshot. Ak parameter nie je zadaný, použije sa žiadna úroveň izolácie. Ďalšie podrobnosti nájdete v článku IsolationLevel Enum .
Možnosť oblasti: zadajte možnosti rozdelenia údajov používané na načítanie údajov zo služby Azure Synapse Analytics. Povolené hodnoty sú: Žiadne (predvolené), Fyzické oblasti tabuľky a Dynamický rozsah. Keď je povolená možnosť oblasti (to nie je Žiadne), úroveň paralelného načítavania údajov zo služby Azure Synapse Analytics je riadená nastavením paralelného kopírovania v aktivite kopírovania.
Žiadne: Vyberte toto nastavenie, ak chcete nepoužiť oblasť.
Fyzické oblasti tabuľky: Ak chcete použiť fyzickú oblasť, vyberte toto nastavenie. Stĺpec a mechanizmus oblasti sa automaticky určia na základe definície fyzickej tabuľky.
Dynamický rozsah: Ak chcete použiť oblasť dynamického rozsahu, vyberte toto nastavenie. Pri použití dotazu so súbežným povolením je potrebný parameter oblasti rozsahu(
?DfDynamicRangePartitionCondition
). Vzorový dotaz:SELECT * FROM <TableName> WHERE ?DfDynamicRangePartitionCondition
.- Názov stĺpca oblasti: Zadajte názov zdrojového stĺpca na celé číslo alebo typ dátumu/dátumu a času (
int
, ,smallint
,date
bigint
,smalldatetime
,datetime
datetime2
, alebodatetimeoffset
), ktorý sa používa podľa rozdelenia rozsahu na paralelné kopírovanie. Ak nie je zadaný, index alebo primárny kľúč tabuľky sa automaticky zistí a použije ako stĺpec oblasti. - Horná hranica oblasti: Zadajte maximálnu hodnotu stĺpca oblasti na rozdelenie rozsahu oblastí. Táto hodnota sa používa na rozhodnutie o kroku rozdelenia, nie na filtrovanie riadkov v tabuľke. Všetky riadky v tabuľke alebo výsledku dotazu sa rozdelia a skopírujú.
- Dolná hranica oblasti: Zadajte minimálnu hodnotu stĺpca oblasti na rozdelenie rozsahu oblastí. Táto hodnota sa používa na rozhodnutie o kroku rozdelenia, nie na filtrovanie riadkov v tabuľke. Všetky riadky v tabuľke alebo výsledku dotazu sa rozdelia a skopírujú.
- Názov stĺpca oblasti: Zadajte názov zdrojového stĺpca na celé číslo alebo typ dátumu/dátumu a času (
Ďalšie stĺpce: Pridajte ďalšie stĺpce údajov na ukladanie relatívnej cesty alebo statickej hodnoty zdrojových súborov. Pre druhý sa podporuje výraz. Ďalšie informácie nájdete v časti Pridanie ďalších stĺpcov počas kopírovania.
Cieľ
Pre službu Azure Synapse Analytics na karte Cieľ kopírovanej aktivity sú podporované nasledujúce vlastnosti.
Vyžadujú sa nasledujúce vlastnosti:
- Typ ukladacieho priestoru údajov: Vyberte položku Externé.
- Pripojenie ion: Zo zoznamu pripojení vyberte pripojenie k službe Azure Synapse Analytics. Ak pripojenie neexistuje, vytvorte nové pripojenie k službe Azure Synapse Analytics výberom položky Nové.
- typ Pripojenie ion: vyberte položku Azure Synapse Analytics.
- Možnosť Tabuľka: Môžete vybrať možnosť Použiť existujúce, Automaticky vytvoriť tabuľku. Nasledujúci zoznam popisuje konfiguráciu každého nastavenia:
- Použiť existujúce: Z rozbaľovacieho zoznamu vyberte tabuľku vo svojej databáze. Alebo skontrolujte položku Upraviť a zadajte schému a názov tabuľky manuálne.
- Automaticky vytvoriť tabuľku: V zdrojovej schéme sa automaticky vytvorí tabuľka (ak neexistuje).
V časti Rozšírené môžete zadať nasledujúce polia:
Kopírovať metódu Vyberte metódu, ktorú chcete použiť na kopírovanie údajov. Môžete vybrať položku Kopírovať príkaz, PolyBase, Hromadné vloženie alebo Upsert. Nasledujúci zoznam popisuje konfiguráciu každého nastavenia:
Príkaz Kopírovať: Pomocou príkazu COPY môžete načítať údaje z ukladacieho priestoru platformy Azure do služby Azure Synapse Analytics alebo fondu SQL.
- Príkaz Povoliť kopírovanie: Je povinné vybrať, keď vyberiete príkaz Kopírovať.
- Predvolené hodnoty: Zadajte predvolené hodnoty pre každý cieľový stĺpec v službe Azure Synapse Analytics. Predvolené hodnoty vo vlastnosti prepíšu množinu obmedzení DEFAULT v sklade údajov a stĺpec identity nemôže mať predvolenú hodnotu.
- Ďalšie možnosti: Ďalšie možnosti, ktoré sa odovzdajú do príkazu COPY služby Azure Synapse Analytics priamo v klauzule "S" v príkaze COPY. Podľa potreby vytvorte cenovú ponuku, aby ste sa zosúladili s požiadavkami na príkaz COPY.
PolyBase: PolyBase je vysoko priepustný mechanizmus. Použite ho na načítanie veľkého množstva údajov do služby Azure Synapse Analytics alebo fondu SQL.
- Povoliť PolyBase: Je povinné byť vybraný, keď si vyberiete PolyBase.
- Typ odmietnutia: zadajte, či možnosť rejectValue predstavuje literálovú hodnotu alebo percentuálnu hodnotu. Povolené hodnoty sú Hodnota (predvolené) a Percentage.
- Zamietnutie hodnoty: zadajte počet alebo percento riadkov, ktoré možno odmietnuť pred zlyhaním dotazu. Ďalšie informácie o možnosti zamietnutí polybase nájdete v časti Argumenty v téme Vytvorenie EXTERNEJ TABUĽKY (Transact-SQL). Povolené hodnoty sú 0 (predvolené), 1, 2 atď.
- Odmietnutie vzorovej hodnoty: Určuje počet riadkov, ktoré sa majú načítať predtým, ako PolyBase prepočíta percento zamietnutých riadkov. Povolené hodnoty sú 1, 2 atď. Ak ako svoj typ odmietnutia vyberiete možnosť Percento , táto vlastnosť sa vyžaduje.
- Použiť predvolené nastavenie typu: Zadajte spôsob na spracovanie chýbajúcich hodnôt v textovom súbore s oddeľovačmi, keď PolyBase načíta údaje z textového súboru. Ďalšie informácie o tejto vlastnosti nájdete v časti Argumenty v téme VYTVORENIE FORMÁT EXTERNÉHO SÚBORU (Transact-SQL). Povolené hodnoty sú vybraté (predvolené) alebo nevybrané.
Hromadné vloženie: hromadné vloženie použite na vloženie údajov do cieľa hromadne.
- Zámok hromadnej vloženia tabuľky: táto možnosť sa používa na zlepšenie výkonu kopírovania počas operácie hromadného vkladania v tabuľke bez indexu z viacerých klientov. Ďalšie informácie nájdete v článku HROMADNÉ VLOŽENIE (Transact-SQL).
Upsert: Zadajte skupinu nastavení pre správanie pri zápise, keď chcete upsertovať údaje do cieľa.
Kľúčové stĺpce: Vyberte stĺpec, ktorý sa používa na určenie toho, či sa riadok zo zdroja zhoduje s riadkom z cieľa.
Zámok hromadnej vloženia tabuľky: táto možnosť sa používa na zlepšenie výkonu kopírovania počas operácie hromadného vkladania v tabuľke bez indexu z viacerých klientov. Ďalšie informácie nájdete v článku HROMADNÉ VLOŽENIE (Transact-SQL).
Skript pred kopírovaním: zadajte skript pre aktivitu kopírovania, ktorý sa má spustiť pred zápisom údajov do cieľovej tabuľky pri každom spustení. Pomocou tejto vlastnosti môžete vyčistiť vopred načítané údaje.
Písanie časového limitu dávky: Zadajte čas čakania na dokončenie operácie vkladania dávky pred uplynutím časového limitu. Povolená hodnota je časové rozpätie. Predvolená hodnota je 00:30:00 (30 minút).
Veľkosť dávky zapisovania: zadajte počet riadkov, ktoré sa majú vložiť do tabuľky SQL na každú dávku. Povolená hodnota je celé číslo (počet riadkov). Služba predvolene dynamicky určuje vhodnú veľkosť dávky na základe veľkosti riadka.
Maximálny počet súbežných pripojení: Zadajte hornú hranicu súbežných pripojení vytvorených do ukladacieho priestoru údajov počas spustenia aktivity. Zadajte hodnotu iba vtedy, keď chcete obmedziť súbežné pripojenia.
Zakázanie analýzy metriky výkonu: toto nastavenie sa používa na zhromažďovanie metrík, ako sú napríklad DTU, DWU, RU atď., na účely kopírovania optimalizácie výkonu a odporúčaní. Ak sa týmto správaním chcete zaoberať, začiarknite toto políčko. Predvolene nie je začiarknuté.
Priame kopírovanie pomocou príkazu COPY
Príkaz AZURE Synapse Analytics COPY priamo podporuje ukladací priestor objektu BLOB platformy Azure a službu Azure Data Lake Storage Gen2 ako ukladací priestor zdrojových údajov. Ak vaše zdrojové údaje spĺňajú kritériá popísané v tejto časti, použite príkaz COPY na skopírovanie priamo zo zdrojového úložiska údajov do služby Azure Synapse Analytics.
Zdrojové údaje a formát obsahujú nasledujúce typy a metódy overovania:
Podporovaný typ úložiska zdrojových údajov Podporovaný formát Podporovaný typ overovania zdroja Ukladací priestor objektu BLOB platformy Azure Text s oddeľovačmi
ParketovéAnonymné overovanie
Overenie kľúča konta
Overenie podpisu zdieľaného prístupuAzure Data Lake Storage Gen2 Text s oddeľovačmi
ParketovéOverenie kľúča konta
Overenie podpisu zdieľaného prístupuMôžete nastaviť nasledujúce nastavenia formátu:
- V prípade parketu: Typ kompresie môže byť Žiadny, snappy alebo gzip.
- Pre reťazec DelimitedText:
- Oddeľovač riadkov: Pri kopírovaní textu s oddeľovačmi do služby Azure Synapse Analytics prostredníctvom príkazu direct COPY zadajte explicitne oddeľovač riadkov (\r; \n; alebo \r\n). Iba ak je oddeľovač riadkov zdrojového súboru \r\n, funguje predvolená hodnota (\r, \n alebo \r\n). V opačnom prípade povoľte fázu pre váš scenár.
- Hodnota Null zostane ako predvolená alebo je nastavená na prázdny reťazec (").
- Kódovanie zostane ako predvolené alebo je nastavené na utf-8 alebo UTF-16.
- Počet riadkov sa vynechá ako predvolený alebo je nastavený na hodnotu 0.
- Typ kompresie môže byť Žiadny alebo gzip.
Ak je váš zdroj priečinkom, musíte začiarknuť políčko Rekurzívne .
Čas začatia (UTC) a čas ukončenia (UTC) vo funkcii Filter podľa poslednej úpravy, pri predpone, povolení vyhľadávania oblastí a nezadáte ďalšie stĺpce .
Informácie o tom, ako ingestovať údaje do služby Azure Synapse Analytics pomocou príkazu COPY, nájdete v tomto článku.
Ak zdrojový ukladací priestor údajov a formát nie sú pôvodne podporované príkazom COPY, použite zinscenovanú kópiu pomocou funkcie príkazu COPY. Automaticky skonvertuje údaje do formátu kompatibilného s príkazom COPY a potom zavolá príkaz COPY na načítanie údajov do služby Azure Synapse Analytics.
Mapovanie
Ak pre konfiguráciu karty Mapovanie nepoužijete službu Azure Synapse Analytics s automatickou tvorbou tabuľky ako cieľ, prejdite na položku Mapovanie.
Ak použijete službu Azure Synapse Analytics s funkciou automatického vytvárania tabuľky ako cieľ, s výnimkou konfigurácie v časti Mapovanie, môžete upraviť typ pre cieľové stĺpce. Po výbere možnosti Importovať schémy môžete zadať typ stĺpca vo svojom cieli.
Napríklad typ stĺpca ID v zdroji je int a pri mapovaní na cieľový stĺpec môžete zmeniť typ pohyblivej čiarky.
Nastavenia
Ak chcete Nastavenia konfiguráciu kariet, prejdite do časti Konfigurácia ďalších nastavení na karte Nastavenia.
Paralelná kópia zo služby Azure Synapse Analytics
Konektor Azure Synapse Analytics v kopírovanej aktivite poskytuje vstavané rozdelenie údajov na súbežné kopírovanie údajov. Možnosti rozdelenia údajov nájdete v aktivite kopírovania na karte Zdroj .
Keď povolíte rozdeľovanie kópie, aktivita kopírovania sa spustí paralelné dotazy voči zdroju Azure Synapse Analytics, aby sa načítali údaje podľa oblastí. Paralelný stupeň sa riadi stupne paralelného spracovania na karte Nastavenia aktivity kopírovania. Ak napríklad nastavíte stupeň paralelného kopírovania na štyri, služba súbežne vygeneruje a spustí štyri dotazy na základe zadanej možnosti a nastavení oblasti a každý dotaz načíta časť údajov z vašej služby Azure Synapse Analytics.
Odporúča sa povoliť paralelnú kópiu s oblasťou údajov najmä vtedy, keď načítate veľké množstvo údajov zo služby Azure Synapse Analytics. Nižšie sú uvedené navrhované konfigurácie pre rôzne scenáre. Pri kopírovaní údajov do úložiska údajov založených na súbore sa odporúča zapísať do priečinka ako viacero súborov (zadať iba názov priečinka). V takom prípade je výkon lepší ako zapisovanie do jedného súboru.
Scenár | Navrhované nastavenia |
---|---|
Úplné načítanie z veľkej tabuľky pomocou fyzických oblastí. | Možnosť oblasti: Fyzické oblasti tabuľky. Počas spustenia služba automaticky rozpozná fyzické oblasti a skopíruje údaje podľa oblastí. Ak chcete skontrolovať, či tabuľka obsahuje fyzickú oblasť alebo nie, môžete odkazovať na tento dotaz. |
Úplné načítanie z veľkej tabuľky bez fyzických oblastí, zatiaľ čo pri celočíselnom stĺpci alebo stĺpci typu datetime na rozdelenie údajov. | Možnosti oblasti: Oblasť dynamického rozsahu. Stĺpec oblasti (voliteľné): Zadajte stĺpec použitý na rozdelenie údajov. Ak parameter nie je zadaný, použije sa stĺpec indexu alebo primárneho kľúča. Horná hranica oblasti a dolná hranica oblasti (voliteľné): Zadajte, ak chcete určiť krok v oblasti. Na filtrovanie riadkov v tabuľke to však nie je možné. Všetky riadky v tabuľke sa rozdelia a skopírujú. Ak parameter nie je zadaný, aktivita kopírovania automaticky rozpozná hodnoty. Ak napríklad stĺpec "ID" vášho oddielu obsahuje hodnoty v rozsahu od 1 do 100 a spodnú hranicu nastavíte ako 20 a hornú hranicu 80, s paralelnou kópiou ako 4, služba načíta údaje podľa 4 oblastí – ID v rozsahu <=20, [21, 50], [51, 80] a >=81. |
Načítajte veľké množstvo údajov pomocou vlastného dotazu bez fyzických oblastí, zatiaľ čo so stĺpcom celé číslo alebo dátum/dátum a čas na rozdelenie údajov. | Možnosti oblasti: Oblasť dynamického rozsahu. Dotaz: SELECT * FROM <TableName> WHERE ?DfDynamicRangePartitionCondition AND <your_additional_where_clause> .Stĺpec oblasti: zadajte stĺpec, ktorý sa používa na rozdelenie údajov. Horná hranica oblasti a dolná hranica oblasti (voliteľné): Zadajte, ak chcete určiť krok v oblasti. Toto nie je pre filtrovanie riadkov v tabuľke, všetky riadky vo výsledku dotazu sa rozdelia a skopírujú. Ak nie je zadaná, aktivita kopírovaním automaticky zistí hodnotu. Ak má napríklad stĺpec vášho stĺpca oblasti "ID" rozsah hodnôt od 1 do 100 a spodnú hranicu nastavíte ako 20 a hornú hranicu 80, s paralelnou kópiou ako 4 služba načíta údaje podľa 4 oblastí– ID v rozsahu <=20, [21, 50], [51, 80] a >=81. Tu sú ďalšie vzorové dotazy pre rôzne scenáre: • Dotaz na celú tabuľku: SELECT * FROM <TableName> WHERE ?DfDynamicRangePartitionCondition • Dotaz z tabuľky s výberom stĺpca a ďalšími filtrami klauzuly where-clause: SELECT <column_list> FROM <TableName> WHERE ?DfDynamicRangePartitionCondition AND <your_additional_where_clause> • Dotaz s poddotazmi: SELECT <column_list> FROM (<your_sub_query>) AS T WHERE ?DfDynamicRangePartitionCondition AND <your_additional_where_clause> • Dotaz s oblasťou v poddotaze: SELECT <column_list> FROM (SELECT <your_sub_query_column_list> FROM <TableName> WHERE ?DfDynamicRangePartitionCondition) AS T |
Najvhodnejšie postupy na načítanie údajov pomocou možnosti oblasti:
- Vyberte rozlišovací stĺpec ako stĺpec oblasti (napríklad primárny kľúč alebo jedinečný kľúč), aby sa predišlo skresleniu údajov.
- Ak tabuľka obsahuje vstavanú oblasť, na získanie lepšieho výkonu použite možnosť oblasti Fyzické oblasti tabuľky .
- Služba Azure Synapse Analytics môže naraz spustiť maximálne 32 dotazov, čím sa nastaví stupeň paralelného kopírovania, ktorý je príliš veľký, môže spôsobiť problém s obmedzovaním synapse.
Vzorový dotaz na kontrolu fyzickej oblasti
SELECT DISTINCT s.name AS SchemaName, t.name AS TableName, c.name AS ColumnName, CASE WHEN c.name IS NULL THEN 'no' ELSE 'yes' END AS HasPartition
FROM sys.tables AS t
LEFT JOIN sys.objects AS o ON t.object_id = o.object_id
LEFT JOIN sys.schemas AS s ON o.schema_id = s.schema_id
LEFT JOIN sys.indexes AS i ON t.object_id = i.object_id
LEFT JOIN sys.index_columns AS ic ON ic.partition_ordinal > 0 AND ic.index_id = i.index_id AND ic.object_id = t.object_id
LEFT JOIN sys.columns AS c ON c.object_id = ic.object_id AND c.column_id = ic.column_id
LEFT JOIN sys.types AS y ON c.system_type_id = y.system_type_id
WHERE s.name='[your schema]' AND t.name = '[your table name]'
Ak tabuľka obsahuje fyzickú oblasť, zobrazí sa časť HasPartition ako "áno".
Súhrn tabuľky
Nasledujúce tabuľky obsahujú ďalšie informácie o aktivite kopírovania v službe Azure Synapse Analytics.
Source
Názov | Popis | Value | Požaduje sa | Vlastnosť skriptu JSON |
---|---|---|---|---|
Typ ukladacieho priestoru údajov | Typ ukladacieho priestoru údajov. | Externé | Áno | / |
Pripojenie ion | Pripojenie k zdrojového úložisku údajov. | < vaše pripojenie > | Áno | Pripojenie |
typ Pripojenie ionu | Typ zdrojového pripojenia. | Azure Synapse Analytics | Áno | / |
Použiť dotaz | Spôsob čítania údajov. | •Tabuľky •Dotaz • Uložená procedúra |
Áno | • typeProperties (pod typeProperties ->source )-Schémy -Tabuľky • sqlReaderQuery • sqlReaderStoredProcedureName storedProcedureParameters -meno -Hodnota |
Časový limit dotazu | Časový limit pre vykonanie príkazu dotazu je predvolene 120 minút. | Timespan | No | queryTimeout (časový limit dotazu) |
Úroveň izolácie | Správanie uzamknutia transakcií pre zdroj SQL. | •Žiadny • Prečítajte si zaviazala • Čítať bez vynechania • Opakovateľný čitateľný • Serializovateľné •Snímka |
No | isolationLevel: • ReadCommitted • ReadUncommitted • Opakovateľné Čítané • Serializovateľné •Snímka |
Možnosť oblasti | Možnosti rozdelenia údajov používané na načítanie údajov z databázy Azure SQL. | •Žiadny • Fyzické oblasti tabuľky • Dynamický rozsah – Názov stĺpca oblasti – Horná hranica oblasti – Dolná hranica oblasti |
No | partition (oblasť)Možnosť: • PhysicalPartitionsOfTable • DynamicRange oblasť Nastavenia: – partitionColumnName – partitionUpperBound – partitionLowerBound |
Ďalšie stĺpce | Pridajte ďalšie stĺpce údajov na ukladanie relatívnej cesty alebo statickej hodnoty zdrojových súborov. Pre druhý sa podporuje výraz. | •Meno •Hodnota |
No | additionalColumns: •meno •Hodnota |
Cieľ
Názov | Popis | Value | Požaduje sa | Vlastnosť skriptu JSON |
---|---|---|---|---|
Typ ukladacieho priestoru údajov | Typ ukladacieho priestoru údajov. | Externé | Áno | / |
Pripojenie ion | Vaše pripojenie do cieľového úložiska údajov. | < vaše pripojenie > | Áno | Pripojenie |
typ Pripojenie ionu | Typ cieľového pripojenia. | Azure Synapse Analytics | Áno | / |
Možnosť Tabuľka | Možnosť cieľovej tabuľky údajov. | • Použiť existujúce • Automaticky vytvoriť tabuľku |
Áno | • typeProperties (pod typeProperties ->sink )-Schémy -Tabuľky • tableMožnosť: – automatické vytvoriť typeProperties (v časti typeProperties ->sink )-Schémy -Tabuľky |
Kopírovať metódu | Metóda použitá na kopírovanie údajov. | • Príkaz Kopírovať • PolyBase • Hromadné vloženie • Upsert |
No | / |
Pri výbere príkazu Kopírovať | Príkaz COPY použite na načítanie údajov z úložiska Azure do služby Azure Synapse Analytics alebo fondu SQL. | / | Nie. Použiť pri použití funkcie COPY. |
allowCopyCommand: true copyCommand Nastavenia |
Predvolené hodnoty | Zadajte predvolené hodnoty pre každý cieľový stĺpec v službe Azure Synapse Analytics. Predvolené hodnoty vo vlastnosti prepíšu množinu obmedzení DEFAULT v sklade údajov a stĺpec identity nemôže mať predvolenú hodnotu. | < predvolené hodnoty > | No | defaultValues: – columnName – defaultValue |
Ďalšie možnosti | Ďalšie možnosti, ktoré sa odovzdajú do príkazu COPY služby Azure Synapse Analytics priamo v klauzule "S" v príkaze COPY. Podľa potreby vytvorte cenovú ponuku, aby ste sa zosúladili s požiadavkami na príkaz COPY. | < ďalšie možnosti > | No | additionalMožnosti: - <názov> vlastnosti : <hodnota> |
Pri výbere položky PolyBase | PolyBase je mechanizmus vysokej priepustosti. Použite ho na načítanie veľkého množstva údajov do služby Azure Synapse Analytics alebo fondu SQL. | / | Nie. Použite funkciu Pri používaní PolyBase. |
allowPolyBase: true polyBase Nastavenia |
Typ odmietnutia | Typ hodnoty zamietnutia. | •Hodnota •Percento |
No | rejectType: -Hodnota -Percento |
Zamietnutie hodnoty | Počet alebo percento riadkov, ktoré je možné odmietnuť pred zlyhaním dotazu. | 0 (predvolené), 1, 2 atď. | No | hodnota rejectValue |
Zamietnutie vzorovej hodnoty | Určí počet riadkov, ktoré sa majú načítať predtým, ako PolyBase prepočíta percento zamietnutých riadkov. | 1, 2 atď. | Áno, keď ako typ odmietnutia zadáte Percento | rejectSampleValue |
Použiť predvolený typ | Zadajte, ako spracovať chýbajúce hodnoty v textovom súbore s oddeľovačmi, keď PolyBase načíta údaje z textového súboru. Ďalšie informácie o tejto vlastnosti nájdete v časti Argumenty v téme VYTVORENIE FORMÁTU EXTERNÉHO SÚBORU (Transact-SQL) | vybratá (predvolená) alebo nevybratá. | No | useTypeDefault: true (predvolené) alebo false |
Pri výbere položky Hromadné vloženie | Vložte údaje do cieľa hromadne. | / | No | writeBehavior: Vložiť |
Zámok hromadnej vloženia tabuľky | Táto možnosť sa používa na zlepšenie výkonu kopírovania počas operácie hromadného vloženia v tabuľke bez indexu z viacerých klientov. Ďalšie informácie nájdete v článku HROMADNÉ VLOŽENIE (Transact-SQL). | vybraté alebo nevybrané (predvolené) | No | sqlWriterUseTableLock: true alebo false (predvolené) |
Pri výbere možnosti Upsert (Certifikát) | Ak chcete upsertovať údaje do cieľa, zadajte skupinu nastavení pre správanie pri zapisovaní. | / | No | writeBehavior: Upsert |
Kľúčové stĺpce | Udáva, ktorý stĺpec sa používa na určenie toho, či sa riadok zo zdroja zhoduje s riadkom z cieľa. | < názov stĺpca> | No | upsert Nastavenia: – kľúče: < názov stĺpca > – interimSchemaName |
Zámok hromadnej vloženia tabuľky | Táto možnosť sa používa na zlepšenie výkonu kopírovania počas operácie hromadného vloženia v tabuľke bez indexu z viacerých klientov. Ďalšie informácie nájdete v článku HROMADNÉ VLOŽENIE (Transact-SQL). | vybraté alebo nevybrané (predvolené) | No | sqlWriterUseTableLock: true alebo false (predvolené) |
Pred kopírovaním skriptu | Skript na kopírovanie aktivity, ktorý sa má spustiť pred zápisom údajov do cieľovej tabuľky v každom spustení. Pomocou tejto vlastnosti môžete vyčistiť vopred načítané údaje. | < skript pred kopírovaním > (reťazec) |
No | preCopyScript |
Časový limit na písanie dávky | Čas čakania na dokončenie operácie vkladania dávky pred uplynutím limitu. Povolená hodnota je časové rozpätie. Predvolená hodnota je 00:30:00 (30 minút). | Timespan | No | writeBatchTimeout |
Veľkosť dávky zápisu | Počet riadkov, ktoré sa majú vložiť do tabuľky SQL na každú dávku. Služba predvolene dynamicky určuje vhodnú veľkosť dávky na základe veľkosti riadka. | < počet riadkov > (celé číslo) |
No | writeBatchSize |
Maximálny počet súbežných pripojení | Horná hranica súbežných pripojení vytvorených do ukladacieho priestoru údajov počas spustenia aktivity. Zadajte hodnotu iba vtedy, keď chcete obmedziť súbežné pripojenia. | < horná hranica súbežných pripojení > (celé číslo) |
No | maxConcurrent Pripojenie ions |
Zakázanie analýzy metrík výkonu | Toto nastavenie sa používa na zhromažďovanie metrík, ako sú napríklad DTU, DWU, RU a podobne, na účely kopírovania optimalizácie výkonu a odporúčaní. Ak sa týmto správaním chcete zaoberať, začiarknite toto políčko. | vybrať alebo zrušiť výber (predvolené) | No | disableMetricsCollection: true alebo false (predvolené) |