Händelser
31 mars 23 - 2 apr. 23
Den största utbildningshändelsen för Infrastruktur, Power BI och SQL. 31 mars – 2 april. Använd koden FABINSIDER för att spara 400 USD.
Anmäl dig i dagDen här webbläsaren stöds inte längre.
Uppgradera till Microsoft Edge och dra nytta av de senaste funktionerna och säkerhetsuppdateringarna, samt teknisk support.
GÄLLER FÖR: Azure Data Factory
Azure Synapse Analytics
Dricks
Prova Data Factory i Microsoft Fabric, en allt-i-ett-analyslösning för företag. Microsoft Fabric omfattar allt från dataflytt till datavetenskap, realtidsanalys, business intelligence och rapportering. Lär dig hur du startar en ny utvärderingsversion kostnadsfritt!
Om du vill kopiera data från ett informationslager i Oracle Server, Netezza, Teradata eller SQL Server till Azure Synapse Analytics måste du läsa in enorma mängder data från flera tabeller. Vanligtvis måste data partitioneras i varje tabell så att du kan läsa in rader med flera trådar parallellt från en enda tabell. I den här artikeln beskrivs en mall som ska användas i dessa scenarier.
Anteckning
Om du vill kopiera data från ett litet antal tabeller med relativt liten datavolym till Azure Synapse Analytics är det mer effektivt att använda verktyget Azure Data Factory Copy Data. Mallen som beskrivs i den här artikeln är mer än du behöver för det scenariot.
Den här mallen hämtar en lista över källdatabaspartitioner som ska kopieras från en extern kontrolltabell. Sedan itererar den över varje partition i källdatabasen och kopierar data till målet.
Mallen innehåller tre aktiviteter:
Mallen definierar följande parametrar:
De tre sista parametrarna, som definierar sökvägen i målarkivet, visas bara om målet som du väljer är filbaserad lagring. Om du väljer "Azure Synapse Analytics" som målarkiv krävs inte dessa parametrar. Men tabellnamnen och schemat i Azure Synapse Analytics måste vara samma som i källdatabasen.
Skapa en kontrolltabell i SQL Server eller Azure SQL Database för att lagra källdatabaspartitionslistan för masskopiering. I följande exempel finns det fem partitioner i källdatabasen. Tre partitioner är för datasource_table och två är för project_table. Kolumnen LastModifytime används för att partitionera data i tabellen datasource_table från källdatabasen. Frågan som används för att läsa den första partitionen är "select * from datasource_table where LastModifytime >= ''2015-01-01 00:00:00'' och LastModifytime <= ''2015-12-31 23:59:59.999'' Du kan använda en liknande fråga för att läsa data från andra partitioner.
Create table ControlTableForTemplate
(
PartitionID int,
SourceTableName varchar(255),
FilterQuery varchar(255)
);
INSERT INTO ControlTableForTemplate
(PartitionID, SourceTableName, FilterQuery)
VALUES
(1, 'datasource_table','select * from datasource_table where LastModifytime >= ''2015-01-01 00:00:00'' and LastModifytime <= ''2015-12-31 23:59:59.999'''),
(2, 'datasource_table','select * from datasource_table where LastModifytime >= ''2016-01-01 00:00:00'' and LastModifytime <= ''2016-12-31 23:59:59.999'''),
(3, 'datasource_table','select * from datasource_table where LastModifytime >= ''2017-01-01 00:00:00'' and LastModifytime <= ''2017-12-31 23:59:59.999'''),
(4, 'project_table','select * from project_table where ID >= 0 and ID < 1000'),
(5, 'project_table','select * from project_table where ID >= 1000 and ID < 2000');
Gå till mallen Masskopiering från databas . Skapa en ny anslutning till den externa kontrolltabellen som du skapade i steg 1.
Skapa en ny anslutning till källdatabasen som du kopierar data från.
Skapa en ny anslutning till måldatalagret som du kopierar data till.
Välj Använd denna mall.
Du ser pipelinen, som du ser i följande exempel:
Välj Felsök, ange Parametrar och välj sedan Slutför.
Du ser resultat som liknar följande exempel:
(Valfritt) Om du väljer "Azure Synapse Analytics" som datamål måste du ange en anslutning till Azure Blob Storage för mellanlagring, vilket krävs av Azure Synapse Analytics Polybase. Mallen genererar automatiskt en containersökväg för bloblagringen. Kontrollera om containern har skapats efter pipelinekörningen.
Händelser
31 mars 23 - 2 apr. 23
Den största utbildningshändelsen för Infrastruktur, Power BI och SQL. 31 mars – 2 april. Använd koden FABINSIDER för att spara 400 USD.
Anmäl dig i dag