Förklara Azure Data Factory-transformeringsmetoder

Slutförd

Precis som Azure Data Factory tillhandahåller en mängd olika metoder för att mata in data, innehåller det också en mängd olika metoder för att utföra transformeringar. Du kan välja en metod som matchar kompetensuppsättningarna i ditt team eller dra nytta av befintliga tekniker som du redan har i din dataegendom. Det finns också möjlighet att utföra transformeringar utan att skriva kod alls med hjälp av Dataflöde mappning.

Transformera data med mappning Dataflöde

Mappning Dataflöde ger en miljö för att skapa en mängd olika datatransformeringar visuellt utan att behöva använda kod. De resulterande dataflöden som skapas körs därefter på utskalade Apache Spark-kluster som etableras automatiskt när du kör Dataflöde mappning. Mappning Dataflöde ger också möjlighet att övervaka körningen av transformeringar så att du kan se hur omvandlingarna fortskrider eller för att förstå eventuella fel som kan inträffa

Transformera data med hjälp av beräkningsresurser

Azure Data Factory kan också anropa beräkningsresurser för att transformera data med en dataplattformstjänst som kan vara bättre lämpad för jobbet. Ett bra exempel på detta är att Azure Data Factory kan skapa en pipeline till en analysdataplattform, till exempel Spark-pooler i en Azure Synapse Analytics-instans för att utföra en komplex beräkning med python. Ett annat exempel kan vara att skicka data till en Azure SQL Database-instans för att köra en lagrad procedur med Transact-SQL. Det finns ett brett utbud av beräkningsresurser och de associerade aktiviteter som de kan utföra enligt följande tabell:

Compute-miljö activities
HDInsight-kluster på begäran eller ditt eget HDInsight-kluster Hive, Pig, Spark, MapReduce, Hadoop Streaming
Azure Batch Anpassade aktiviteter
Azure Machine Learning Studio Machine Utbildningsaktiviteter: Batchkörning och uppdateringsresurs
Azure Machine Learning Kör pipeline för Azure Machine Learning
Azure Data Lake Analytics Data Lake Analytics U-SQL
Azure SQL, Azure SQL Data Warehouse, SQL Server Lagrad procedur
Azure Databricks Notebook, Jar, Python
Azure-funktion Azure-funktionsaktivitet

Transformera data med hjälp av SSIS-paket (SQL Server Integration Services)

Många organisationer har årtionden av utvecklingsinvesteringar i SSIS-paket som innehåller både inmatnings- och transformeringslogik från lokala datalager och molndatalager. Azure Data Factory ger möjlighet att lyfta och flytta befintliga SSIS-arbetsbelastningar genom att skapa en Azure-SSIS Integration Runtime för att köra SSIS-paket internt. Med Azure-SSIS Integration Runtime kan du distribuera och hantera dina befintliga SSIS-paket med små eller inga ändringar med välbekanta verktyg som SQL Server Data Tools (SSDT) och SQL Server Management Studio (SSMS), precis som att använda SSIS lokalt.