Gegevens verplaatsen naar of van Azure Blob Storage met behulp van SSIS-connectors
Het Azure Feature Pack voor Integration Services (SSIS) biedt onderdelen om verbinding te maken met Azure, gegevens over te dragen tussen Azure- en on-premises gegevensbronnen en gegevens te verwerken die zijn opgeslagen in Azure.
Dit menu bevat koppelingen naar technologieën die u kunt gebruiken om gegevens naar en van Azure Blob Storage te verplaatsen:
Zodra klanten on-premises gegevens naar de cloud hebben verplaatst, hebben ze toegang tot hun gegevens vanuit elke Azure-service om te profiteren van de volledige kracht van de suite met Azure-technologieën. De gegevens kunnen vervolgens worden gebruikt, bijvoorbeeld in Azure Machine Learning of in een HDInsight-cluster.
Voorbeelden voor het gebruik van deze Azure-resources bevinden zich in de sql- en HDInsight-scenario's.
Voor een bespreking van canonieke scenario's die gebruikmaken van SSIS om zakelijke behoeften te realiseren die gebruikelijk zijn in hybride gegevensintegratiescenario's, raadpleegt u Meer doen met SQL Server Integration Services Feature Pack voor Azure-blog .
Notitie
Voor een volledige inleiding tot Azure Blob Storage raadpleegt u de basisbeginselen van Azure Blob en de REST API van Azure Blob Service.
Vereisten
Als u de taken wilt uitvoeren die in dit artikel worden beschreven, moet u een Azure-abonnement en een Azure Storage-account hebben ingesteld. U hebt de naam van het Azure Storage-account en de accountsleutel nodig om gegevens te uploaden of te downloaden.
- Als u een Azure-abonnement wilt instellen, raadpleegt u de gratis proefversie van één maand.
- Zie Over Azure Storage-accounts voor instructies over het maken van een opslagaccount en voor het ophalen van account- en sleutelgegevens.
Als u de SSIS-connectors wilt gebruiken, moet u het volgende downloaden:
- SQL Server 2014 of 2016 Standard (of hoger): de installatie omvat SQL Server Integration Services.
- Microsoft SQL Server 2014 of 2016 Integration Services Feature Pack voor Azure: deze connectors kunnen respectievelijk worden gedownload van de SQL Server 2014 Integration Services en SQL Server 2016 Integration Services.
Notitie
SSIS is geïnstalleerd met SQL Server, maar is niet opgenomen in de Express-versie. Zie de technische documentatie van SQL Server voor meer informatie over welke toepassingen zijn opgenomen in verschillende edities van SQL Server
Zie Integration Services (SSIS) installeren voor informatie over het installeren van SSIS
Zie de SSIS-zelfstudie: Een eenvoudig ETL-pakket maken voor informatie over het gebruik van SISS om eenvoudige ETL-pakketten (extract, transform, load) te bouwen.
NYC Taxi-gegevensset downloaden
In het voorbeeld dat hier wordt beschreven, wordt een openbaar beschikbare gegevensset gebruikt die beschikbaar is in open Azure-gegevenssets en TLC-triprecordgegevens. De gegevensset bestaat uit ongeveer 173 miljoen taxiritten in NYC in het jaar 2013. Er zijn twee soorten gegevens: gegevens over reisgegevens en ritgegevens.
Gegevens uploaden naar Blob Storage
Als u gegevens wilt verplaatsen met behulp van het SSIS-functiepakket van on-premises naar Blob Storage, gebruiken we een exemplaar van de Azure Blob Upload-taak, die hier wordt weergegeven:
In de volgende tabel worden de parameters beschreven die door de taak worden gebruikt.
Veld | Beschrijving |
---|---|
AzureStorage Verbinding maken ion | Hiermee geeft u een bestaande Azure Storage-Verbindingsbeheer op of maakt u een nieuw account dat verwijst naar een Azure Storage-account dat verwijst naar de locatie waar de blobbestanden worden gehost. |
BlobContainer | Hiermee geeft u de naam op van de blobcontainer die de geüploade bestanden als blobs bevat. |
BlobDirectory | Hiermee geeft u de blobmap op waarin het geüploade bestand wordt opgeslagen als een blok-blob. De blobmap is een virtuele hiërarchische structuur. Als de blob al bestaat, wordt deze vervangen. |
LocalDirectory | Hiermee geeft u de lokale map die de bestanden bevat die moeten worden geüpload. |
Bestandsnaam | Hiermee geeft u een naamfilter voor het selecteren van bestanden met het opgegeven naampatroon. MySheet*.xls* bevat bijvoorbeeld bestanden zoals MySheet001.xls en MySheetABC.xlsx |
TimeRangeFrom/TimeRangeTo | Hiermee geeft u een tijdsbereikfilter op. Bestanden die zijn gewijzigd na TimeRangeFrom en voordat TimeRangeTo is opgenomen. |
Notitie
De Referenties voor AzureStorage Verbinding maken ion moeten juist zijn en de BlobContainer moet bestaan voordat de overdracht wordt uitgevoerd.
Gegevens downloaden uit Blob Storage
Als u gegevens wilt downloaden van Blob Storage naar on-premises opslag met SSIS, gebruikt u een exemplaar van de Azure Blob Download-taak.
Geavanceerdere SSIS Azure-scenario's
Met het SSIS-functiepakket kunnen complexere stromen samen worden verwerkt door pakkettaken. De blobgegevens kunnen bijvoorbeeld rechtstreeks worden ingevoerd in een HDInsight-cluster, waarvan de uitvoer terug kan worden gedownload naar een blob en vervolgens naar on-premises opslag. SSIS kan Hive- en Pig-taken uitvoeren op een HDInsight-cluster met behulp van extra SSIS-connectors:
- Als u een Hive-script wilt uitvoeren op een Azure HDInsight-cluster met SSIS, gebruikt u Azure HDInsight Hive Task.
- Als u een Pig-script wilt uitvoeren op een Azure HDInsight-cluster met SSIS, gebruikt u Azure HDInsight Pig Task.
Medewerkers
Dit artikel wordt onderhouden door Microsoft. De tekst is oorspronkelijk geschreven door de volgende Inzenders.
Hoofdauteur:
- Mark Tabladillo | Senior Cloud Solution Architect
Als u niet-openbare LinkedIn-profielen wilt zien, meldt u zich aan bij LinkedIn.
Volgende stappen
- Inleiding tot Azure Blob-opslag
- Blobs kopiëren en verplaatsen van de ene container of het opslagaccount naar een andere
- Bestaande SSIS-pakketten uitvoeren in Azure Data Factory of Azure Synapse Pipeline
Verwante resources
Feedback
https://aka.ms/ContentUserFeedback.
Binnenkort beschikbaar: In de loop van 2024 zullen we GitHub-problemen geleidelijk uitfaseren als het feedbackmechanisme voor inhoud en deze vervangen door een nieuw feedbacksysteem. Zie voor meer informatie:Feedback verzenden en weergeven voor