Udostępnij przez


Zadanie usługi Azure Synapse Analytics

Dotyczy:SQL Server SSIS Integration Runtime w ramach usługi Azure Data Factory

Zadanie usługi Azure Synapse Analytics umożliwia pakietowi usług SSIS kopiowanie danych tabelarycznych do dedykowanej puli SQL usługi Azure Synapse Analytics z systemu plików lub usługi Azure Blob Storage. Zadanie wykorzystuje program PolyBase do poprawy wydajności zgodnie z opisem w artykule Azure Synapse Analytics Loading Patterns and Strategies (Wzorce i strategie ładowania usługi Azure Synapse Analytics). Obecnie obsługiwany format pliku danych źródłowych jest rozdzielany tekstem w kodowaniu UTF8. Podczas kopiowania z systemu plików dane zostaną najpierw przesłane do Azure Blob Storage na potrzeby etapowania, a następnie do dedykowanej puli SQL. W związku z tym potrzebne jest konto usługi Azure Blob Storage.

Uwaga / Notatka

Menedżer połączeń usługi Azure Storage z typem usługi Data Lake Gen2 nie jest obsługiwany.

Aby użyć usługi Azure Data Lake Gen2 do przechowywania tymczasowego lub jako źródła danych, możesz nawiązać połączenie za pośrednictwem menedżera połączeń usługi Azure Storage z ustawieniem typu Azure Blob Storage.

Zadanie usługi Azure Synapse Analytics jest składnikiem pakietu funkcji usług SQL Server Integration Services (SSIS) dla platformy Azure.

Aby dodać zadanie usługi Azure Synapse Analytics, przeciągnij je z przybornika usług SSIS do kanwy projektanta, a następnie kliknij dwukrotnie lub kliknij prawym przyciskiem myszy i kliknij polecenie Edytuj , aby wyświetlić okno dialogowe edytora zadań.

Na stronie Ogólne skonfiguruj następujące właściwości.

Typ SourceType określa typ źródłowego magazynu danych. Wybierz jeden z następujących typów:

  • System plików: Dane źródłowe znajdują się w lokalnym systemie plików.
  • BlobStorage: Dane źródłowe znajdują się w Azure Blob Storage.

Poniżej przedstawiono właściwości dla każdego typu źródła.

System plików

(No changes needed) Description
Katalog lokalny Określa katalog lokalny zawierający pliki danych do przekazania.
Rekursywnie Określa, czy cyklicznie przeszukiwać podkatabryki.
NazwaPliku Określa filtr nazw do wybierania plików z określonym wzorcem nazwy. Np. MySheet*.xsl* będzie zawierać pliki, takie jak MySheet001.xsl i MySheetABC.xslx.
RowDelimiter Określa znaki oznaczające koniec każdego wiersza.
Separator kolumny Określa co najmniej jeden znak oznaczający koniec każdej kolumny. Np. | (potok), \t (tab), ' (pojedynczy cudzysłów), " (podwójny cudzysłów) i 0x5c (ukośnik odwrotny).
IsFirstRowHeader Określa, czy pierwszy wiersz w każdym pliku danych zawiera nazwy kolumn zamiast rzeczywistych danych.
AzureStorageConnection Określa menedżera połączeń usługi Azure Storage.
BlobContainer Określa nazwę kontenera obiektów blob, do którego będą przesyłane dane lokalne, a następnie kierowane do dedykowanej puli SQL w usłudze Azure Synapse Analytics za pośrednictwem technologii PolyBase. Jeśli nie istnieje, zostanie utworzony nowy kontener.
BlobDirectory Określa katalog obiektów blob (wirtualną strukturę hierarchiczną), do którego będą przesyłane dane lokalne i przekazywane do dedykowanej puli SQL usługi Azure Synapse Analytics za pośrednictwem PolyBase.
RetainFiles Określa, czy mają być przechowywane pliki przekazane do usługi Azure Storage.
Typ kompresji Określa format kompresji, który ma być używany podczas przekazywania plików do usługi Azure Storage. Nie ma to wpływu na lokalne źródło.
CompressionLevel Określa poziom kompresji, który ma być używany dla formatu kompresji.
SqlPoolConnection Określa menedżera połączeń ADO.NET dla dedykowanej puli SQL usługi Azure Synapse Analytics.
TableName Określa nazwę tabeli docelowej. Wybierz istniejącą nazwę tabeli lub utwórz nową, wybierając pozycję <Nowa tabela ...>.
TableDistribution Określa metodę dystrybucji dla nowej tabeli. Dotyczy, jeśli dla tabeli TableName określono nową nazwę tabeli.
HashColumnName Określa kolumnę używaną do dystrybucji tabel skrótów. Ma zastosowanie w przypadku określenia HASH dla TableDistribution.

BlobStorage

(No changes needed) Description
AzureStorageConnection Określa menedżera połączeń usługi Azure Storage.
BlobContainer Określa nazwę kontenera blobów, w którym znajdują się dane źródłowe.
BlobDirectory Określa katalog obiektów blob (wirtualną strukturę hierarchiczną), w którym znajdują się dane źródłowe.
RowDelimiter Określa znaki oznaczające koniec każdego wiersza.
Separator kolumny Określa co najmniej jeden znak oznaczający koniec każdej kolumny. Np. | (potok), \t (tab), ' (pojedynczy cudzysłów), " (podwójny cudzysłów) i 0x5c (ukośnik odwrotny).
Typ kompresji Określa format kompresji używany dla danych źródłowych.
SqlPoolConnection Określa menedżera połączeń ADO.NET dla dedykowanej puli SQL usługi Azure Synapse Analytics.
TableName Określa nazwę tabeli docelowej. Wybierz istniejącą nazwę tabeli lub utwórz nową, wybierając pozycję <Nowa tabela ...>.
TableDistribution Określa metodę dystrybucji dla nowej tabeli. Dotyczy, jeśli dla tabeli TableName określono nową nazwę tabeli.
HashColumnName Określa kolumnę używaną do dystrybucji tabel skrótów. Ma zastosowanie w przypadku określenia HASH dla TableDistribution.

Zobaczysz inną stronę Mapowania w zależności od tego, czy kopiujesz do nowej tabeli, czy do istniejącej. W pierwszym przypadku należy skonfigurować, które kolumny źródłowe należy zmapować, oraz ich odpowiednie nazwy w tabeli docelowej, która ma zostać utworzona. W tym drugim przypadku skonfiguruj relacje mapowania między kolumnami źródłowymi i docelowymi.

Na stronie Kolumny skonfiguruj właściwości typu danych dla każdej kolumny źródłowej.

Na stronie T-SQL przedstawiono język T-SQL używany do ładowania danych z usługi Azure Blob Storage do dedykowanej puli SQL. Język T-SQL jest automatycznie generowany na podstawie konfiguracji na innych stronach i będzie wykonywany podczas realizacji zadania. Możesz ręcznie edytować wygenerowany kod T-SQL, aby spełnić określone potrzeby, klikając przycisk Edytuj . Możesz przywrócić automatycznie wygenerowany element później, klikając przycisk Resetuj .