Rychlý start: Hromadné načítání pomocí nástroje Synapse Studio

Načítání dat je snadné pomocí Průvodce hromadným načtením v nástroji Synapse Studio. Synapse Studio je funkce Azure Synapse Analytics. Průvodce hromadným načtením vás provede vytvořením skriptu T-SQL s příkazem COPY , který hromadně načte data do vyhrazeného fondu SQL.

Vstupní body do wizardu hromadného načtení

Data můžete hromadně načíst tak, že kliknete pravým tlačítkem na následující oblast v rámci nástroje Synapse Studio: soubor nebo složka z účtu úložiště Azure, který je připojený k vašemu pracovnímu prostoru.

Snímek obrazovky znázorňující kliknutí pravým tlačítkem myši na soubor nebo složku z účtu úložiště

Požadavky

Průvodce vygeneruje příkaz COPY, který k ověřování používá předávací metodu Microsoft Entra. Váš uživatel Microsoft Entra musí mít přístup k pracovnímu prostoru alespoň s rolí Přispěvatel dat do objektů blob pro účet Azure Data Lake Storage Gen2.
Abyste mohli použít příkaz COPY a pokud vytváříte novou tabulku, do které budete načítat, musíte mít požadovaná oprávnění k vytvoření tabulky.
Propojená služba přidružená k účtu Data Lake Storage Gen2 musí mít přístup k souboru nebo složce, které se mají načíst. Pokud je například mechanismus ověřování pro propojenou službu řízen spravovanou identitou, spravovaná identita pracovního prostoru musí mít k účtu úložiště alespoň oprávnění Čtenář dat objektu blob úložiště.
Pokud je ve vašem pracovním prostoru povolena virtuální síť, ujistěte se, že integrovaný modul runtime přidružený k propojeným službám účtu Data Lake Storage Gen2 pro zdrojová data a umístění souborů s chybami má povolené interaktivní zpracování. Interaktivní tvorba se vyžaduje pro automatické rozpoznání schémat, zobrazení náhledu obsahu zdrojového souboru a procházení účtů úložiště Data Lake Storage Gen2 v průvodci.

Postup

Na panelu Umístění zdrojového úložiště vyberte účet úložiště a soubor nebo složku, ze které načítáte. Průvodce se automaticky pokusí rozpoznat soubory Parquet a textové soubory s oddělovači (CSV), včetně mapování zdrojových polí ze souboru na příslušné cílové datové typy SQL.
Vyberte nastavení formátu souboru, včetně nastavení chyb pro situace, kdy při hromadném načítání dojde k zamítnutí řádků. Můžete také vybrat náhled dat a podívat se, jak příkaz COPY parsuje soubor, aby vám pomohl nakonfigurovat nastavení formátu souboru. Vyberte Náhled dat pokaždé, když změníte nastavení formátu souboru, abyste viděli, jak bude příkaz COPY analyzovat soubor s aktualizovaným nastavením.
Poznámka:
- Průvodce hromadným načtením nepodporuje zobrazení náhledu dat s ukončovacími znaky víceznakových polí. Když zadáte ukončovací znak víceznakového pole, průvodce zobrazí náhled dat v jednom sloupci.
- Když vyberete možnost Odvodit názvy sloupců, průvodce hromadným načítáním analyzuje názvy sloupců z prvního řádku, který určuje pole První řádek. Průvodce hromadným načtením automaticky zvýší hodnotu FIRSTROW v příkazu COPY o 1, aby mohl ignorovat tento řádek záhlaví.
- V příkazu COPY je podporováno zadávání ukončovacích znaků řádku s více znaky. Průvodce hromadným načtením ho ale nepodporuje a vyvolá chybu.
Vyberte vyhrazený fond SQL, který používáte k načtení, včetně toho, jestli bude zatížení pro existující tabulku nebo novou tabulku.
Vyberte Konfigurovat mapování sloupců , abyste měli jistotu, že máte odpovídající mapování sloupců. Názvy sloupců budou rozpoznány automaticky, pokud jste povolili odvození názvů sloupců. U nových tabulek je konfigurace mapování sloupců důležitá pro aktualizaci datových typů cílových sloupců.
Vyberte Otevřít skript. T-SQL skrypt je vygenerován příkazem COPY pro načítání z vašeho datového jezera.

Další kroky

Další informace o možnostech kopírování najdete v článku o příkazu COPY .
Informace o použití procesu extrakce, transformace a načítání (ETL) najdete v článku s přehledem načítání dat .

Váš názor

Byla tato stránka užitečná?

Last updated on 2025-04-03