Sdílet prostřednictvím


Rychlý start: Hromadné načítání pomocí nástroje Synapse Studio

Načítání dat je snadné pomocí Průvodce hromadným načtením v nástroji Synapse Studio. Synapse Studio je funkce Azure Synapse Analytics. Průvodce hromadným načtením vás provede vytvořením skriptu T-SQL s příkazem COPY , který hromadně načte data do vyhrazeného fondu SQL.

Vstupní body do wizardu hromadného načtení

Data můžete hromadně načíst tak, že kliknete pravým tlačítkem na následující oblast v rámci nástroje Synapse Studio: soubor nebo složka z účtu úložiště Azure, který je připojený k vašemu pracovnímu prostoru.

Snímek obrazovky znázorňující kliknutí pravým tlačítkem myši na soubor nebo složku z účtu úložiště

Požadavky

  • Průvodce vygeneruje příkaz COPY, který k ověřování používá předávací metodu Microsoft Entra. Váš uživatel Microsoft Entra musí mít přístup k pracovnímu prostoru alespoň s rolí Přispěvatel dat do objektů blob pro účet Azure Data Lake Storage Gen2.

  • Abyste mohli použít příkaz COPY a pokud vytváříte novou tabulku, do které budete načítat, musíte mít požadovaná oprávnění k vytvoření tabulky.

  • Propojená služba přidružená k účtu Data Lake Storage Gen2 musí mít přístup k souboru nebo složce, které se mají načíst. Pokud je například mechanismus ověřování pro propojenou službu řízen spravovanou identitou, spravovaná identita pracovního prostoru musí mít k účtu úložiště alespoň oprávnění Čtenář dat objektu blob úložiště.

  • Pokud je ve vašem pracovním prostoru povolena virtuální síť, ujistěte se, že integrovaný modul runtime přidružený k propojeným službám účtu Data Lake Storage Gen2 pro zdrojová data a umístění souborů s chybami má povolené interaktivní zpracování. Interaktivní tvorba se vyžaduje pro automatické rozpoznání schémat, zobrazení náhledu obsahu zdrojového souboru a procházení účtů úložiště Data Lake Storage Gen2 v průvodci.

Postup

  1. Na panelu Umístění zdrojového úložiště vyberte účet úložiště a soubor nebo složku, ze které načítáte. Průvodce se automaticky pokusí rozpoznat soubory Parquet a textové soubory s oddělovači (CSV), včetně mapování zdrojových polí ze souboru na příslušné cílové datové typy SQL.

    Snímek obrazovky znázorňující výběr zdrojového umístění

  2. Vyberte nastavení formátu souboru, včetně nastavení chyb pro situace, kdy při hromadném načítání dojde k zamítnutí řádků. Můžete také vybrat náhled dat a podívat se, jak příkaz COPY parsuje soubor, aby vám pomohl nakonfigurovat nastavení formátu souboru. Vyberte Náhled dat pokaždé, když změníte nastavení formátu souboru, abyste viděli, jak bude příkaz COPY analyzovat soubor s aktualizovaným nastavením.

    Snímek obrazovky znázorňující náhled dat

    Poznámka:

    • Průvodce hromadným načtením nepodporuje zobrazení náhledu dat s ukončovacími znaky víceznakových polí. Když zadáte ukončovací znak víceznakového pole, průvodce zobrazí náhled dat v jednom sloupci.
    • Když vyberete možnost Odvodit názvy sloupců, průvodce hromadným načítáním analyzuje názvy sloupců z prvního řádku, který určuje pole První řádek. Průvodce hromadným načtením automaticky zvýší hodnotu FIRSTROW v příkazu COPY o 1, aby mohl ignorovat tento řádek záhlaví.
    • V příkazu COPY je podporováno zadávání ukončovacích znaků řádku s více znaky. Průvodce hromadným načtením ho ale nepodporuje a vyvolá chybu.
  3. Vyberte vyhrazený fond SQL, který používáte k načtení, včetně toho, jestli bude zatížení pro existující tabulku nebo novou tabulku. Snímek obrazovky znázorňující výběr cílového umístění

  4. Vyberte Konfigurovat mapování sloupců , abyste měli jistotu, že máte odpovídající mapování sloupců. Názvy sloupců budou rozpoznány automaticky, pokud jste povolili odvození názvů sloupců. U nových tabulek je konfigurace mapování sloupců důležitá pro aktualizaci datových typů cílových sloupců.

    Snímek obrazovky znázorňující konfiguraci mapování sloupců

  5. Vyberte Otevřít skript. T-SQL skrypt je vygenerován příkazem COPY pro načítání z vašeho datového jezera. Snímek obrazovky znázorňující otevření skriptu SQL

Další kroky