Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Van toepassing op:✅ Warehouse in Microsoft Fabric
De COPY-opdracht is de primaire manier om gegevens op te nemen in Warehouse-tabellen. COPY voert gegevensopname met een zeer hoge doorvoer uit van een extern Azure-opslagaccount, met flexibiliteit om opties voor bronbestandsindelingen te configureren, een locatie te bepalen voor het opslaan van geweigerde rijen, rij met kopteksten over te slaan en andere opties in te stellen.
In deze zelfstudie ziet u voorbeelden van gegevensopname voor een Warehouse-tabel met behulp van de instructie T-SQL COPY. Hierbij worden de Bing COVID-19-voorbeeldgegevens uit de Azure Open Datasets gebruikt. Zie Bing COVID-19 voor meer informatie over deze gegevens, inclusief de bijbehorende schema- en gebruiksrechten.
Notitie
Met Warehouse kunt u ook de BULK INSERT-instructie gebruiken voor het importeren van gegevens. De COPY INTO instructie is de aanbevolen instructie voor de nieuwe opnamecode, terwijl u met de BULK INSERT instructie de code kunt hergebruiken die u gebruikt in SQL Server of Azure SQL Database.
Zie COPY voor meer informatie over de T-SQL-instructie, inclusief meer voorbeelden en de volledige syntaxis.
Een tabel maken
Voordat u de COPY-opdracht gebruikt, moet de doeltabel aangemaakt zijn. Gebruik de volgende stappen om de doeltabel voor dit voorbeeld te maken:
Zoek en open uw magazijn in uw Microsoft Fabric-werkruimte.
Ga naar het tabblad Start en selecteer Nieuwe SQL-query.
Voer de volgende code uit om de tabel te maken die wordt gebruikt als de bestemming in deze zelfstudie:
CREATE TABLE dbo.TaxiTrips ( doLocationId varchar(MAX) NULL, endLat float NULL, endLon float NULL, extra float NULL, fareAmount float NULL, improvementSurcharge varchar(MAX) NULL, mtaTax float NULL, passengerCount int NULL, paymentType varchar(MAX) NULL, puLocationId varchar(MAX) NULL, puMonth int NULL, puYear int NULL, rateCodeId int NULL, startLat float NULL, startLon float NULL, storeAndFwdFlag varchar(1) NULL, tipAmount float NULL, tollsAmount float NULL, totalAmount float NULL, tpepDropoffDateTime datetime2(6) NULL, tpepPickupDateTime datetime2(6) NULL, tripDistance float NULL, vendorId_str varchar(MAX) NULL, vendorId_lpep int NULL );
Parquet-gegevens opnemen met behulp van de COPY-instructie
In dit voorbeeld laden we gegevens met behulp van een Parquet-bron. Omdat deze gegevens openbaar beschikbaar zijn en geen verificatie vereist, kunt u deze gegevens eenvoudig kopiëren door de bron en het doel op te geven. Er zijn geen verificatiegegevens nodig. U hoeft alleen het FILE_TYPE argument op te geven.
Gebruik de volgende code om de COPY-instructie uit te voeren met een Parquet-bron:
COPY INTO dbo.TaxiTrips
FROM 'https://azureopendatastorage.blob.core.windows.net/nyctlc/yellow'
WITH (
FILE_TYPE = 'PARQUET'
)
De resultaten controleren
De COPY-opdracht wordt voltooid door 1.571.671.152 rijen op te nemen in uw nieuwe tabel. U kunt controleren of de bewerking is uitgevoerd door een query uit te voeren die het totale aantal rijen in de tabel retourneert:
SELECT COUNT_BIG(*) FROM dbo.TaxiTrips;
Opties voor gegevensopname
Andere manieren om gegevens op te nemen in uw magazijn zijn:
- Gegevens opnemen met behulp van pijplijnen
- Gegevens opnemen met Behulp van Transact-SQL
- Gegevens opnemen met behulp van een gegevensstroom