Ereignisse
31. März, 23 Uhr - 2. Apr., 23 Uhr
Das größte Fabric-, Power BI- und SQL-Lernereignis. 31. März – 2. April. Verwenden Sie Code FABINSIDER, um $400 zu sparen.
Heute registrierenDieser Browser wird nicht mehr unterstützt.
Führen Sie ein Upgrade auf Microsoft Edge aus, um die neuesten Funktionen, Sicherheitsupdates und technischen Support zu nutzen.
Gilt für:✅ Warehouse in Microsoft Fabric
Die COPY-Anweisung ist die primäre Methode zum Erfassen von Daten in Warehousetabellen. Mit COPY erfolgt die Datenerfassung mit hohem Durchsatz aus einem externen Azure-Speicherkonto, wobei Sie flexibel Optionen für Quelldateiformate, einen Speicherort für abgelehnte Zeilen, das Überspringen von Kopfzeilen und andere Optionen konfigurieren können.
Dieses Tutorial zeigt Beispiele für die Datenerfassung für eine Warehousetabelle mit der T-SQL-Anweisung COPY
. Es verwendet die Bing COVID-19-Beispieldaten aus Azure Open Datasets. Einzelheiten zu diesen Daten, einschließlich des Schemas und der Nutzungsrechte, finden Sie unter Bing COVID-19.
Hinweis
Weitere Informationen zur T-SQL-Anweisung „COPY“, einschließlich weiterer Beispiele und der vollständigen Syntax, finden Sie unter COPY (Transact-SQL).
Bevor Sie die COPY-Anweisung verwenden, muss die Zieltabelle erstellt werden. Führen Sie die folgenden Schritte aus, um die Zieltabelle für dieses Beispiel zu erstellen:
Suchen und öffnen Sie in Ihrem Microsoft Fabric-Arbeitsbereich Ihr Warehouse.
Wechseln Sie zur Registerkarte Start, und wählen Sie Neue SQL-Abfrage aus.
Führen Sie den folgenden Code aus, um die Tabelle zu erstellen, die in diesem Tutorial als Ziel verwendet wird:
CREATE TABLE [dbo].[bing_covid-19_data]
(
[id] [int] NULL,
[updated] [date] NULL,
[confirmed] [int] NULL,
[confirmed_change] [int] NULL,
[deaths] [int] NULL,
[deaths_change] [int] NULL,
[recovered] [int] NULL,
[recovered_change] [int] NULL,
[latitude] [float] NULL,
[longitude] [float] NULL,
[iso2] [varchar](8000) NULL,
[iso3] [varchar](8000) NULL,
[country_region] [varchar](8000) NULL,
[admin_region_1] [varchar](8000) NULL,
[iso_subdivision] [varchar](8000) NULL,
[admin_region_2] [varchar](8000) NULL,
[load_time] [datetime2](6) NULL
);
Im ersten Beispiel laden wir Daten mithilfe einer Parquet-Quelle. Da diese Daten öffentlich verfügbar sind und keine Authentifizierung erfordern, können Sie diese Daten einfach kopieren, indem Sie die Quelle und das Ziel angeben. Es sind keine Authentifizierungsdetails erforderlich. Sie müssen nur das FILE_TYPE
-Argument angeben.
Verwenden Sie den folgenden Code, um die COPY-Anweisung mit einer Parquet-Quelle auszuführen:
COPY INTO [dbo].[bing_covid-19_data]
FROM 'https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet'
WITH (
FILE_TYPE = 'PARQUET'
);
Es ist üblich, dass CSV-Dateien über eine Kopfzeile verfügen, die die Spaltennamen der Tabelle in der CSV-Datei enthält. Die COPY-Anweisung kann Daten aus CSV-Dateien kopieren und eine oder mehrere Zeilen aus der Quelldateikopfzeile überspringen.
Wenn Sie das vorherige Beispiel ausgeführt haben, um Daten aus Parquet zu laden, sollten Sie erwägen, alle Daten aus Ihrer Tabelle zu löschen:
DELETE FROM [dbo].[bing_covid-19_data];
Verwenden Sie den folgenden Code, um Daten aus einer CSV-Datei zu laden und eine Kopfzeile zu überspringen:
COPY INTO [dbo].[bing_covid-19_data]
FROM 'https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.csv'
WITH (
FILE_TYPE = 'CSV',
FIRSTROW = 2
);
Die COPY-Anweisung wird abgeschlossen, indem 4.766.736 Zeilen in Ihrer neuen Tabelle erfasst werden. Sie können bestätigen, dass der Vorgang erfolgreich ausgeführt wurde, indem Sie eine Abfrage ausführen, die die Gesamtanzahl der Zeilen in Ihrer Tabelle zurückgibt:
SELECT COUNT(*) FROM [dbo].[bing_covid-19_data];
Wenn Sie beide Beispiele ausgeführt haben, ohne die Zeilen zwischen den Ausführungen zu löschen, enthält das Ergebnis dieser Abfrage doppelt so viele Zeilen. Das funktioniert in diesem Fall zwar für die Datenerfassung, aber erwägen Sie, alle Zeilen zu löschen und Daten nur einmal zu erfassen, wenn Sie mit diesen Daten weiter experimentieren möchten.
Ereignisse
31. März, 23 Uhr - 2. Apr., 23 Uhr
Das größte Fabric-, Power BI- und SQL-Lernereignis. 31. März – 2. April. Verwenden Sie Code FABINSIDER, um $400 zu sparen.
Heute registrierenSchulung
Modul
Datenerfassung im Petabytebereich mit Azure Data Factory - Training
Datenerfassung im Petabytebereich mit einer Azure Data Factory- oder Azure Synapse-Pipeline
Zertifizierung
Microsoft Certified: Fabric Data Engineer Associate - Certifications
Als Fabric Data Engineer sollten Sie Fachkompetenz mit Datenlademustern, Datenarchitekturen und Orchestrierungsprozessen haben.
Dokumentation
Erfassen von Daten in Ihrem Warehouse mithilfe von Transact-SQL - Microsoft Fabric
Befolgen Sie diese Schritte, um Daten mithilfe von Transact-SQL in einer Warehousetabelle zu erfassen.
Erfassen von Daten im Warehouse - Microsoft Fabric
Hier erfahren Sie mehr über die Features zum Erfassen von Daten in Ihrem Warehouse.
T-SQL-Oberfläche - Microsoft Fabric
T-SQL-Oberfläche des SQL-Analyseendpunkts und des Warehouse in Microsoft Fabric