Transformieren von Daten in data.world (Vorschau) mithilfe von Azure Data Factory oder Synapse Analytics

GILT FÜR: Azure Data Factory Azure Synapse Analytics

Tipp

Testen Sie Data Factory in Microsoft Fabric, eine All-in-One-Analyselösung für Unternehmen. Microsoft Fabric deckt alle Aufgaben ab, von der Datenverschiebung bis hin zu Data Science, Echtzeitanalysen, Business Intelligence und Berichterstellung. Erfahren Sie, wie Sie kostenlos eine neue Testversion starten!

In diesem Artikel wird beschrieben, wie Sie mithilfe von Datenfluss Daten in data.world (Vorschau) transformieren. Um mehr zu lernen, lesen Sie den Einführungsartikel für Azure Data Factory oder Azure Synapse Analytics.

Wichtig

Dieser Connector befindet sich derzeit in der Vorschauversion. Sie können ihn ausprobieren und uns Feedback geben. Wenden Sie sich an den Azure-Support, wenn Sie in Ihrer Lösung eine Abhängigkeit von Connectors verwenden möchten, die sich in der Vorschauphase befinden.

Unterstützte Funktionen

Dieser data.world-Konnektor wird für die folgenden Funktionen unterstützt:

Unterstützte Funktionen IR
Zuordnungsdatenfluss (Quelle/–) 0

① Azure Integration Runtime ② Selbstgehostete Integration Runtime

Eine Liste der Datenspeicher, die als Quellen/Senken unterstützt werden, finden Sie in der Tabelle Unterstützte Datenspeicher.

Erstellen eines verknüpften data.world-Diensts über die Benutzeroberfläche

Verwenden Sie die folgenden Schritte, um einen verknüpften data.world-Dienst auf der Azure-Portal Benutzeroberfläche zu erstellen.

  1. Navigieren Sie in Ihrem Azure Data Factory- oder Synapse-Arbeitsbereich zur Registerkarte „Verwalten“, und wählen Sie „Verknüpfte Dienste“ und anschließend „Neu“ aus:

  2. Suchen Sie nach data.world (Vorschau) und wählen Sie den data.world (Vorschau)-Connector aus.

    Screenshot showing selecting data.world connector.

  3. Konfigurieren Sie die Dienstdetails, testen Sie die Verbindung, und erstellen Sie den neuen verknüpften Dienst.

    Screenshot of configuration for data.world linked service.

Details zur Connector-Konfiguration

Die folgenden Abschnitte enthalten Informationen zu Eigenschaften, die zum Definieren von Data Factory- und Synapse-Pipelineentitäten speziell für data.world verwendet werden.

Eigenschaften des verknüpften Diensts

Die folgenden Eigenschaften werden für den mit verknüpften data.world-Dienst unterstützt:

Eigenschaft Beschreibung Erforderlich
Typ Die Eigenschaft „type“ muss auf Dataworld festgelegt sein. Ja
apiToken Legen Sie ein API-Token für data.world fest. Markieren Sie dieses Feld als SecureString, um es sicher zu speichern. Alternativ können Sie auf ein in Azure Key Vault gespeichertes Geheimnis verweisen. Ja

Beispiel:

{
    "name": "DataworldLinkedService",
    "properties": {
        "type": "Dataworld",
        "typeProperties": {
            "apiToken": {
                "type": "SecureString",
                "value": "<API token>"
            }
        }
    }
}

Eigenschaften von Mapping Data Flow

Beim Transformieren von Daten im Zuordnungsdatenfluss können Sie Tabellen aus data.world lesen. Weitere Informationen finden Sie im Artikel zur Quelltransformation im Zuordnungsdatenfluss. Sie können nur ein Inlinedataset als Quelltyp verwenden.

Quellentransformation

In der folgenden Tabelle sind die von einer data.world-Quelle unterstützten Eigenschaften aufgeführt. Sie können diese Eigenschaften auf der Registerkarte Quelloptionen bearbeiten.

Name BESCHREIBUNG Erforderlich Zulässige Werte Datenflussskript-Eigenschaft
Datasetname Die ID des Datasets in data.world Ja String datasetId
Tabellenname Die ID der Tabelle innerhalb des Datasets in data.world Nein (wenn query festgelegt ist) String tableId
Abfrage Geben Sie eine SQL-Abfrage ein, um Daten aus data.world abzurufen. z. B. select * from MyTable. Nein (wenn tableId festgelegt ist) String Abfrage
Besitzer Der Besitzer des Datasets in data.world Ja String owner

Beispiel für ein data.world-Quellskript

Wenn Sie data.world als Quelltyp verwenden, sieht das zugehörige Datenflussskript wie folgt aus:

source(allowSchemaDrift: true,
	validateSchema: false,
	store: 'dataworld',
	format: 'rest',
	owner: 'owner1',
	datasetId: 'dataset1',
	tableId: 'MyTable') ~> DataworldSource

Eine Liste der Datenspeicher, die als Quelles und Senken für die Kopieraktivität unterstützt werden, finden Sie in Unterstützte Datenspeicher.