Konfigurieren von Azure Cosmos DB für NoSQL in einer Kopieraktivität

In diesem Artikel wird beschrieben, wie Sie die Kopieraktivität in einer Datenpipeline verwenden, um Daten von und nach Azure Cosmos DB for NoSQL zu kopieren.

Unterstützte Konfiguration

Informationen zur Konfiguration der einzelnen Registerkarten unter der Kopieraktivität finden Sie in den folgenden Abschnitten.

Allgemein

Informationen zum Konfigurieren der Registerkarte Allgemein finden Sie unter Allgemeine Einstellungen.

`Source`

Die folgenden Eigenschaften werden für Azure Cosmos DB for NoSQL unter der Registerkarte Quelle einer Kopieraktivität unterstützt.

Screenshot showing source tab.

Die folgenden drei Eigenschaften sind erforderlich:

  • Datenspeichertyp: Wählen Sie Extern aus.
  • Verbindung: Wählen Sie eine Azure Cosmos DB for NoSQL-Verbindung aus der Verbindungsliste aus. Wenn keine Verbindung besteht, erstellen Sie eine neue Azure Cosmos DB for NoSQL-Verbindung, indem Sie Neu auswählen.
  • Container: Wählen Sie den Container aus, den Sie verwenden möchten. Wählen Sie Bearbeiten aus, um den Containernamen manuell einzugeben.

Unter Erweitert können Sie die folgenden Felder angeben:

  • Verwendungsabfrage: Sie können entweder Tabelle oder Abfrage als verwendete Abfrage auswählen. In der folgenden Liste wird die Konfiguration der einzelnen Einstellungen beschrieben.

    • Tabelle: Liest Daten aus der Tabelle, die Sie in Tabelle angegeben haben.

    • Abfrage: Gibt die Azure Cosmos DB-Abfrage zum Lesen von Daten an.

      Screenshot showing query.

  • Seitengröße: Die Anzahl der Dokumente pro Seite des Abfrageergebnisses. Der Standardwert ist „-1“. Dies bedeutet, dass im Ergebnis die dienstseitige dynamische Seitengröße bis zu 1000 verwendet wird.

  • Datetime erkennen: Legt fest, ob „datetime“ aus den Zeichenfolgenwerten in den Dokumenten erkannt werden soll. Zulässige Werte sind true (Standard) oder false

  • Bevorzugte Regionen: Die bevorzugte Liste der Regionen, mit denen beim Abrufen von Daten aus Azure Cosmos DB eine Verbindung hergestellt werden soll. Wählen Sie eine bevorzugte Region aus der Dropdownliste aus, nachdem Sie Neu gewählt haben.

    Screenshot showing preferred regions.

  • Zusätzliche Spalten: Fügen Sie zusätzliche Datenspalten hinzu, um den relativen Pfad oder statischen Wert der Quelldateien zu speichern. Für Letzteres wird ein Ausdruck unterstützt. Weitere Informationen finden Sie unter Hinzufügen zusätzlicher Spalten während des Kopiervorgangs.

    Screenshot showing additional columns.

Destination

Die folgenden Eigenschaften werden für Azure Cosmos DB for NoSQL unter der Registerkarte Ziel einer Kopieraktivität unterstützt.

Screenshot showing destination tab.

Die folgenden drei Eigenschaften sind erforderlich:

  • Datenspeichertyp: Wählen Sie Extern aus.
  • Verbindung: Wählen Sie eine Azure Cosmos DB for NoSQL-Verbindung aus der Verbindungsliste aus.
  • Container: Wählen Sie Durchsuchen aus, um die Datei auszuwählen, die Sie kopieren möchten, oder geben Sie den Pfad manuell ein.

Unter Erweitert können Sie die folgenden Felder angeben:

  • Schreibverhalten: Legt das Schreibverhalten fest, wenn das Ziel Dateien aus einem dateibasierten Datenspeicher sind. Sie können Dynamischen Inhalt hinzufügen, Einfügen oder Upsert aus der Dropdownliste auswählen.

    • Dynamischen Inhalt hinzufügen: Öffnen Sie den Bereich Dynamischen Inhalt hinzufügen. Dadurch wird der Ausdrucks-Generator geöffnet, in dem Sie Ausdrücke anhand von unterstützten Systemvariablen, Aktivitätsausgaben, Funktionen und benutzerdefinierten Variablen oder Parametern erstellen können. Informationen zur Ausdruckssprache finden Sie unter Ausdrücke und Funktionen.

    • Einfügen: Wählen Sie diese Option aus, wenn Ihre Quelldaten Einfügungen enthalten.

    • Upsert: Das Verhalten von „Upsert“ besteht darin, das Dokument zu ersetzen, wenn ein Dokument mit der gleichen ID bereits vorhanden ist. Andernfalls wird das Dokument eingefügt.

      Screenshot showing write behavior.

  • Zeitlimit für Batchschreibvorgang: Die Wartezeit für den Abschluss der Batcheinfügung, bevor ein Timeout auftritt. Zulässige Werte sind Timespan. Beispiel: 00:30:00 (30 Minuten).

  • Schreibbatchgröße: Geben Sie die Anzahl der Zeilen an, die pro Batch in die SQL-Tabelle eingefügt werden sollen. Der zulässige Wert ist eine ganze Zahl (Anzahl der Zeilen). Standardmäßig bestimmt der Dienst die geeignete Batchgröße dynamisch auf der Grundlage der Zeilengröße.

  • Maximale Anzahl gleichzeitiger Verbindungen: Die Obergrenze der gleichzeitigen Verbindungen zum Datenspeicher, die während des Ausführens der Aktivität hergestellt werden. Geben Sie diesen Wert nur an, wenn Sie die Anzahl der gleichzeitigen Verbindungen begrenzen möchten.

  • Analyse von Leistungsmetriken deaktivieren: Diese Einstellung steuert die Sammlung von Metriken wie DTU, DWU, RU usw. für die Optimierung der Kopierleistung und Empfehlungen. Wenn dieses Verhalten problematisch sein könnte, deaktivieren Sie dieses Feature.

Zuordnung

Wechseln Sie für die Konfiguration der Registerkarte Zuordnung zu Konfigurieren der Zuordnungen auf der Registerkarte „Zuordnung“.

Einstellungen

Wechseln Sie für die Konfiguration der Registerkarte Einstellungen zu Konfigurieren der anderen Einstellungen auf der Registerkarte „Einstellungen“.

Tabellenzusammenfassung

Die folgenden Tabellen enthalten weitere Informationen über die Kopieraktivitäten in Azure Cosmos DB for NoSQL.

Quelltabelle

Name Beschreibung Wert Erforderlich JSON-Skripteigenschaft
Datenspeichertyp Ihr Datenspeichertyp Extern Ja /
Verbindung Ihre Verbindung mit dem Quelldatenspeicher <Ihre Verbindung> Ja Verbindung
Container Der Container Ihrer Quelldaten. <Container Ihrer Quelle> Ja Container
fileName
Verwendungsabfrage Sie können Tabelle oder Abfrage als Verwendungsabfrage auswählen. Tabelle
Abfrage
Nein Typ
Seitengröße Die Anzahl der Dokumente pro Seite des Abfrageergebnisses. Der Standardwert ist „-1“. Dies bedeutet, dass im Ergebnis die dienstseitige dynamische Seitengröße bis zu 1000 verwendet wird. <Ihre Seitengröße> Nein pageSize
Datetime löschen Die Dateien im Quelldatenspeicher werden unmittelbar nach dem Verschieben in den Zielspeicher gelöscht. Die Dateien werden einzeln gelöscht, sodass Sie bei einem Fehler der Kopieraktivität feststellen werden, dass einige Dateien bereits ins Ziel kopiert und aus der Quelle gelöscht wurden, wohingegen sich andere weiter im Quellspeicher befinden. Aktiviert oder deaktiviert Nein detectDatetime
Bevorzugte Regionen Die bevorzugte Liste der Regionen, mit denen beim Abrufen von Daten aus Azure Cosmos DB eine Verbindung hergestellt werden soll. Wählen Sie eine bevorzugte Region aus der Dropdownliste aus, nachdem Sie Neu gewählt haben. <Ihre bevorzugten Regionen> Nein preferredRegions
Zusätzliche Spalten Fügen Sie zusätzliche Datenspalten hinzu, um den relativen Pfad oder statischen Wert der Quelldateien zu speichern. Für Letzteres wird ein Ausdruck unterstützt. Weitere Informationen finden Sie unter Hinzufügen zusätzlicher Spalten während des Kopiervorgangs. <Maximal zulässige Anzahl paralleler Verbindungen> Nein additionalColumns

Zieltabelle

Name Beschreibung Wert Erforderlich JSON-Skripteigenschaft
Datenspeichertyp Ihr Datenspeichertyp Extern Ja /
Verbindung Ihre Verbindung mit dem Zieldatenspeicher. <Ihre Verbindung> Ja Verbindung
Container Der Container Ihrer Zieldaten. <Container der Quelle> Ja Container
fileName
Verhalten bei Schreibvorgang Beschreibt, wie Daten in Azure Cosmos DB geschrieben werden. Zulässige Werte: insert und upsert. Das Verhalten von upsert besteht darin, das Dokument zu ersetzen, wenn ein Dokument mit der gleichen ID bereits vorhanden ist. Andernfalls wird das Dokument eingefügt. Dynamischen Inhalt hinzufügen
Einfügen
Upsert
Nein writeBehavior
Zeitlimit für Batchschreibvorgang Die Wartezeit für den Abschluss der Batcheinfügung, bevor ein Timeout auftritt. Zulässige Werte sind Timespan-Werte. Beispiel: 00:30:00 (30 Minuten). Zeitraum Nein writeBatchTimeout
Schreibbatchgröße Die Anzahl der Zeilen, die pro Batch in die SQL-Tabelle eingefügt werden sollen. Zulässiger Wert: integer (Anzahl der Zeilen) Standardmäßig bestimmt der Dienst die geeignete Batchgröße dynamisch auf der Grundlage der Zeilengröße. <Anzahl von Zeilen>
(Integer)
Nein writeBatchSize
Maximal zulässige Anzahl paralleler Verbindungen Die Obergrenze gleichzeitiger Verbindungen mit dem Datenspeicher während der Aktivitätsausführung. Geben Sie diesen Wert nur an, wenn Sie die Anzahl der gleichzeitigen Verbindungen begrenzen möchten. <Maximal zulässige Anzahl paralleler Verbindungen> Nein maxConcurrentConnections
Analyse von Leistungsmetriken deaktivieren Diese Einstellung steuert die Sammlung von Metriken wie DTU, DWU, RU usw. zur Optimierung der Kopierleistung und für Empfehlungen. Wenn dieses Verhalten problematisch sein könnte, deaktivieren Sie dieses Feature. Aktiviert oder deaktiviert Nein disableMetricsCollection