Behandeln von Erfassungsfehlern oder beschädigten Daten
Hinweis
Am 1. September 2023 haben wir Dynamics 365 Marketing und Dynamics 365 Customer Insights zusammengeführt und umbenannt. Dynamics 365 Marketing heißt jetzt Dynamics 365 Customer Insights – Journeys. Dynamics 365 Customer Insights heißt jetzt Dynamics 365 Customer Insights – Data. Weitere Informationen finden Sie unter Häufig gestellte Fragen zu Dynamics 365 Customer Insights.
In diesem Artikel werden häufige Gründe für Datenerfassungsfehler oder beschädigte Daten bei der Verwendung von Azure Data Lake Storage oder Power Query in Microsoft Dynamics 365 Customer Insights – Data vorgestellt.
Erfassungsfehler oder beschädigte Daten mit Azure Data Lake Storage
Während der Datenerfassung sind einige der häufigsten Gründe, warum ein Datensatz als beschädigt betrachtet werden kann:
- Die Datentypen und Feldwerte stimmen nicht zwischen der Quelldatei und dem Schema überein.
- Die Anzahl der Spalten in der Quelldatei stimmt nicht mit dem Schema überein.
- Felder enthalten Zeichen, die dazu führen, dass die Spalten im Vergleich zum erwarteten Schema schief gehen. Beispielsweise falsch formatierte Anführungszeichen, Anführungszeichen ohne Escapezeichen, Zeilenumbruchzeichen oder Zeichen im Registerkartenformat.
- Partitionsdateien fehlen.
-
datetime
Diedate
Felder , oderdatetimeoffset
entsprechen nicht dem Standardformat.
Schema- oder Datentypkonflikt
Wenn die Daten nicht dem Schema entsprechen, wird der Erfassungsprozess mit Fehlern abgeschlossen.
Um dieses Problem zu beheben, korrigieren Sie entweder die Quelldaten oder das Schema, und erfassen Sie die Daten erneut.
Partitionsdateien fehlen
Wenn der Erfassungsprozess ohne beschädigte Datensätze erfolgreich ist, Sie aber keine Daten sehen können, bearbeiten Sie Ihre model.json oder manifest.json Datei, um sicherzustellen, dass Partitionen angegeben sind. Aktualisieren Sie dann die Datenquelle.
Wenn die Datenerfassung zur gleichen Zeit erfolgt, zu der Datenquellen während einer automatischen Zeitplanaktualisierung aktualisiert werden, sind die Partitionsdateien möglicherweise leer oder für den Systemprozess nicht verfügbar. Um den Upstreamaktualisierungszeitplan anzupassen, ändern Sie den Systemaktualisierungszeitplan oder den Aktualisierungszeitplan für die Datenquelle. Richten Sie die Zeitsteuerung so aus, dass nicht alle Aktualisierungen gleichzeitig erfolgen.
Datetime-Felder weisen das falsche Format auf.
Die datetime
Felder in der Tabelle weisen nicht das Iso 8601- oder en-US
-Format auf. Das Standardformat datetime
in Dynamics 365 Customer Insights – Data ist en-US
.
datetime
Alle Felder in einer Tabelle sollten das gleiche Format aufweisen. Customer Insights unterstützt andere Formate, sofern Anmerkungen oder Merkmale auf Quell- oder Tabellenebene im Modell oder manifest.json vorgenommen werden. Beispiel:
Model.json
"annotations": [
{
"name": "ci:CustomTimestampFormat",
"value": "yyyy-MM-dd'T'HH:mm:ss:SSS"
},
{
"name": "ci:CustomDateFormat",
"value": "yyyy-MM-dd"
}
]
In einer manifest.json-Datei kann das datetime
Format auf Tabellen- oder Attributebene angegeben werden. Verwenden Sie "exhibitsTraits"
auf Tabellenebene in der Tabelle in *.manifest.cdm.json , um das datetime
Format zu definieren. Verwenden Sie "appliedTraits"
auf Attributebene im -Attribut in tablename.cdm.json.
Manifest.json auf Tabellenebene
"exhibitsTraits": [
{
"traitReference": "is.formatted.dateTime",
"arguments": [
{
"name": "format",
"value": "yyyy-MM-dd'T'HH:mm:ss"
}
]
},
{
"traitReference": "is.formatted.date",
"arguments": [
{
"name": "format",
"value": "yyyy-MM-dd"
}
]
}
]
table.json auf Attributebene
{
"name": "PurchasedOn",
"appliedTraits": [
{
"traitReference": "is.formatted.date",
"arguments" : [
{
"name": "format",
"value": "yyyy-MM-dd"
}
]
},
{
"traitReference": "is.formatted.dateTime",
"arguments" : [
{
"name": "format",
"value": "yyyy-MM-ddTHH:mm:ss"
}
]
}
],
"attributeContext": "POSPurchases/attributeContext/POSPurchases/PurchasedOn",
"dataFormat": "DateTime"
}
Erfassungsfehler oder beschädigte Daten mit Power Query
Datetime-Werte werden falsch analysiert, oder es tritt ein Analysefehler auf.
Der häufigste Datentypkonflikt tritt auf, wenn ein Datumsfeld nicht auf das richtige Datumsformat festgelegt ist. Dieser Konflikt kann durch falsch formatierte Quelldaten oder ein falsches Gebietsschema verursacht werden.
Symptome des Problems mit dem falschen Gebietsschema:
Wenn die Quelldaten nicht durch das verwendete Gebietsschema analysiert werden können, tritt ein Erfassungsfehler auf. Wenn z. B. "29/08/2023" mit "MM/TT/JJJJ" analysiert wird, schlägt die Erfassung fehl, da monat 29 nicht analysiert werden kann.
Wenn die Quelldaten erfolgreich mit einem falschen Gebietsschema analysiert werden, sind die datetime-Werte falsch. Die Quelldaten sind beispielsweise als "MM/TT/JJJJ" formatiert, während das Standardgebietsschema, das zum Analysieren der Daten während der Erfassung verwendet wird, "TT/MM/JJJJ" verwendet. Daher wird "8. Dezember 2023" als "12. August 2023" erfasst.
Lösung
Um ein falsches Format zu beheben, aktualisieren Sie die Quelldaten, und erfassen Sie sie erneut.
Um ein falsches Gebietsschema zu beheben, ändern Sie den Typ aller datetime-Felder, um das richtige Gebietsschema zu verwenden, indem Sie in den Power Query-Transformationen Typ>mithilfe des Gebietsschemas ändern. Beispiel:
Weitere Informationen finden Sie unter Gebietsschema für Dokumente oder Projekte.