Propriétés d’ingestion de données
S’applique à : ✅Microsoft Fabric✅Azure Data Explorer
L’ingestion des données est le processus par lequel les données sont ajoutées à une table et mises à disposition pour la requête. Vous ajoutez des propriétés à la commande d’ingestion après le mot clé with
.
Propriétés d’ingestion
Important
Dans les données d’ingestion mises en file d’attente, les données sont traitées par lot à l’aide de propriétés d’ingestion. Les propriétés de mappage d’ingestion plus distinctes utilisées, telles que différentes valeurs ConstValue, sont plus fragmentées l’ingestion devient, ce qui peut entraîner une dégradation des performances.
Le tableau suivant répertorie et décrit les propriétés prises en charge et fournit des exemples :
Propriété | Description | Exemple |
---|---|---|
ingestionMapping |
Valeur de chaîne qui indique comment mapper les données du fichier source aux colonnes réelles de la table. Définissez la valeur format avec le type de mappage approprié. Consultez Mappages de données. |
with (format="json", ingestionMapping = "[{\"column\":\"rownumber\", \"Properties\":{\"Path\":\"$.RowNumber\"}}, {\"column\":\"rowguid\", \"Properties\":{\"Path\":\"$.RowGuid\"}}]") (sont dépréciés : avroMapping , csvMapping , jsonMapping ) |
ingestionMappingReference |
Valeur de chaîne qui indique comment mapper les données du fichier source aux colonnes réelles de la table en utilisant un objet de stratégie de mappage nommé. Définissez la valeur format avec le type de mappage approprié. Consultez Mappages de données. |
with (format="csv", ingestionMappingReference = "Mapping1") (sont dépréciés : avroMappingReference , csvMappingReference , jsonMappingReference ) |
creationTime |
Valeur DateHeure (sous forme de chaîne ISO8601) à utiliser comme heure de création des étendues de données ingérées. Si elle n’est pas spécifiée, la valeur actuelle (now() ) est utilisée. La substitution de la valeur par défaut est utile lors de l’ingestion de données plus anciennes, afin que la stratégie de rétention soit appliquée correctement. Lorsqu’elle est spécifiée, assurez-vous que la propriété Lookback de la stratégie de fusion des étendues effective de la table cible est alignée sur la valeur spécifiée. |
with (creationTime="2017-02-13") |
extend_schema |
Valeur booléenne qui, si elle est spécifiée, indique à la commande d’étendre le schéma de la table (la valeur par défaut est false ). Cette option s’applique uniquement aux commandes .append et .set-or-append . Les seules extensions de schéma autorisées ont plus de colonnes ajoutées à la table à la fin. |
Si le schéma de la table d’origine est (a:string, b:int) , une extension de schéma valide est (a:string, b:int, c:datetime, d:string) et non (a:string, c:datetime) |
folder |
Pour les commandes ingest-from-query, dossier à attribuer à la table. Si la table existe déjà, cette propriété remplace le dossier de la table. | with (folder="Tables/Temporary") |
format |
Format des données (voir formats de données pris en charge). | with (format="csv") |
ingestIfNotExists |
Valeur de chaîne qui, si elle est spécifiée, empêche l’ingestion de s’effectuer correctement si la table a déjà des données balisées avec une balise ingest-by: de la même valeur. Cela garantit une ingestion des données idempotent. Pour plus d’informations, consultez Étiquettes ingest-by:. |
Les propriétés with (ingestIfNotExists='["Part0001"]', tags='["ingest-by:Part0001"]') indiquent que si des données existent déjà avec l’étiquette ingest-by:Part0001 , vous ne devez pas effectuer l’ingestion actuelle. Si elles n’existent pas déjà, l’étiquette doit être définie dans la nouvelle ingestion (au cas où une future ingestion tente d’ingérer une nouvelle fois les mêmes données). |
ignoreFirstRecord |
Valeur booléenne qui, si elle a la valeur true , indique que l’ingestion doit ignorer le premier enregistrement de chaque fichier. Cette propriété est utile pour les fichiers au format CSV (et similaires) si le premier enregistrement dans le fichier représente les noms de colonne. Par défaut, la valeur false est supposée. |
with (ignoreFirstRecord=false) |
policy_ingestiontime |
Valeur booléenne qui, si elle est spécifiée, indique d’activer ou non la stratégie de durée d’ingestion sur une table créée par cette commande. Par défaut, il s’agit de true . |
with (policy_ingestiontime=false) |
recreate_schema |
Valeur booléenne qui, si elle est spécifiée, indique si la commande peut recréer ou non le schéma de la table. Cette propriété s’applique uniquement à la commande .set-or-replace . Cette propriété est prioritaire sur la propriété extend_schema si les deux sont définies. |
with (recreate_schema=true) |
tags |
Liste d’étiquettes à associer aux données ingérées, sous forme de chaîne JSON | with (tags="['Tag1', 'Tag2']") |
TreatGzAsUncompressed |
Valeur booléenne qui, si elle est définie true sur , indique que les fichiers avec l’extension .gz ne sont pas compressés. Cet indicateur est parfois nécessaire lors de l’ingestion à partir d’Amazon AWS S3. |
with (treatGzAsUncompressed=true) |
validationPolicy |
Chaîne JSON qui indique les validations à exécuter pendant l’ingestion des données représentées au format CSV. Consultez Ingestion des données pour avoir une explication des différentes options. | with (validationPolicy='{"ValidationOptions":1, "ValidationImplications":1}') (il s’agit de la stratégie par défaut) |
zipPattern |
Utilisez cette propriété en cas d’ingestion des données à partir d’un stockage qui a une archive ZIP. Il s’agit d’une valeur de chaîne indiquant l’expression régulière à utiliser pour sélectionner les fichiers de l’archive ZIP à ingérer. Tous les autres fichiers de l’archive sont ignorés. | with (zipPattern="*.csv") |
Contenu connexe
- En savoir plus sur les formats de données pris en charge
- Découvrez-en plus sur l’ingestion de données.