Partager via


Mappage AVRO

Utilisez le mappage AVRO pour mapper les données entrantes aux colonnes à l’intérieur des tables lorsque votre fichier source d’ingestion est au format AVRO.

Chaque élément de la liste de mappage définit le mappage pour une colonne spécifique. Ces éléments sont construits à partir de trois propriétés : column, datatypeet properties. Pour plus d’informations, consultez vue d’ensemble des mappages de données.

Chaque élément de mappage AVRO doit contenir l’une des propriétés facultatives suivantes :

Propriété Type Description
Champ string Nom du champ dans l’enregistrement AVRO.
Chemin d’accès string Si la valeur commence par $ , elle est interprétée comme le chemin d’accès au champ dans le document AVRO qui deviendra le contenu de la colonne dans la table. Le chemin d’accès qui désigne l’enregistrement AVRO entier est $. Si la valeur ne commence pas par $ , elle est interprétée comme une valeur constante. Les chemins d’accès qui incluent des caractères spéciaux doivent être placés dans une séquence d’échappement en tant que ['Nom de la propriété']. Pour plus d’informations, consultez Syntaxe de JSONPath.
ConstValue string Valeur constante à utiliser pour une colonne au lieu d’une valeur à l’intérieur du fichier AVRO.
Transformation string Transformation qui doit être appliquée au contenu avec des transformations de mappage.

Notes

Champ et Chemin d’accès s’excluent mutuellement.

Les alternatives suivantes sont équivalentes :

[
  {"Column": "event_name", "Properties": {"Path": "$.EventName"}}
]
[
  {"Column": "event_name", "Properties": {"Field": "EventName"}}
]

Important

Pour l’ingestion en file d’attente :

  • Si la table référencée dans le mappage n’existe pas dans la base de données, elle est créée automatiquement, étant donné que des types de données valides sont spécifiés pour toutes les colonnes.
  • Si une colonne référencée dans le mappage n’existe pas dans la table, elle est automatiquement ajoutée à la table en tant que dernière colonne lors de la première ingestion de données pour cette colonne, étant donné qu’un type de données valide est spécifié pour la colonne. Pour ajouter de nouvelles colonnes à un mappage, utilisez la commande de mappage d’ingestion .alter.
  • Les données sont traitées par lots à l’aide des propriétés d’ingestion. Plus des propriétés de mappage d’ingestion distinctes sont utilisées, telles que des valeurs ConstValue différentes, plus l’ingestion devient fragmentée, ce qui peut entraîner une dégradation des performances.

Exemples

[
  {"Column": "event_timestamp", "Properties": {"Field": "Timestamp"}},
  {"Column": "event_name",      "Properties": {"Field": "Name"}},
  {"Column": "event_type",      "Properties": {"Field": "Type"}},
  {"Column": "event_time",      "Properties": {"Field": "Timestamp", "Transform": "DateTimeFromUnixMilliseconds"}},
  {"Column": "ingestion_time",  "Properties": {"ConstValue": "2021-01-01T10:32:00"}},
  {"Column": "full_record",     "Properties": {"Path": "$"}}
]

Le mappage ci-dessus est sérialisé en tant que chaîne JSON lorsqu’il est fourni dans le cadre de la .ingest commande de gestion.

.ingest into Table123 (@"source1", @"source2")
  with
  (
      format = "AVRO",
      ingestionMapping =
      ```
      [
        {"Column": "column_a", "Properties": {"Field": "Field1"}},
        {"Column": "column_b", "Properties": {"Field": "$.[\'Field name with space\']"}}
      ]
      ```
  )

Mappage précréé

Lorsque le mappage est précréé, référencez le mappage par son nom dans la .ingest commande de gestion.

.ingest into Table123 (@"source1", @"source2")
    with
    (
        format="AVRO",
        ingestionMappingReference = "Mapping_Name"
    )

Mappage d’identité

Utilisez le mappage AVRO pendant l’ingestion sans définir de schéma de mappage (voir mappage d’identité).

.ingest into Table123 (@"source1", @"source2")
    with
    (
        format="AVRO"
    )