Настройка потоков данных в операциях Интернета вещей Azure

Статья
07.02.2025

Важно!

На этой странице содержатся инструкции по управлению компонентами Операций Интернета вещей Azure с помощью манифестов развертывания Kubernetes, которые доступны в предварительной версии. Эта функция предоставляется с несколькими ограничениями и не должна использоваться для рабочих нагрузок.

Юридические условия, применимые к функциям Azure, которые находятся в состоянии бета-версии, предварительной версии или иным образом еще не выпущены в общедоступной версии, см. на странице Дополнительные условия использования предварительных версий в Microsoft Azure.

Поток данных — это путь, который данные принимают из источника в место назначения с необязательными преобразованиями. Вы можете настроить поток данных, создав поток данных настраиваемый ресурс или используя веб-интерфейс интерфейса взаимодействия с операциями. Поток данных состоит из трех частей: источника, преобразования и назначения.

Схема потока данных, показывающая поток из источника в преобразование, а затем назначение.

Чтобы определить источник и назначение, необходимо настроить конечные точки потока данных. Преобразование является необязательным и может включать такие операции, как обогащение данных, фильтрация данных и сопоставление данных с другим полем.

Важно!

Каждый поток данных должен иметь локальную конечную точку брокера MQTT в Azure IoT Operations по умолчанию в качестве источника или назначения.

Вы можете использовать опыт в операциях IoT в Azure для создания потока данных. Интерфейс операций предоставляет визуальный интерфейс для настройки потока данных. Вы также можете использовать Bicep для создания потока данных с помощью файла шаблона Bicep или использовать Kubernetes для создания потока данных с помощью YAML-файла.

Продолжайте чтение, чтобы узнать, как настроить источник, преобразование и назначение.

Предварительные условия

Потоки данных можно развернуть сразу после того, как у вас есть экземпляр Azure IoT Operations, используя профиль потока данных по умолчанию и конечную точку. Однако может потребоваться настроить профили потока данных и конечные точки для настройки потока данных.

Профиль потока данных

Если для потоков данных не нужны разные параметры масштабирования, используйте профиль потока данных по умолчанию, предоставляемый операциями Интернета вещей Azure. Сведения о настройке профиля потока данных см. в разделе "Настройка профилей потока данных".

Конечные точки потока данных

Конечные точки потока данных необходимы для настройки источника и назначения для потока данных. Чтобы быстро приступить к работе, можно использовать конечную точку по умолчанию потока данных для локального брокера MQTT. Вы также можете создавать другие типы конечных точек потока данных, таких как Kafka, Центры событий или Azure Data Lake Storage. Сведения о настройке каждой конечной точки потока данных см. в разделе "Настройка конечных точек потока данных".

Начало работы

После получения необходимых компонентов можно приступить к созданию потока данных.

Чтобы создать поток данных в рабочей среде, выберите Поток данныхСоздать поток данных. Затем вы увидите страницу, на которой можно настроить источник, преобразование и назначение для потока данных.

Снимок экрана, демонстрирующий использование опыта в области операций для создания потока данных.

Создайте файл Bicep .bicep , чтобы начать создание потока данных. В этом примере показана структура потока данных, содержащего конфигурации источника, преобразования и назначения.

param aioInstanceName string = '<AIO_INSTANCE_NAME>'
param customLocationName string = '<CUSTOM_LOCATION_NAME>'
param dataflowName string = '<DATAFLOW_NAME>'

resource aioInstance 'Microsoft.IoTOperations/instances@2024-11-01' existing = {
  name: aioInstanceName
}

resource customLocation 'Microsoft.ExtendedLocation/customLocations@2021-08-31-preview' existing = {
  name: customLocationName
}

resource defaultDataflowEndpoint 'Microsoft.IoTOperations/instances/dataflowEndpoints@2024-11-01' existing = {
  parent: aioInstance
  name: 'default'
}

// Pointer to the default data flow profile
resource defaultDataflowProfile 'Microsoft.IoTOperations/instances/dataflowProfiles@2024-11-01' existing = {
  parent: aioInstance
  name: 'default'
}

resource dataflow 'Microsoft.IoTOperations/instances/dataflowProfiles/dataflows@2024-11-01' = {
  // Reference to the parent data flow profile, the default profile in this case
  // Same usage as profileRef in Kubernetes YAML
  parent: defaultDataflowProfile
  name: dataflowName
  extendedLocation: {
    name: customLocation.id
    type: 'CustomLocation'
  }
  properties: {
    mode: 'Enabled'
    operations: [
      {
        operationType: 'Source'
        sourceSettings: {
          // See source configuration section
        }
      }
      // Transformation optional
      {
        operationType: 'BuiltInTransformation'
        builtInTransformationSettings: {
          // See transformation configuration section
        }
      }
      {
        operationType: 'Destination'
        destinationSettings: {
          // See destination configuration section
        }
      }
    ]
  }
}

Создайте файл манифеста .yaml Kubernetes, чтобы начать создание потока данных. В этом примере показана структура потока данных, содержащего конфигурации источника, преобразования и назначения.

apiVersion: connectivity.iotoperations.azure.com/v1
kind: Dataflow
metadata:
  name: <DATAFLOW_NAME>
  namespace: azure-iot-operations
spec:
  # Reference to the default data flow profile
  # This field is required when configuring via Kubernetes YAML
  # The syntax is different when using Bicep
  profileRef: default 
  mode: Enabled
  operations:
    - operationType: Source
      sourceSettings:
        # See source configuration section
      # Transformation optional
    - operationType: BuiltInTransformation
      builtInTransformationSettings:
        # See transformation configuration section
    - operationType: Destination
      destinationSettings:
        # See destination configuration section

Ознакомьтесь со следующими разделами, чтобы узнать, как настроить типы операций потока данных.

Источник

Чтобы настроить источник потока данных, укажите ссылку на конечную точку и список источников данных для конечной точки. Выберите один из следующих параметров в качестве источника потока данных.

Если конечная точка по умолчанию не используется в качестве источника, она должна использоваться в качестве назначения. Дополнительные сведения см. в статье "Потоки данных" должны использовать локальную конечную точку брокера MQTT.

Вариант 1. Использование конечной точки брокера сообщений по умолчанию в качестве источника

В разделе "Исходные сведения" выберите брокер сообщений.

Введите следующие параметры для источника брокера сообщений:

Настройка	Описание
Конечная точка потока данных	Выберите по умолчанию, чтобы использовать стандартную конечную точку брокера сообщений MQTT.
Тема	Фильтр раздела для подписки на входящие сообщения. Используйте Тему(ы)>Добавить строку, чтобы добавить несколько тем. Дополнительные сведения о разделах см. в разделе "Настройка MQTT" или "Kafka".
Схема сообщений	Схема, используемая для десериализации входящих сообщений. См. раздел "Указание схемы для десериализации данных".

Выберите Применить.

Конечная точка брокера сообщений настраивается в файле шаблона Bicep. Например, следующая конечная точка является источником потока данных.

sourceSettings: {
  endpointRef: 'default'
  dataSources: [
    'thermostats/+/telemetry/temperature/#'
    'humidifiers/+/telemetry/humidity/#'
  ]
}

dataSources Здесь можно указать несколько разделов MQTT или Kafka, не изменяя конфигурацию конечной точки. Эта гибкость означает, что одна конечная точка может использоваться повторно в нескольких потоках данных, даже если разделы различаются. Дополнительные сведения см. в разделе "Настройка источников данных".

Например, чтобы настроить источник с помощью конечной точки брокера сообщений и двух фильтров разделов, используйте следующую конфигурацию:

sourceSettings:
  endpointRef: default
  dataSources:
    - thermostats/+/telemetry/temperature/#
    - humidifiers/+/telemetry/humidity/#

Так как dataSources можно указать разделы MQTT или Kafka без изменения конфигурации конечной точки, можно повторно использовать конечную точку для нескольких потоков данных, даже если разделы отличаются. Дополнительные сведения см. в разделе "Настройка источников данных".

Вариант 2. Использование ресурса в качестве источника

Вы можете использовать ресурс в качестве источника для потока данных. Использование актива в качестве источника доступно только в интерфейсе операций.

В разделе "Исходные сведения" выберите "Ресурс".
Выберите ресурс, который вы хотите использовать в качестве исходной конечной точки.
Выберите Продолжить.

Отображается список точек данных для выбранного ресурса.
Выберите "Применить" , чтобы использовать ресурс в качестве исходной конечной точки.

При использовании ресурса в качестве источника определение ресурса используется для вывода схемы потока данных. Определение ресурса включает схему для точек данных ресурса. Дополнительные сведения см. в статье "Удаленное управление конфигурациями ресурсов".

После настройки данные с устройства поступают в поток данных через локальный брокер MQTT. Таким образом, при использовании ресурса в качестве источника поток данных использует локальную конечную точку брокера MQTT по умолчанию в качестве источника в действительности.

Вариант 3. Использование пользовательской конечной точки потока данных MQTT или Kafka в качестве источника

Если вы создали пользовательскую конечную точку потока данных MQTT или Kafka (например, для использования с сеткой событий или Центрами событий), ее можно использовать в качестве источника потока данных. Помните, что конечные точки типа хранилища, такие как Data Lake или Fabric OneLake, нельзя использовать в качестве источника.

В разделе "Исходные сведения" выберите брокер сообщений.

Введите следующие параметры для источника брокера сообщений:

Настройка	Описание
Конечная точка потока данных	Нажмите кнопку повторного выбора , чтобы выбрать пользовательскую конечную точку потока данных MQTT или Kafka. Дополнительные сведения см. в разделе Настройка конечных точек потока данных MQTT или Настройка конечных точек потока данных Azure Event Hubs и Kafka.
Тема	Фильтр раздела для подписки на входящие сообщения. Используйте ТемыДобавить строку для добавления нескольких тем. Дополнительные сведения о разделах см. в разделе "Настройка MQTT" или "Kafka".
Схема сообщений	Схема, используемая для десериализации входящих сообщений. См. раздел "Указание схемы для десериализации данных".

Выберите Применить.

Замените значения заполнителей именем и разделами настраиваемой конечной точки.

sourceSettings: {
  endpointRef: '<CUSTOM_ENDPOINT_NAME>'
  dataSources: [
    '<TOPIC_1>'
    '<TOPIC_2>'
    // See section on configuring MQTT or Kafka topics for more information
  ]
}

Замените значения заполнителей именем конечной точки и темами по вашему выбору.

sourceSettings:
  endpointRef: <CUSTOM_ENDPOINT_NAME>
  dataSources:
  - <TOPIC_1>
  - <TOPIC_2>
  # See section on configuring MQTT or Kafka topics for more information

Настроить источники данных (топики MQTT или Kafka)

Можно указать несколько разделов MQTT или Kafka в источнике, не изменив конфигурацию конечной точки потока данных. Эта гибкость означает, что одна конечная точка может использоваться повторно в нескольких потоках данных, даже если разделы различаются. Дополнительные сведения см. в статье "Повторное использование конечных точек потока данных".

Темы MQTT

Если источником является конечная точка MQTT (включенная сетка событий), можно использовать фильтр раздела MQTT для подписки на входящие сообщения. Фильтр разделов может включать подстановочные знаки для подписки на несколько разделов. Например, thermostats/+/telemetry/temperature/# подписывается на все сообщения телеметрии температуры из термостатов. Чтобы настроить фильтры раздела MQTT, выполните следующие действия.

В сведениях о источнике потока данных для операций выберите брокер сообщений, а затем используйте поле "Темы", чтобы указать фильтры разделов MQTT для подписки на входящие сообщения. Вы можете добавить несколько разделов MQTT, выбрав "Добавить строку " и введя новый раздел.

sourceSettings: {
  endpointRef: '<MESSAGE_BROKER_ENDPOINT_NAME>'
  dataSources: [
    '<TOPIC_FILTER_1>'
    '<TOPIC_FILTER_2>'
    // Add more topic filters as needed
  ]
}

Пример с несколькими фильтрами разделов MQTT с подстановочными знаками:

sourceSettings: {
  endpointRef: 'default'
  dataSources: [
    'thermostats/+/telemetry/temperature/#'
    'humidifiers/+/telemetry/humidity/#'
  ]
}

Здесь подстановочный знак + используется для выбора всех устройств в темах thermostats и humidifiers. Глобальный символ # используется для выбора всех сообщений телеметрии во всех подтопиках тем temperature и humidity.

sourceSettings:
  endpointRef: <ENDPOINT_NAME>
  dataSources:
    - <TOPIC_FILTER_1>
    - <TOPIC_FILTER_2>
    # Add more topic filters as needed

Пример с несколькими фильтрами разделов с подстановочными знаками:

sourceSettings:
  endpointRef: default
  dataSources:
    - thermostats/+/telemetry/temperature/#
    - humidifiers/+/telemetry/humidity/#

Здесь подстановочный знак + используется для выбора всех устройств по темам thermostats и humidifiers. Подстановочный шаблон # используется для выбора всех сообщений телеметрии во всех подтопиках топиков temperature и humidity.

Общие подписки

Чтобы использовать общие подписки с источниками брокера сообщений, можно указать раздел общей подписки в виде $shared/<GROUP_NAME>/<TOPIC_FILTER>.

В данных о потоке операций о сведениях источника выберите Брокер сообщений и используйте поле "Тема", чтобы указать группу совместной подписки и тему.

sourceSettings: {
  dataSources: [
    '$shared/<GROUP_NAME>/<TOPIC_FILTER>'
  ]
}

sourceSettings:
  dataSources:
    - $shared/<GROUP_NAME>/<TOPIC_FILTER>

Если число экземпляров в профиле потока данных больше одного, общая подписка автоматически включается для всех потоков данных, использующих источник брокера сообщений. В этом случае добавляется префикс $shared, и автоматически создаётся имя общей группы подписок. Например, если у вас есть профиль потока данных с числом экземпляров 3, а поток данных использует конечную точку брокера сообщений в качестве источника, настроенного с топиками topic1 и topic2, они автоматически преобразуются в разделённые подписки как $shared/<GENERATED_GROUP_NAME>/topic1 и $shared/<GENERATED_GROUP_NAME>/topic2.

Вы можете явно создать раздел с именем $shared/mygroup/topic в конфигурации. Однако явное добавление $shared раздела не рекомендуется, так как $shared префикс автоматически добавляется при необходимости. Потоки данных могут выполнять оптимизацию с именем группы, если она не задана. Например, $share не задано, и данные потоки могут работать только с именем раздела.

Важно!

Потоки данных, которые требуют общую подписку, когда количество экземпляров превышает один, особенно важны при использовании брокера MQTT Event Grid в качестве источника, так как он не поддерживает общие подписки. Чтобы избежать пропуска сообщений, задайте для экземпляра профиля потока данных значение один при использовании брокера MQTT Event Grid в качестве источника. Это происходит, когда поток данных является подписчиком и получает сообщения из облака.

Темы Kafka

Если источником является конечная точка Kafka (включая Event Hubs), укажите отдельные топики Kafka, на которые нужно подписаться для получения входящих сообщений. Подстановочные знаки не поддерживаются, поэтому необходимо указать каждую тему статически.

Примечание

При использовании Центров событий через конечную точку Kafka каждый отдельный концентратор событий в пространстве имен — это раздел Kafka. Например, если у вас есть пространство имен Центров событий с двумя концентраторами событий, thermostats и humidifiers, то можно указать каждый концентратор событий в качестве темы Kafka.

Чтобы настроить разделы Kafka, выполните следующие действия.

В сведениях о источнике потока данных для операций выберите брокер сообщений, а затем используйте поле "Раздел", чтобы указать фильтр раздела Kafka для подписки на входящие сообщения.

Примечание

В опыте работы с операциями можно указать только один фильтр тем. Чтобы использовать несколько фильтров разделов, используйте Bicep или Kubernetes.

sourceSettings: {
  endpointRef: '<KAFKA_ENDPOINT_NAME>'
  dataSources: [
    '<KAFKA_TOPIC_1>'
    '<KAFKA_TOPIC_2>'
    // Add more Kafka topics as needed
  ]
}

sourceSettings:
  endpointRef: <KAFKA_ENDPOINT_NAME>
  dataSources:
    - <KAFKA_TOPIC_1>
    - <KAFKA_TOPIC_2>
    # Add more Kafka topics as needed

Указание исходной схемы

При использовании MQTT или Kafka в качестве источника можно указать схему для отображения списка точек данных в пользовательском веб-интерфейсе операций. Использование схемы для десериализации и проверки входящих сообщений в настоящее время не поддерживается.

Если источник является ресурсом, схема автоматически выводится из определения ресурса.

Совет

Чтобы создать схему из файла с образцом данных, используйте помощник Schema Gen.

Чтобы настроить схему, используемую для десериализации входящих сообщений из источника:

В операционном опыте потока данных Сведения об источнике, выберите брокер сообщений и используйте поле Схема сообщений, чтобы указать схему. Для отправки файла схемы можно использовать кнопку "Отправить ". Дополнительные сведения см. в статье "Общие сведения о схемах сообщений".

После использования реестра схем для хранения схемы вы можете ссылаться на нее в конфигурации потока данных.

sourceSettings: {
  serializationFormat: 'Json'
  schemaRef: 'aio-sr://<SCHEMA_NAMESPACE>/<SCHEMA_NAME>:<VERSION>'
}

После использования реестра схем для хранения схемы вы можете ссылаться на нее в конфигурации потока данных.

sourceSettings:
  serializationFormat: Json
  schemaRef: 'aio-sr://<SCHEMA_NAMESPACE>/<SCHEMA_NAME>:<VERSION>'

Дополнительные сведения см. в статье "Общие сведения о схемах сообщений".

Преобразование

Операция преобразования заключается в том, что перед отправкой данных в место назначения можно преобразовать данные из источника. Преобразования являются необязательными. Если вам не нужно вносить изменения в данные, не включайте операцию преобразования в конфигурацию потока данных. Несколько преобразований выполняются на различных стадиях вне зависимости от порядка, в котором они указаны в конфигурации. Порядок этапов всегда:

Обогащение. Добавьте дополнительные данные в исходные данные, заданные набором данных и условием для сопоставления.
Фильтр. Фильтрация данных на основе условия.
Сопоставление, вычисление, переименование или добавление нового свойства: перемещение данных из одного поля в другое с необязательным преобразованием.

В этом разделе приведены общие сведения о преобразованиях потока данных. Дополнительные сведения см. в разделе "Сопоставление данных с помощью потоков данных", "Преобразование данных с помощью преобразований потоков данных" и "Обогащение данных" с помощью потоков данных.

В интерфейсе операций выберите "Добавить преобразование потока>данных" (необязательно).

Снимок экрана: использование опыта работы с операциями для добавления преобразования в поток данных.

builtInTransformationSettings: {
  datasets: [
    // See section on enriching data
  ]
  filter: [
    // See section on filtering data
  ]
  map: [
    // See section on mapping data
  ]
}

builtInTransformationSettings:
  datasets:
    # See section on enriching data
  filter:
    # See section on filtering data
  map:
    # See section on mapping data

Обогащение: добавление ссылочных данных

Чтобы обогатить данные, сначала добавьте ссылочный набор данных в операционное хранилище состояний Azure IoT . Набор данных используется для добавления дополнительных данных в исходные данные на основе условия. Условие указывается в качестве поля в исходных данных, которые соответствуют полю в наборе данных.

Вы можете загрузить образцы данных в хранилище состояний с помощью интерфейса командной строки хранилища состояний. Имена ключей в хранилище состояний соответствуют набору данных в конфигурации потока данных.

В настоящее время этап обогащения не поддерживается в интерфейсе операций.

В этом примере показано, как можно использовать deviceId поле в исходных данных для сопоставления asset поля в наборе данных:

builtInTransformationSettings: {
  datasets: [
    {
      key: 'assetDataset'
      inputs: [
        '$source.deviceId' // ---------------- $1
        '$context(assetDataset).asset' // ---- $2
      ]
      expression: '$1 == $2'
    }
  ]
}

Например, можно использовать deviceId поле в исходных данных для сопоставления asset поля в наборе данных:

builtInTransformationSettings:
  datasets:
  - key: assetDataset
    inputs:
      - $source.deviceId # ------------- $1
      - $context(assetDataset).asset # - $2
    expression: $1 == $2

Если набор данных содержит запись с asset полем, аналогично:

{
  "asset": "thermostat1",
  "location": "room1",
  "manufacturer": "Contoso"
}

Данные из источника, в котором поле deviceId соответствует thermostat1, имеют поля location и manufacturer, доступные на этапах фильтрации и отображения.

Дополнительные сведения о синтаксисе условий см. в разделе "Обогащение данных с помощью потоков данных" и "Преобразование данных с помощью потоков данных".

Фильтр: фильтрация данных на основе условия

Чтобы отфильтровать данные по условию, используется этап filter. Условие указывается в качестве поля в исходных данных, которые соответствуют значению.

В разделе «Преобразование (необязательно)» выберите «Фильтр»>«Добавить».

Введите необходимые параметры.

Настройка	Описание
Условие фильтра	Условие фильтрации данных на основе поля в исходных данных.
Описание	Укажите описание условия фильтра.

В поле условия фильтра введите значение @ или нажмите CTRL+ПРОБЕЛ, чтобы выбрать точки данных из выпадающего списка.

Вы можете ввести свойства метаданных MQTT с помощью формата @$metadata.user_properties.<property> или @$metadata.topic. Вы также можете ввести заголовки $metadata с помощью формата @$metadata.<header>. Синтаксис $metadata необходим только для свойств MQTT, входящих в заголовок сообщения. Для получения дополнительной информации см. справочную информацию о полях.

Условие может использовать поля в исходных данных. Например, можно использовать условие фильтрации, такое как @temperature > 20, чтобы отфильтровать данные, равные или меньшие 20, на основе поля температуры.

Выберите Применить.

Например, можно использовать temperature поле в исходных данных для фильтрации данных:

builtInTransformationSettings: {
  filter: [
    {
      inputs: [
        'temperature ? $last'
      ]
      expression: '$1 > 20'
    }
  ]
}

temperature Если поле больше 20, данные передаются на следующий этап. temperature Если поле меньше или равно 20, данные фильтруются.

Например, можно использовать temperature поле в исходных данных для фильтрации данных:

builtInTransformationSettings:
  filter:
    - inputs:
      - temperature ? $last # - $1
      expression: "$1 > 20"

Карта: перемещение данных из одного поля в другое

Чтобы сопоставить данные с другим полем с необязательным преобразованием, можно использовать операцию map. Преобразование указывается в виде формулы, которая использует поля в исходных данных.

В интерфейсе операций сопоставление на данный момент поддерживается с помощью трансформаций вычисления, переименования и нового свойства.

Вычислить

Вы можете использовать преобразование Вычисление, чтобы применить формулу к исходным данным. Эта операция используется для применения формулы к исходным данным и хранения поля результатов.

В разделе «Преобразование» (необязательно) выберите «Вычисления»>«Добавить».

Введите необходимые параметры.

Настройка	Описание
Выбор формулы	Выберите существующую формулу из раскрывающегося списка или выберите "Пользователь" , чтобы ввести формулу вручную.
Выходные данные	Укажите имя для отображения результата.
Формула	Введите формулу, применяемую к исходным данным.
Описание	Укажите описание преобразования.
Последнее известное значение	При необходимости используйте последнее известное значение, если текущее значение недоступно.

В поле "Формула" можно ввести или изменить формулу. Формула может использовать поля в исходных данных. Введите @ или нажмите клавиши CTRL + ПРОБЕЛ, чтобы выбрать точки данных из выпадающего списка. Для встроенных формул выберите <dataflow> плейсхолдер, чтобы просмотреть список доступных точек информации.

Формула может использовать поля в исходных данных. Например, можно использовать temperature поле в исходных данных для преобразования температуры в Цельсию и хранения его в temperatureCelsius поле вывода.

Выберите Применить.

Переименовать

Можно переименовать точку данных с помощью преобразования «Переименовать». Эта операция используется для переименования точки данных в исходных данных в новое имя. Новое имя можно использовать на последующих этапах потока данных.

В разделе "Преобразование( необязательно)" выберите "Переименовать>добавить".

Введите необходимые параметры.

Настройка	Описание
Точка данных	Выберите точку данных из раскрывающегося списка или введите заголовок $metadata.
Новое имя точки данных	Введите новое имя точки данных.
Описание	Укажите описание преобразования.

Вы можете ввести свойства метаданных MQTT с помощью формата @$metadata.user_properties.<property> или @$metadata.topic. Вы также можете ввести заголовки $metadata с помощью формата @$metadata.<header>. Синтаксис $metadata необходим только для свойств MQTT, входящих в заголовок сообщения. Дополнительные сведения см. в разделе справка по полям.

Выберите Применить.

Новое свойство

Вы можете добавить новое свойство в исходные данные с помощью преобразования нового свойства . Эта операция используется для добавления нового свойства в исходные данные. Новое свойство можно использовать на последующих этапах потока данных.

В разделе "Преобразование" (необязательно) выберите "Добавить новое свойство>".

Введите необходимые параметры.

Настройка	Описание
Ключ свойства	Введите ключ для нового свойства.
Значение свойства	Введите значение нового свойства.
Описание	Укажите описание нового свойства.

Выберите Применить.

Вы можете получить доступ к свойствам метаданных MQTT с помощью формата $metadata.user_properties.<property> или $metadata.topic. Вы также можете ввести заголовки $metadata с помощью формата $metadata.<header>. Дополнительные сведения см. в справочниках по полям.

Например, можно использовать temperature поле в исходных данных для преобразования температуры в Цельсию и хранения его в temperatureCelsius поле. Вы также можете дополнить исходные данные location полем из набора данных контекстуализации:

builtInTransformationSettings: {
  map: [
    {
      inputs: [
        'temperature'
      ]
      output: 'temperatureCelsius'
      expression: '($1 - 32) * 5/9'
    }
    {
      inputs: [
        '$context(assetDataset).location'
      ]
      output: 'location'
    }
  ]
}

builtInTransformationSettings:
  map:
    - inputs:
      - temperature # - $1
      expression: "($1 - 32) * 5/9"
      output: temperatureCelsius
    - inputs:
      - $context(assetDataset).location  
      output: location

Дополнительные сведения см. в статье "Сопоставление данных с помощью потоков данных" и "Преобразование данных" с помощью потоков данных.

Сериализация данных в соответствии со схемой

Если необходимо сериализовать данные перед отправкой в место назначения, необходимо указать формат схемы и сериализации. В противном случае данные сериализуются в ФОРМАТЕ JSON с выводом типов. Конечные точки хранилища, такие как Microsoft Fabric или Azure Data Lake, требуют схемы для обеспечения согласованности данных. Поддерживаемые форматы сериализации — Parquet и Delta.

Совет

Чтобы создать схему из образца файла данных, используйте инструмент Schema Gen Helper.

Для опыта работы с операциями вы указываете формат схемы и сериализации в деталях конечной точки потока данных. Конечные точки, поддерживающие форматы сериализации, — Microsoft Fabric OneLake, Azure Data Lake Storage 2-го поколения, Azure Data Explorer и локальное хранилище. Например, чтобы сериализовать данные в разностном формате, необходимо отправить схему в реестр схем и ссылаться на нее в конфигурации конечной точки назначения потока данных.

Снимок экрана: использование опыта выполнения операций для задания сериализации конечной точки назначения потока данных.

После отправки схемы в реестр схем можно ссылаться на нее в конфигурации потока данных.

builtInTransformationSettings: {
  serializationFormat: 'Delta'
  schemaRef: 'aio-sr://<SCHEMA_NAMESPACE>/<SCHEMA>:<VERSION>'
}

После отправки схемы в реестр схем можно ссылаться на нее в конфигурации потока данных.

builtInTransformationSettings:
  serializationFormat: Delta
  schemaRef: 'aio-sr://<SCHEMA_NAMESPACE>/<SCHEMA>:<VERSION>'

Дополнительные сведения о реестре схем см. в разделе "Общие сведения о схемах сообщений".

Назначение

Чтобы настроить место назначения для потока данных, укажите ссылку на конечную точку и место назначения данных. Вы можете указать список мест назначения данных для конечной точки.

Чтобы отправить данные в место назначения, отличное от локального брокера MQTT, создайте конечную точку потока данных. Сведения о настройке конечных точек потока данных см. в статье "Настройка конечных точек потока данных". Если назначение не локальный брокер MQTT, его нужно использовать как источник. Дополнительные сведения см. в статье "Потоки данных" должны использовать локальную конечную точку брокера MQTT.

Важно!

Для конечных точек хранилища требуется схема сериализации. Чтобы использовать поток данных с Microsoft Fabric OneLake, Azure Data Lake Storage, Azure Data Explorer или локальное хранилище, необходимо указать ссылку на схему.

Выберите конечную точку потока данных, используемую в качестве назначения.

Для конечных точек хранилища требуется схема сериализации. Если выбрать конечную точку назначения Microsoft Fabric OneLake, Azure Data Lake Storage, Azure Data Explorer или конечную точку назначения локального хранилища, необходимо указать ссылку на схему. Например, чтобы сериализовать данные в конечную точку Microsoft Fabric в формате Delta, необходимо добавить схему в реестр схем и ссылаться на нее в конфигурации конечной точки потока данных.
Нажмите кнопку "Продолжить", чтобы настроить назначение.
Введите необходимые параметры для назначения, включая раздел или таблицу для отправки данных. Дополнительные сведения см. в разделе "Настройка назначения данных" (раздел, контейнер или таблица).

destinationSettings: {
  endpointRef: '<CUSTOM_ENDPOINT_NAME>'
  dataDestination: '<TOPIC_OR_TABLE>' // See section on configuring data destination
}

destinationSettings:
  endpointRef: <CUSTOM_ENDPOINT_NAME>
  dataDestination: <TOPIC_OR_TABLE> # See section on configuring data destination

Настройка назначения данных (раздел, контейнер или таблица)

Как и источники данных, назначение данных — это концепция, используемая для повторного использования конечных точек потока данных в нескольких потоках данных. По сути, он представляет подкаталог в конфигурации конечной точки потока данных. Например, если конечная точка потока данных является конечной точкой хранения, назначение данных — это таблица в учетной записи хранения. Если конечная точка потока данных является конечной точкой Kafka, назначение данных — это раздел Kafka.

Тип конечной точки	Значение назначения данных	Описание
MQTT (или сетка событий)	Тема	Раздел MQTT, в котором отправляются данные. Поддерживаются только статические темы, подстановочные символы не поддерживаются.
Kafka (или Центры событий)	Тема	Раздел Kafka, в котором отправляются данные. Поддерживаются только статические темы, без подстановочных знаков. Если конечная точка является пространством имен Хабов событий, назначение данных — это отдельный хаб событий в этом пространстве имен.
Azure Data Lake Storage	Контейнер	Контейнер в учетной записи хранения данных. Это не таблица.
Microsoft Fabric OneLake	Таблица или папка	Соответствует типу настроенного пути для конечной точки.
Azure Data Explorer (инструмент для анализа данных от Azure)	Таблица	Таблица в базе данных Azure Data Explorer.
Локальное хранилище	Папка	Имя папки или каталога в локальном хранилище постоянного тома. При использовании хранилища контейнеров Azure, активированного томами Azure Arc Cloud Ingest Edge, это должно соответствовать параметру `spec.path` созданного подтома.

Чтобы настроить назначение данных, выполните следующие действия.

При использовании интерфейса операций поле назначения данных автоматически интерпретируется на основе типа конечной точки. Например, если конечная точка потока данных является конечной точкой хранения, страница сведений о назначении предложит ввести имя контейнера. Если конечная точка потока данных является конечной точкой MQTT, страница сведений о назначении предложит ввести тему.

Снимок экрана, показывающий интерфейс операций, в котором пользователю предлагается ввести тему MQTT в зависимости от типа конечной точки.

Синтаксис одинаков для всех конечных точек потока данных:

destinationSettings: {
  endpointRef: "<CUSTOM_ENDPOINT_NAME>"
  dataDestination: '<TOPIC_OR_TABLE>'
}

Например, чтобы отправить данные обратно в локальный брокер MQTT по статической теме MQTT, используйте следующую конфигурацию.

destinationSettings: {
  endpointRef: 'default'
  dataDestination: 'example-topic'
}

Или, если у вас есть пользовательская конечная точка концентратора событий, конфигурация будет выглядеть следующим образом:

destinationSettings: {
  endpointRef: 'my-eh-endpoint'
  dataDestination: 'individual-event-hub'
}

Другой пример использования конечной точки хранилища в качестве назначения:

destinationSettings: {
  endpointRef: 'my-adls-endpoint'
  dataDestination: 'my-container'
}

Синтаксис одинаков для всех конечных точек потока данных:

destinationSettings:
  endpointRef: <CUSTOM_ENDPOINT_NAME>
  dataDestination: <TOPIC_OR_TABLE>

Например, чтобы отправить данные обратно в локальному брокеру MQTT по статической теме MQTT, используйте следующую конфигурацию:

destinationSettings:
  endpointRef: default
  dataDestination: example-topic

destinationSettings:
  endpointRef: my-eh-endpoint
  dataDestination: individual-event-hub

Другой пример использования конечной точки хранилища в качестве назначения:

destinationSettings:
  endpointRef: my-adls-endpoint
  dataDestination: my-container

Пример

В следующем примере приведена конфигурация потока данных, которая использует конечную точку MQTT для источника и назначения. Источник фильтрует данные из топика azure-iot-operations/data/thermostatMQTT. Преобразование переводит температуру в Фаренгейт и фильтрует данные, где произведение температуры на влажность меньше 100000. Назначение отправляет данные в топик MQTT factory.

param aioInstanceName string = '<AIO_INSTANCE_NAME>'
param customLocationName string = '<CUSTOM_LOCATION_NAME>'
param dataflowName string = '<DATAFLOW_NAME>'

resource aioInstance 'Microsoft.IoTOperations/instances@2024-11-01' existing = {
  name: aioInstanceName
}

resource customLocation 'Microsoft.ExtendedLocation/customLocations@2021-08-31-preview' existing = {
  name: customLocationName
}

// Pointer to the default data flow endpoint
resource defaultDataflowEndpoint 'Microsoft.IoTOperations/instances/dataflowEndpoints@2024-11-01' existing = {
  parent: aioInstance
  name: 'default'
}

// Pointer to the default data flow profile
resource defaultDataflowProfile 'Microsoft.IoTOperations/instances/dataflowProfiles@2024-11-01' existing = {
  parent: aioInstance
  name: 'default'
}

resource dataflow 'Microsoft.IoTOperations/instances/dataflowProfiles/dataflows@2024-11-01' = {
  // Reference to the parent data flow profile, the default profile in this case
  // Same usage as profileRef in Kubernetes YAML
  parent: defaultDataflowProfile
  name: dataflowName
  extendedLocation: {
    name: customLocation.id
    type: 'CustomLocation'
  }
  properties: {
    mode: 'Enabled'
    operations: [
      {
        operationType: 'Source'
        sourceSettings: {
          // Use the default MQTT endpoint as the source
          endpointRef: defaultDataflowEndpoint.name
          // Filter the data from the MQTT topic azure-iot-operations/data/thermostat
          dataSources: [
            'azure-iot-operations/data/thermostat'
          ]
        }
      }
      // Transformation optional
      {
        operationType: 'BuiltInTransformation'
        builtInTransformationSettings: {
          // Filter the data where temperature * "Tag 10" < 100000
          filter: [
            {
              inputs: [
                'temperature.Value'
                '"Tag 10".Value'
              ]
              expression: '$1 * $2 < 100000'
            }
          ]
          map: [
            // Passthrough all values by default
            {
              inputs: [
                '*'
              ]
              output: '*'
            }
            // Convert temperature to Fahrenheit and output it to TemperatureF
            {
              inputs: [
                'temperature.Value'
              ]
              output: 'TemperatureF'
              expression: 'cToF($1)'
            }
          // Extract the "Tag 10" value and output it to Humidity
            {
              inputs: [
                '"Tag 10".Value'
              ]
              output: 'Humidity'
            }
          ]
        }
      }
      {
        operationType: 'Destination'
        destinationSettings: {
          // Use the default MQTT endpoint as the destination
          endpointRef: defaultDataflowEndpoint.name
          // Send the data to the MQTT topic factory
          dataDestination: 'factory'
        }
      }
    ]
  }
}

apiVersion: connectivity.iotoperations.azure.com/v1
kind: Dataflow
metadata:
  name: my-dataflow
  namespace: azure-iot-operations
spec:
  # Reference to the default data flow profile
  profileRef: default
  mode: Enabled
  operations:
    - operationType: Source
      sourceSettings:
        # Use the default MQTT endpoint as the source
        endpointRef: default
        # Filter the data from the MQTT topic azure-iot-operations/data/thermostat
        dataSources:
          - azure-iot-operations/data/thermostat
    # Transformation optional
    - operationType: builtInTransformation
      builtInTransformationSettings:
        # Filter the data where temperature * "Tag 10" < 100000
        filter:
          - inputs:
              - 'temperature.Value'
              - '"Tag 10".Value'
            expression: '$1 * $2 < 100000'
        map:
          # Passthrough all values by default
          - inputs:
              - '*'
            output: '*'
          # Convert temperature to Fahrenheit and output it to TemperatureF
          - inputs:
              - temperature.Value
            output: TemperatureF
            expression: cToF($1)
          # Extract the "Tag 10" value and output it to Humidity
          - inputs:
              - '"Tag 10".Value'
            output: 'Humidity'
    - operationType: Destination
      destinationSettings:
        # Use the default MQTT endpoint as the destination
        endpointRef: default
        # Send the data to the MQTT topic factory
        dataDestination: factory

Дополнительные примеры конфигураций потока данных см. в статье Azure REST API — поток данных и в руководстве по быстрой настройке Bicep.

Проверка работы потока данных

Следуйте руководству: Двунаправленный мост MQTT в Azure Event Grid, чтобы убедиться, что поток данных работает правильно.

Экспорт конфигурации потока данных

Чтобы экспортировать конфигурацию потока данных, можно воспользоваться инструментом для операций или экспортировать пользовательский ресурс потока данных.

Выберите поток данных, который вы хотите экспортировать, и выберите " Экспорт " на панели инструментов.

Снимок экрана: использование возможностей управления операциями для экспорта потока данных.

kubectl get dataflow my-dataflow -o yaml > my-dataflow.yaml

Правильная конфигурация потока данных

Чтобы убедиться, что поток данных работает должным образом, проверьте следующее:

Конечная точка потока данных MQTT по умолчанию должна использоваться как либо источник, либо назначение.
Профиль потока данных существует и упоминается в конфигурации потока данных.
Источник — это конечная точка MQTT, конечная точка Kafka или ресурс. Конечные точки типа хранилища нельзя использовать в качестве источника.
При использовании Сетки событий в качестве источника число экземпляров профиля потока данных имеет значение 1, так как брокер MQTT сетки событий не поддерживает общие подписки.
При использовании Центров событий в качестве источника каждый концентратор событий в пространстве имен является отдельным разделом Kafka и должен быть указан в качестве источника данных.
Если преобразование используется, оно настроено с правильным синтаксисом, включая надлежащее экранирование специальных символов.
При использовании конечных точек типа хранилища в качестве назначения указывается схема.

Следующие шаги

Примечание. Автор создал эту статью с помощью ИИ. Подробнее

Дополнительные ресурсы

Документация

Обработка и маршрутизация данных с потоками данных - Azure IoT Operations

Сведения о потоках данных и способах обработки и маршрутизации данных в операциях Интернета вещей Azure.
Общие сведения о схемах сообщений - Azure IoT Operations

Узнайте, как реестр схем обрабатывает схемы сообщений для работы с компонентами Операций Интернета вещей Azure, включая потоки данных.
Настройка конечных точек потока данных MQTT в операциях Интернета вещей Azure - Azure IoT Operations

Узнайте, как настроить конечные точки потока данных для источников и назначений MQTT.
Настройка конечных точек потока данных в операциях Интернета вещей Azure - Azure IoT Operations

Настройте конечные точки потока данных для создания точек подключения для источников данных.
Сопоставление данных с помощью потоков данных - Azure IoT Operations

Узнайте о языке сопоставления потоков данных для преобразования данных в операциях Интернета вещей Azure.
Настройка конечных точек потока данных для Azure Data Explorer - Azure IoT Operations

Узнайте, как настроить конечные точки потока данных для Azure Data Explorer в Операциях Интернета вещей Azure.
Преобразование данных с помощью преобразований потока данных - Azure IoT Operations

Сведения о преобразованиях потока данных для преобразования данных в операциях Интернета вещей Azure.
Обзор управления активами - Azure IoT Operations

Общие сведения о концепциях и вариантах, необходимых для управления ресурсами, которые являются частью решения Azure IoT Operations.

Обучение

Схема обучения

Use advance techniques in canvas apps to perform custom updates and optimization - Training

Use advance techniques in canvas apps to perform custom updates and optimization

Фестиваль навыков ИИ

Поделиться через

Настройка потоков данных в операциях Интернета вещей Azure

Предварительные условия

Профиль потока данных

Конечные точки потока данных

Начало работы

Источник

Вариант 1. Использование конечной точки брокера сообщений по умолчанию в качестве источника

Вариант 2. Использование ресурса в качестве источника

Вариант 3. Использование пользовательской конечной точки потока данных MQTT или Kafka в качестве источника

Настроить источники данных (топики MQTT или Kafka)

Темы MQTT

Общие подписки

Темы Kafka

Указание исходной схемы

Преобразование

Обогащение: добавление ссылочных данных

Фильтр: фильтрация данных на основе условия

Карта: перемещение данных из одного поля в другое

Вычислить

Переименовать

Новое свойство

Сериализация данных в соответствии со схемой

Назначение

Настройка назначения данных (раздел, контейнер или таблица)

Пример

Проверка работы потока данных

Экспорт конфигурации потока данных

Правильная конфигурация потока данных

Следующие шаги

Обратная связь

Дополнительные ресурсы