إنشاء تدفقات البيانات في عمليات Azure IoT

2025-06-18

هام

تتضمن هذه الصفحة إرشادات لإدارة مكونات عمليات Azure IoT باستخدام بيانات توزيع Kubernetes، وهي قيد المعاينة. يتم توفير هذه الميزة مع العديد من القيود، ولا يجب استخدامها لأحمال عمل الإنتاج.

للحصول على الشروط القانونية التي تنطبق على ميزات Azure الموجودة في الإصدار التجريبي، أو المعاينة، أو التي لم يتم إصدارها بعد في التوفر العام، راجع شروط الاستخدام التكميلية لمعاينات Microsoft Azure.

تدفق البيانات هو المسار الذي تأخذه البيانات من المصدر إلى الوجهة مع التحويلات الاختيارية. يمكنك تكوين تدفق البيانات عن طريق إنشاء مورد مخصص لتدفق البيانات أو باستخدام واجهة مستخدم ويب تجربة العمليات. يتكون تدفق البيانات من ثلاثة أجزاء: المصدر والتحويل والوجهة.

رسم تخطيطي لتدفق بيانات يوضح التدفق من المصدر إلى التحويل ثم الوجهة.

لتعريف المصدر والوجهة، تحتاج إلى تكوين نقاط نهاية تدفق البيانات. التحويل اختياري ويمكن أن يتضمن عمليات مثل إثراء البيانات وتصفية البيانات وتعيين البيانات إلى حقل آخر.

هام

يجب أن يحتوي كل تدفق بيانات على نقطة النهاية الافتراضية لوسيط MQTT المحلي لعمليات Azure IoT كمصدر أو وجهة.

يمكنك استخدام تجربة العمليات في عمليات Azure IoT لإنشاء تدفق بيانات. توفر تجربة العمليات واجهة مرئية لتكوين تدفق البيانات. يمكنك أيضا استخدام Bicep لإنشاء تدفق بيانات باستخدام ملف Bicep، أو استخدام Kubernetes لإنشاء تدفق بيانات باستخدام ملف YAML.

تابع القراءة لمعرفة كيفية تكوين المصدر والتحويل والوجهة.

المتطلبات الأساسية

يمكنك نشر تدفقات البيانات بمجرد أن يكون لديك مثيل لعمليات Azure IoT باستخدام ملف تعريف تدفق البيانات الافتراضي ونقطة النهاية. ومع ذلك، قد تحتاج إلى تكوين ملفات تعريف تدفق البيانات ونقاط النهاية لتخصيص تدفق البيانات.

ملف تعريف تدفق البيانات

إذا لم تكن بحاجة إلى إعدادات تحجيم مختلفة لتدفقات البيانات، فاستخدم ملف تعريف تدفق البيانات الافتراضي الذي توفره عمليات Azure IoT. يجب تجنب ربط عدد كبير جدا من تدفقات البيانات بملف تعريف تدفق بيانات واحد. إذا كان لديك عدد كبير من تدفقات البيانات، فقم بتوزيعها عبر ملفات تعريف تدفق بيانات متعددة لتقليل مخاطر تجاوز حد حجم تكوين ملف تعريف تدفق البيانات.

لمعرفة كيفية تكوين ملف تعريف تدفق بيانات جديد، راجع تكوين ملفات تعريف تدفق البيانات.

نقاط نهاية تدفق البيانات

نقاط نهاية تدفق البيانات مطلوبة لتكوين المصدر والوجهة لتدفق البيانات. للبدء بسرعة، يمكنك استخدام نقطة نهاية تدفق البيانات الافتراضية لوسيط MQTT المحلي. يمكنك أيضا إنشاء أنواع أخرى من نقاط نهاية تدفق البيانات مثل Kafka أو Event Hubs أو Azure Data Lake Storage. لمعرفة كيفية تكوين كل نوع من نقاط نهاية تدفق البيانات، راجع تكوين نقاط نهاية تدفق البيانات.

الشروع في العمل

بمجرد أن يكون لديك المتطلبات الأساسية، يمكنك البدء في إنشاء تدفق بيانات.

لإنشاء تدفق بيانات في تجربة العمليات، حدد > البيانات.
حدد اسم العنصر النائب new-data-flow لتعيين خصائص تدفق البيانات. أدخل اسم تدفق البيانات واختر ملف تعريف تدفق البيانات لاستخدامه. يتم تحديد ملف تعريف تدفق البيانات الافتراضي بشكل افتراضي. لمزيد من المعلومات حول ملفات تعريف تدفق البيانات، راجع تكوين ملف تعريف تدفق البيانات.

هام

يمكنك فقط اختيار ملف تعريف تدفق البيانات عند إنشاء تدفق بيانات. لا يمكنك تغيير ملف تعريف تدفق البيانات بعد إنشاء تدفق البيانات. إذا كنت ترغب في تغيير ملف تعريف تدفق البيانات لتدفق بيانات موجود، فاحذف تدفق البيانات الأصلي وأنشئ تدفقا جديدا بملف تعريف تدفق البيانات الجديد.
قم بتكوين نقطة النهاية المصدر والتحويل والوجهة لتدفق البيانات عن طريق تحديد العناصر في الرسم التخطيطي لتدفق البيانات.

استخدم الأمر az iot ops dataflow apply لإنشاء تدفق بيانات أو تغييره.

az iot ops dataflow apply --resource-group <ResourceGroupName> --instance <AioInstanceName> --profile <DataflowProfileName> --name <DataflowName> --config-file <ConfigFilePathAndName>

--config-file المعلمة هي المسار واسم الملف لملف تكوين JSON الذي يحتوي على خصائص المورد.

في هذا المثال، افترض ملف تكوين يسمى data-flow.json بالمحتوى التالي المخزن في الدليل الرئيسي للمستخدم:

{
    "mode": "Enabled",
    "operations": [
        {
            "operationType": "Source",
            "sourceSettings": {
                // See source configuration section
            }
        },
        {
            "operationType": "BuiltInTransformation",
            "builtInTransformationSettings": {
                // See transformation configuration section
            }
        },
        {
            "operationType": "Destination",
            "destinationSettings": {
                // See destination configuration section
            }
        }
    ]
}

فيما يلي مثال على الأمر لإنشاء تدفق بيانات أو تحديثه باستخدام ملف تعريف تدفق البيانات الافتراضي:

az iot ops dataflow apply --resource-group myResourceGroup --instance myAioInstance --profile default --name data-flow --config-file ~/data-flow.json

إنشاء ملف Bicep .bicep لبدء إنشاء تدفق بيانات. يوضح هذا المثال بنية تدفق البيانات التي تحتوي على تكوينات المصدر والتحويل والوجهة.

param aioInstanceName string = '<AIO_INSTANCE_NAME>'
param customLocationName string = '<CUSTOM_LOCATION_NAME>'
param dataflowName string = '<DATAFLOW_NAME>'

resource aioInstance 'Microsoft.IoTOperations/instances@2024-11-01' existing = {
  name: aioInstanceName
}

resource customLocation 'Microsoft.ExtendedLocation/customLocations@2021-08-31-preview' existing = {
  name: customLocationName
}

resource defaultDataflowEndpoint 'Microsoft.IoTOperations/instances/dataflowEndpoints@2024-11-01' existing = {
  parent: aioInstance
  name: 'default'
}

// Pointer to the default data flow profile
resource defaultDataflowProfile 'Microsoft.IoTOperations/instances/dataflowProfiles@2024-11-01' existing = {
  parent: aioInstance
  name: 'default'
}

resource dataflow 'Microsoft.IoTOperations/instances/dataflowProfiles/dataflows@2024-11-01' = {
  // Reference to the parent data flow profile, the default profile in this case
  // Same usage as profileRef in Kubernetes YAML
  parent: defaultDataflowProfile
  name: dataflowName
  extendedLocation: {
    name: customLocation.id
    type: 'CustomLocation'
  }
  properties: {
    mode: 'Enabled'
    operations: [
      {
        operationType: 'Source'
        sourceSettings: {
          // See source configuration section
        }
      }
      // Transformation optional
      {
        operationType: 'BuiltInTransformation'
        builtInTransformationSettings: {
          // See transformation configuration section
        }
      }
      {
        operationType: 'Destination'
        destinationSettings: {
          // See destination configuration section
        }
      }
    ]
  }
}

إنشاء ملف بيان .yaml Kubernetes لبدء إنشاء تدفق بيانات. يوضح هذا المثال بنية تدفق البيانات التي تحتوي على تكوينات المصدر والتحويل والوجهة.

apiVersion: connectivity.iotoperations.azure.com/v1
kind: Dataflow
metadata:
  name: <DATAFLOW_NAME>
  namespace: azure-iot-operations
spec:
  # Reference to the default data flow profile
  # This field is required when configuring via Kubernetes YAML
  # The syntax is different when using Bicep
  profileRef: default 
  mode: Enabled
  operations:
    - operationType: Source
      sourceSettings:
        # See source configuration section
      # Transformation optional
    - operationType: BuiltInTransformation
      builtInTransformationSettings:
        # See transformation configuration section
    - operationType: Destination
      destinationSettings:
        # See destination configuration section

راجع الأقسام التالية لمعرفة كيفية تكوين أنواع عمليات تدفق البيانات.

المصدر

لتكوين مصدر لتدفق البيانات، حدد مرجع نقطة النهاية وقائمة بمصادر البيانات لنقطة النهاية. اختر أحد الخيارات التالية كمصدر لتدفق البيانات.

إذا لم يتم استخدام نقطة النهاية الافتراضية كمصدر، فيجب استخدامها كوجهة. لمعرفة المزيد حول استخدام نقطة نهاية وسيط MQTT المحلية، راجع يجب أن تستخدم تدفقات البيانات نقطة نهاية وسيط MQTT المحلية.

الخيار 1: استخدام نقطة نهاية وسيط الرسائل الافتراضية كمصدر

ضمن Source details، حدد Message broker.

أدخل الإعدادات التالية لمصدر وسيط الرسائل:

الإعدادات	‏‏الوصف
نقطة نهاية تدفق البيانات	حدد default لاستخدام نقطة نهاية وسيط رسائل MQTT الافتراضية.
الموضوع	عامل تصفية الموضوع للاشتراك فيه للرسائل الواردة. استخدام الموضوع (المواضيع)> إضافة صف لإضافة مواضيع متعددة. لمزيد من المعلومات حول الموضوعات، راجع تكوين مواضيع MQTT أو Kafka.
مخطط الرسائل	المخطط الذي يجب استخدامه لإلغاء تسلسل الرسائل الواردة. راجع تحديد مخطط لإلغاء تسلسل البيانات.

حدد تطبيق.

فيما يلي مثال لتكوين نقطة نهاية المصدر لنقطة نهاية وسيط MQTT الافتراضية:

{
  "operationType": "Source",
  "sourceSettings": {
    "endpointRef": "default",
    "dataSources": [
      "thermostats/+/sensor/temperature/#",
      "humidifiers/+/sensor/humidity/#"
    ],
    "endpointRef": "default"
  }
}

يتم تكوين نقطة نهاية وسيط الرسائل في ملف Bicep. على سبيل المثال، نقطة النهاية التالية هي مصدر لتدفق البيانات.

sourceSettings: {
  endpointRef: 'default'
  dataSources: [
    'thermostats/+/sensor/temperature/#'
    'humidifiers/+/sensor/humidity/#'
  ]
}

على سبيل المثال، لتكوين مصدر باستخدام نقطة نهاية وسيط رسالة واثنين من عوامل تصفية الموضوع، استخدم التكوين التالي:

sourceSettings:
  endpointRef: default
  dataSources:
    - thermostats/+/sensor/temperature/#
    - humidifiers/+/sensor/humidity/#

لأنه dataSources يسمح لك بتحديد مواضيع MQTT أو Kafka دون تعديل تكوين نقطة النهاية، يمكنك إعادة استخدام نقطة النهاية لتدفقات بيانات متعددة حتى إذا كانت الموضوعات مختلفة. لمعرفة المزيد، راجع تكوين مصادر البيانات.

الخيار 2: استخدام الأصل كمصدر

يمكنك استخدام أصل كمصدر لتدفق البيانات. لا يتوفر استخدام أحد الأصول كمصدر إلا في تجربة العمليات.

ضمن Source details، حدد Asset.
حدد الأصل الذي تريد استخدامه كنقطة نهاية المصدر.
حدد Proceed.

يتم عرض قائمة بنقاط البيانات للأصل المحدد.
حدد Apply لاستخدام الأصل كنقطة نهاية المصدر.

عند استخدام أصل كمصدر، يتم استخدام تعريف الأصل للاستدلال على مخطط تدفق البيانات. يتضمن تعريف الأصل مخطط نقاط بيانات الأصل. لمعرفة المزيد، راجع إدارة تكوينات الأصول عن بعد.

بمجرد التكوين، تصل البيانات من الأصل إلى تدفق البيانات عبر وسيط MQTT المحلي. لذلك، عند استخدام أصل كمصدر، يستخدم تدفق البيانات نقطة النهاية الافتراضية ل وسيط MQTT المحلي كمصدر في الواقع.

الخيار 3: استخدام نقطة نهاية تدفق بيانات MQTT أو Kafka المخصصة كمصدر

إذا قمت بإنشاء نقطة نهاية تدفق بيانات MQTT أو Kafka مخصصة (على سبيل المثال، لاستخدامها مع Event Grid أو Event Hubs)، يمكنك استخدامها كمصدر لتدفق البيانات. تذكر أنه لا يمكن استخدام نقاط نهاية نوع التخزين، مثل Data Lake أو Fabric OneLake، كمصدر.

ضمن Source details، حدد Message broker.

أدخل الإعدادات التالية لمصدر وسيط الرسائل:

الإعدادات	‏‏الوصف
نقطة نهاية تدفق البيانات	استخدم الزر Reselect لتحديد نقطة نهاية تدفق بيانات MQTT أو Kafka مخصصة. لمزيد من المعلومات، راجع تكوين نقاط نهاية تدفق بيانات MQTT أو تكوين مراكز أحداث Azure ونقاط نهاية تدفق بيانات Kafka.
الموضوع	عامل تصفية الموضوع للاشتراك فيه للرسائل الواردة. استخدام الموضوع (المواضيع)> إضافة صف لإضافة مواضيع متعددة. لمزيد من المعلومات حول الموضوعات، راجع تكوين مواضيع MQTT أو Kafka.
مخطط الرسائل	المخطط الذي يجب استخدامه لإلغاء تسلسل الرسائل الواردة. راجع تحديد مخطط لإلغاء تسلسل البيانات.

حدد تطبيق.

استبدل قيم العنصر النائب باسم نقطة النهاية المخصصة والموضوعات.

{
    "operationType": "Source",
    "sourceSettings": {
        "endpointRef": "<CUSTOM_ENDPOINT_NAME>",
        "dataSources": [
            "<TOPIC_1>",
            "<TOPIC_2>"
        ]
    }
}

استبدل قيم العنصر النائب باسم نقطة النهاية المخصصة والموضوعات.

sourceSettings: {
  endpointRef: '<CUSTOM_ENDPOINT_NAME>'
  dataSources: [
    '<TOPIC_1>'
    '<TOPIC_2>'
    // See section on configuring MQTT or Kafka topics for more information
  ]
}

استبدل قيم العنصر النائب باسم نقطة النهاية المخصصة والموضوعات.

sourceSettings:
  endpointRef: <CUSTOM_ENDPOINT_NAME>
  dataSources:
  - <TOPIC_1>
  - <TOPIC_2>
  # See section on configuring MQTT or Kafka topics for more information

تكوين مصادر البيانات (موضوعات MQTT أو Kafka)

يمكنك تحديد مواضيع MQTT أو Kafka متعددة في مصدر دون الحاجة إلى تعديل تكوين نقطة نهاية تدفق البيانات. تعني هذه المرونة أنه يمكن إعادة استخدام نفس نقطة النهاية عبر تدفقات بيانات متعددة، حتى إذا كانت الموضوعات تختلف. لمزيد من المعلومات، راجع إعادة استخدام نقاط نهاية تدفق البيانات.

موضوعات MQTT

عندما يكون المصدر نقطة نهاية MQTT (مضمنة في شبكة الأحداث)، يمكنك استخدام عامل تصفية موضوع MQTT للاشتراك في الرسائل الواردة. يمكن أن يتضمن عامل تصفية الموضوع أحرف بدل للاشتراك في مواضيع متعددة. على سبيل المثال، thermostats/+/sensor/temperature/# يشترك في جميع رسائل مستشعر درجة الحرارة من منظمات الحرارة. لتكوين عوامل تصفية موضوع MQTT:

في تفاصيل مصدر تدفق البيانات لتجربة العمليات، حدد وسيط الرسائل، ثم استخدم حقل الموضوع (المواضيع) لتحديد عوامل تصفية موضوع MQTT للاشتراك فيها للرسائل الواردة. يمكنك إضافة مواضيع MQTT متعددة عن طريق تحديد إضافة صف وإدخال موضوع جديد.

{
    "operationType": "Source",
    "sourceSettings": {
        "endpointRef": "<MESSAGE_BROKER_ENDPOINT_NAME>",
        "dataSources": [
            "<TOPIC_FILTER_1>",
            "<TOPIC_FILTER_2>"
            // Add more topic filters as needed
        ]
    }
}

مثال مع عوامل تصفية موضوع MQTT متعددة مع أحرف البدل:

{
    "operationType": "Source",
    "sourceSettings": {
        "endpointRef": "default",
        "dataSources": [
            "thermostats/+/sensor/temperature/#",
            "humidifiers/+/sensor/humidity/#"
        ]
    }
}

هنا، يتم استخدام حرف + البدل لتحديد جميع الأجهزة ضمن thermostats المواضيع و humidifiers . # يتم استخدام حرف البدل لتحديد جميع رسائل الاستشعار ضمن جميع المواضيع الفرعية للمواضيع temperature وhumidity.

sourceSettings: {
  endpointRef: '<MESSAGE_BROKER_ENDPOINT_NAME>'
  dataSources: [
    '<TOPIC_FILTER_1>'
    '<TOPIC_FILTER_2>'
    // Add more topic filters as needed
  ]
}

مثال مع عوامل تصفية موضوع MQTT متعددة مع أحرف البدل:

sourceSettings: {
  endpointRef: 'default'
  dataSources: [
    'thermostats/+/sensor/temperature/#'
    'humidifiers/+/sensor/humidity/#'
  ]
}

sourceSettings:
  endpointRef: <ENDPOINT_NAME>
  dataSources:
    - <TOPIC_FILTER_1>
    - <TOPIC_FILTER_2>
    # Add more topic filters as needed

مثال مع عوامل تصفية مواضيع متعددة مع أحرف البدل:

sourceSettings:
  endpointRef: default
  dataSources:
    - thermostats/+/sensor/temperature/#
    - humidifiers/+/sensor/humidity/#

هنا، يتم استخدام حرف + البدل لتحديد جميع الأجهزة ضمن thermostats المواضيع و humidifiers . # يتم استخدام حرف البدل لتحديد كافة الرسائل ضمن كافة المواضيع الفرعية للمواضيع temperature وhumidity.

الاشتراكات المشتركة

لاستخدام الاشتراكات المشتركة مع مصادر وسيط الرسائل، يمكنك تحديد موضوع الاشتراك المشترك في شكل $shared/<GROUP_NAME>/<TOPIC_FILTER>.

في تجربة العمليات تفاصيل مصدر تدفق البيانات، حدد وسيط الرسالة واستخدم حقل الموضوع لتحديد مجموعة الاشتراك المشترك والموضوع.

{
  "operationType": "Source",
  "sourceSettings": {
    "dataSources": [
      "$shared/<GROUP_NAME>/<TOPIC_FILTER>"
    ]
  }
}

sourceSettings: {
  dataSources: [
    '$shared/<GROUP_NAME>/<TOPIC_FILTER>'
  ]
}

sourceSettings:
  dataSources:
    - $shared/<GROUP_NAME>/<TOPIC_FILTER>

إذا كان عدد المثيلات في ملف تعريف تدفق البيانات أكبر من واحد، يتم تمكين الاشتراك المشترك تلقائيا لجميع تدفقات البيانات التي تستخدم مصدر وسيط الرسائل. في هذه الحالة، تتم إضافة البادئة $shared ويتم إنشاء اسم مجموعة الاشتراك المشترك تلقائيا. على سبيل المثال، إذا كان لديك ملف تعريف تدفق بيانات مع عدد مثيلات 3، ويستخدم تدفق البيانات نقطة نهاية وسيط رسالة كمصدر تم تكوينه مع الموضوعات topic1 و topic2، يتم تحويلها تلقائيا إلى اشتراكات مشتركة ك $shared/<GENERATED_GROUP_NAME>/topic1 و $shared/<GENERATED_GROUP_NAME>/topic2.

يمكنك إنشاء موضوع مسمى $shared/mygroup/topic في التكوين بشكل صريح. ومع ذلك، لا يوصى بإضافة $shared الموضوع بشكل صريح نظرا لإضافة البادئة $shared تلقائيا عند الحاجة. يمكن أن تجري تدفقات البيانات تحسينات مع اسم المجموعة إذا لم يتم تعيينها. على سبيل المثال، $share لم يتم تعيين وتدفقات البيانات يجب أن تعمل فقط عبر اسم الموضوع.

هام

تدفقات البيانات التي تتطلب اشتراكا مشتركا عندما يكون عدد المثيلات أكبر من واحد مهم عند استخدام وسيط MQTT لشبكة الأحداث كمصدر لأنه لا يدعم الاشتراكات المشتركة. لتجنب فقدان الرسائل، قم بتعيين عدد مثيلات ملف تعريف تدفق البيانات إلى واحد عند استخدام وسيط MQTT لشبكة الأحداث كمصدر. وذلك عندما يكون تدفق البيانات هو المشترك ويتلقى الرسائل من السحابة.

موضوعات Kafka

عندما يكون المصدر نقطة نهاية Kafka (مضمنة في مراكز الأحداث)، حدد مواضيع Kafka الفردية للاشتراك فيها للرسائل الواردة. أحرف البدل غير معتمدة، لذلك يجب تحديد كل موضوع بشكل ثابت.

إشعار

عند استخدام مراكز الأحداث عبر نقطة نهاية Kafka، يكون كل مركز أحداث فردي داخل مساحة الاسم هو موضوع Kafka. على سبيل المثال، إذا كان لديك مساحة اسم لمراكز الأحداث مع مركزي أحداث، وthermostats، humidifiers يمكنك تحديد كل مركز أحداث كموضوع Kafka.

لتكوين مواضيع Kafka:

في تفاصيل مصدر تدفق البيانات لتجربة العمليات، حدد وسيط الرسائل، ثم استخدم حقل الموضوع لتحديد عامل تصفية موضوع Kafka للاشتراك فيه للرسائل الواردة.

إشعار

يمكن تحديد عامل تصفية موضوع واحد فقط في تجربة العمليات. لاستخدام عوامل تصفية مواضيع متعددة، استخدم Bicep أو Kubernetes.

{
  "operationType": "Source",
  "sourceSettings": {
    "endpointRef": "<KAFKA_ENDPOINT_NAME>",
    "dataSources": [
      "<KAFKA_TOPIC_1>",
      "<KAFKA_TOPIC_2>"
      // Add more Kafka topics as needed
    ]
  }
}

sourceSettings: {
  endpointRef: '<KAFKA_ENDPOINT_NAME>'
  dataSources: [
    '<KAFKA_TOPIC_1>'
    '<KAFKA_TOPIC_2>'
    // Add more Kafka topics as needed
  ]
}

sourceSettings:
  endpointRef: <KAFKA_ENDPOINT_NAME>
  dataSources:
    - <KAFKA_TOPIC_1>
    - <KAFKA_TOPIC_2>
    # Add more Kafka topics as needed

تحديد مخطط المصدر

عند استخدام MQTT أو Kafka كمصدر، يمكنك تحديد مخطط لعرض قائمة نقاط البيانات في واجهة مستخدم الويب لتجربة العمليات. استخدام مخطط لإلغاء تسلسل الرسائل الواردة والتحقق من صحتها غير مدعوم حاليا.

إذا كان المصدر أحد الأصول، يتم استنتاج المخطط تلقائيا من تعريف الأصل.

تلميح

لإنشاء المخطط من نموذج ملف بيانات، استخدم Schema Gen Helper.

لتكوين المخطط المستخدم لإلغاء تسلسل الرسائل الواردة من مصدر:

في العمليات تجربة تفاصيل مصدر تدفق البيانات، حدد وسيط الرسالة واستخدم حقل مخطط الرسالة لتحديد المخطط. يمكنك استخدام الزر Upload لتحميل ملف مخطط أولا. لمعرفة المزيد، راجع فهم مخططات الرسائل.

{
  "operationType": "Source",
  "sourceSettings": {
    "endpointRef": "<ENDPOINT_NAME>",
    "serializationFormat": "Json",
    "schemaRef": "aio-sr://<SCHEMA_NAMESPACE>/<SCHEMA_NAME>:<VERSION>"
  }
}

بمجرد استخدام سجل المخطط لتخزين المخطط، يمكنك الرجوع إليه في تكوين تدفق البيانات.

sourceSettings: {
  serializationFormat: 'Json'
  schemaRef: 'aio-sr://<SCHEMA_NAMESPACE>/<SCHEMA_NAME>:<VERSION>'
}

بمجرد استخدام سجل المخطط لتخزين المخطط، يمكنك الرجوع إليه في تكوين تدفق البيانات.

sourceSettings:
  serializationFormat: Json
  schemaRef: 'aio-sr://<SCHEMA_NAMESPACE>/<SCHEMA_NAME>:<VERSION>'

لمعرفة المزيد، راجع فهم مخططات الرسائل.

التحويل

عملية التحويل هي المكان الذي يمكنك فيه تحويل البيانات من المصدر قبل إرسالها إلى الوجهة. التحويلات اختيارية. إذا لم تكن بحاجة إلى إجراء تغييرات على البيانات، فلا تقم بتضمين عملية التحويل في تكوين تدفق البيانات. يتم ربط تحويلات متعددة معا على مراحل بغض النظر عن الترتيب الذي يتم تحديدها به في التكوين. ترتيب المراحل هو دائما:

إثراء: إضافة بيانات إضافية إلى البيانات المصدر نظرا لمجموعة بيانات وشرط لمطابقتها.
عامل التصفية: تصفية البيانات استنادا إلى شرط.
تعيين خاصية جديدة أو حسابها أو إعادة تسميتها أو إضافتها: نقل البيانات من حقل إلى آخر مع تحويل اختياري.

هذا القسم هو مقدمة لتحويلات تدفق البيانات. لمزيد من المعلومات التفصيلية، راجع تعيين البيانات باستخدام تدفقات البيانات، وتحويل البيانات باستخدام تحويلات تدفق البيانات، وإثراء البيانات باستخدام تدفقات البيانات.

في تجربة العمليات، حدد Data flow>Add transform (اختياري) .

لقطة شاشة لواجهة تجربة العمليات التي تعرض إضافة مرحلة تحويل إلى تدفق البيانات.

{
  "operationType": "BuiltInTransformation",
  "builtInTransformationSettings": {
    "datasets": [
      // See section on enriching data
    ],
    "filter": [
      // See section on filtering data
    ],
    "map": [
      // See section on mapping data
    ]
  }
}

builtInTransformationSettings: {
  datasets: [
    // See section on enriching data
  ]
  filter: [
    // See section on filtering data
  ]
  map: [
    // See section on mapping data
  ]
}

builtInTransformationSettings:
  datasets:
    # See section on enriching data
  filter:
    # See section on filtering data
  map:
    # See section on mapping data

إثراء: إضافة بيانات مرجعية

لإثراء البيانات، أضف أولا مجموعة بيانات مرجعية في مخزن حالة عمليات Azure IoT. يتم استخدام مجموعة البيانات لإضافة بيانات إضافية إلى بيانات المصدر استنادا إلى شرط. يتم تحديد الشرط ك حقل في البيانات المصدر التي تطابق حقلا في مجموعة البيانات.

يمكنك تحميل بيانات نموذجية في مخزن الحالة باستخدام CLI لمخزن الولاية. تتوافق الأسماء الرئيسية في مخزن الحالة مع مجموعة بيانات في تكوين تدفق البيانات.

حاليا، مرحلة الإثراء غير مدعومة في تجربة العمليات.

لإثراء البيانات، يمكنك استخدام الخاصية builtInTransformationSettings في تكوين تدفق البيانات. datasets يتم استخدام الخاصية لتحديد مجموعات البيانات لاستخدامها للإثراء.

{
  "operationType": "BuiltInTransformation",
  "builtInTransformationSettings": {
    "datasets": [
      {
        "key": "<DATASET_KEY>",
        "inputs": [
          "$source.<SOURCE_FIELD>" // ---------------- $1
          "$context(<DATASET_KEY>).<DATASET_FIELD>" // - $2
        ],
        "expression": "$1 == $2"
      }
    ]
  }
}

يوضح هذا المثال كيف يمكنك استخدام الحقل في deviceId البيانات المصدر لمطابقة asset الحقل في مجموعة البيانات:

builtInTransformationSettings: {
  datasets: [
    {
      key: 'assetDataset'
      inputs: [
        '$source.deviceId' // ---------------- $1
        '$context(assetDataset).asset' // ---- $2
      ]
      expression: '$1 == $2'
    }
  ]
}

على سبيل المثال، يمكنك استخدام deviceId الحقل في البيانات المصدر لمطابقة asset الحقل في مجموعة البيانات:

builtInTransformationSettings:
  datasets:
  - key: assetDataset
    inputs:
      - $source.deviceId # ------------- $1
      - $context(assetDataset).asset # - $2
    expression: $1 == $2

إذا كانت مجموعة البيانات تحتوي على سجل مع asset الحقل، على غرار:

{
  "asset": "thermostat1",
  "location": "room1",
  "manufacturer": "Contoso"
}

تحتوي البيانات من المصدر مع deviceId مطابقة thermostat1 الحقل على location الحقلين و manufacturer المتوفرين في مرحلتي التصفية والخريطة.

لمزيد من المعلومات حول بناء جملة الشرط، راجع إثراء البيانات باستخدام تدفقات البيانات وتحويل البيانات باستخدام تدفقات البيانات.

عامل التصفية: تصفية البيانات استنادا إلى شرط

لتصفية البيانات على شرط، يمكنك استخدام filter المرحلة. يتم تحديد الشرط ك حقل في البيانات المصدر التي تطابق قيمة.

ضمن Transform (اختياري)، حدد Filter>Add.

أدخل الإعدادات المطلوبة.

الإعدادات	‏‏الوصف
شرط عامل التصفية	شرط تصفية البيانات استنادا إلى حقل في البيانات المصدر.
‏‏الوصف	توفير وصف لحالة عامل التصفية.

في حقل شرط عامل التصفية، أدخل @ أو حدد Ctrl + مسافة لاختيار نقاط البيانات من القائمة المنسدلة.

يمكنك إدخال خصائص بيانات تعريف MQTT باستخدام التنسيق @$metadata.user_properties.<property> أو @$metadata.topic. يمكنك أيضا إدخال $metadata الرؤوس باستخدام التنسيق @$metadata.<header>. $metadata بناء الجملة مطلوب فقط لخصائص MQTT التي تعد جزءا من رأس الرسالة. لمزيد من المعلومات، راجع مراجع الحقول.

يمكن للشرط استخدام الحقول في البيانات المصدر. على سبيل المثال، يمكنك استخدام شرط عامل تصفية مثل @temperature > 20 تصفية البيانات الأقل من أو تساوي 20 استنادا إلى حقل درجة الحرارة.

حدد تطبيق.

على سبيل المثال، يمكنك استخدام temperature الحقل في البيانات المصدر لتصفية البيانات:

{
  "operationType": "BuiltInTransformation",
  "builtInTransformationSettings": {
    "filter": [
      {
        "inputs": [
          "$source.temperature ? $last" // ---------------- $1
        ],
        "expression": "$1 > 20"
      }
    ]
  }
}

على سبيل المثال، يمكنك استخدام temperature الحقل في البيانات المصدر لتصفية البيانات:

builtInTransformationSettings: {
  filter: [
    {
      inputs: [
        'temperature ? $last'
      ]
      expression: '$1 > 20'
    }
  ]
}

temperature إذا كان الحقل أكبر من 20، يتم تمرير البيانات إلى المرحلة التالية. temperature إذا كان الحقل أقل من أو يساوي 20، تتم تصفية البيانات.

على سبيل المثال، يمكنك استخدام temperature الحقل في البيانات المصدر لتصفية البيانات:

builtInTransformationSettings:
  filter:
    - inputs:
      - temperature ? $last # - $1
      expression: "$1 > 20"

الخريطة: نقل البيانات من حقل إلى آخر

لتعيين البيانات إلى حقل آخر مع تحويل اختياري، يمكنك استخدام map العملية. يتم تحديد التحويل كصيغة تستخدم الحقول في البيانات المصدر.

في تجربة العمليات، يتم دعم التعيين حاليا باستخدام تحويلات الحوسبة وإعادة التسمية والخصائص الجديدة.

حسب

يمكنك استخدام تحويل الحساب لتطبيق صيغة على البيانات المصدر. يتم استخدام هذه العملية لتطبيق صيغة على البيانات المصدر وتخزين حقل النتيجة.

ضمن Transform (اختياري) ، حدد Compute>Add.

أدخل الإعدادات المطلوبة.

الإعدادات	‏‏الوصف
تحديد صيغة	اختر صيغة موجودة من القائمة المنسدلة أو حدد مخصص لإدخال صيغة يدويا.
المخرجات	حدد اسم عرض الإخراج للنتيجة.
الصيغة	أدخل الصيغة التي سيتم تطبيقها على البيانات المصدر.
‏‏الوصف	توفير وصف للتحويل.
القيمة الأخيرة المعروفة	اختياريا، استخدم آخر قيمة معروفة إذا لم تكن القيمة الحالية متوفرة.

يمكنك إدخال صيغة أو تحريرها في حقل الصيغة. يمكن للصيغة استخدام الحقول في البيانات المصدر. أدخل @ أو حدد Ctrl + مسافة لاختيار نقاط البيانات من القائمة المنسدلة. بالنسبة للصيغ المضمنة، حدد <dataflow> العنصر النائب لمشاهدة قائمة نقاط البيانات المتوفرة.

يمكن للصيغة استخدام الحقول في البيانات المصدر. على سبيل المثال، يمكنك استخدام temperature الحقل في البيانات المصدر لتحويل درجة الحرارة إلى درجة مئوية وتخزينها في temperatureCelsius حقل الإخراج.

حدد تطبيق.

إعادة تسمية

يمكنك إعادة تسمية نقطة بيانات باستخدام تحويل إعادة تسمية . يتم استخدام هذه العملية لإعادة تسمية نقطة بيانات في البيانات المصدر باسم جديد. يمكن استخدام الاسم الجديد في المراحل اللاحقة من تدفق البيانات.

ضمن Transform (اختياري)، حدد Rename>Add.

أدخل الإعدادات المطلوبة.

الإعدادات	‏‏الوصف
نقطة البيانات	حدد نقطة بيانات من القائمة المنسدلة أو أدخل عنوان $metadata.
اسم نقطة بيانات جديدة	أدخل الاسم الجديد لنقطة البيانات.
‏‏الوصف	توفير وصف للتحويل.

حدد تطبيق.

خاصية جديدة

يمكنك إضافة خاصية جديدة إلى البيانات المصدر باستخدام تحويل الخاصية New. يتم استخدام هذه العملية لإضافة خاصية جديدة إلى البيانات المصدر. يمكن استخدام الخاصية الجديدة في المراحل اللاحقة من تدفق البيانات.

ضمن Transform (اختياري) ، حدد New property>Add.

أدخل الإعدادات المطلوبة.

الإعدادات	‏‏الوصف
مفتاح الخاصية	أدخل مفتاح الخاصية الجديدة.
قيمة الخاصية	أدخل قيمة الخاصية الجديدة.
‏‏الوصف	توفير وصف للخاصية الجديدة.

حدد تطبيق.

على سبيل المثال، يمكنك استخدام temperature الحقل في البيانات المصدر لتحويل درجة الحرارة إلى درجة مئوية وتخزينها في temperatureCelsius الحقل. يمكنك أيضا إثراء بيانات المصدر بالحقل location من مجموعة بيانات السياق:

{
  "operationType": "BuiltInTransformation",
  "builtInTransformationSettings": {
    "map": [
      {
        "inputs": [
          "$source.temperature ? $last" // ---------------- $1
        ],
        "output": "temperatureCelsius",
        "expression": "($1 - 32) * 5/9"
      },
      {
        "inputs": [
          "$context(assetDataset).location" // - $2
        ],
        "output": "location"
      }
    ]
  }
}

يمكنك الوصول إلى خصائص بيانات تعريف MQTT باستخدام التنسيق $metadata.user_properties.<property> أو $metadata.topic. يمكنك أيضا إدخال $metadata الرؤوس باستخدام التنسيق $metadata.<header>. لمزيد من المعلومات، راجع مراجع الحقول.

builtInTransformationSettings: {
  map: [
    {
      inputs: [
        'temperature'
      ]
      output: 'temperatureCelsius'
      expression: '($1 - 32) * 5/9'
    }
    {
      inputs: [
        '$context(assetDataset).location'
      ]
      output: 'location'
    }
  ]
}

builtInTransformationSettings:
  map:
    - inputs:
      - temperature # - $1
      expression: "($1 - 32) * 5/9"
      output: temperatureCelsius
    - inputs:
      - $context(assetDataset).location  
      output: location

لمعرفة المزيد، راجع تعيين البيانات باستخدام تدفقات البيانات وتحويل البيانات باستخدام تدفقات البيانات.

إزالة

بشكل افتراضي، يتم تضمين جميع نقاط البيانات في مخطط الإخراج. يمكنك إزالة أي نقطة بيانات من الوجهة باستخدام إزالة التحويل.

ضمن Transform (اختياري)، حدد Remove.
حدد نقطة البيانات لإزالتها من مخطط الإخراج.
حدد تطبيق.

لإزالة نقطة بيانات من مخطط الإخراج، يمكنك استخدام الخاصية builtInTransformationSettings في تكوين تدفق البيانات. map يتم استخدام الخاصية لتحديد نقاط البيانات المراد إزالتها.

{
  "operationType": "BuiltInTransformation",
  "builtInTransformationSettings": {
    "map": [
      {
        "inputs": [
          "*"
        ],
        "output": "*"
      },
      {
        "inputs": [
          "weight"
        ],
        "output": ""
      }
      {
          "inputs": [
          "weight.SourceTimestamp"
          ],
          "output": ""
      },
      {
          "inputs": [
          "weight.Value"
          ],
          "output": ""
      },
      {
          "inputs": [
          "weight.StatusCode"
          ],
          "output": ""
      },
      {
          "inputs": [
          "weight.StatusCode.Code"
          ],
          "output": ""
      },
      {
          "inputs": [
          "weight.StatusCode.Symbol"
          ],
          "output": ""
      }
    ]
  }
}

builtInTransformationSettings: {
  map: [
    {
      inputs: [
        '*'
      ]
      output: '*'
    }
    {
      inputs: [
        'weight'
      ]
      output: ''
    }
    {
      inputs: [
        'weight.SourceTimestamp'
      ]
      output: ''
    }
    {
      inputs: [
        'weight.Value'
      ]
      output: ''
    }
    {
      inputs: [
        'weight.StatusCode'
      ]
      output: ''
    }
    {
      inputs: [
        'weight.StatusCode.Code'
      ]
      output: ''
    }
    {
      inputs: [
        'weight.StatusCode.Symbol'
      ]
      output: ''
    }
  ]
}

builtInTransformationSettings:
  map:
    - type: PassThrough
      inputs:
        - "*"
      output: "*"
    - inputs:
        - weight
      output: ""
    - inputs:
        - weight.SourceTimestamp
      output: ""
    - inputs:
        - weight.Value
      output: ""
    - inputs:
        - weight.StatusCode
      output: ""
    - inputs:
        - weight.StatusCode.Code
      output: ""
    - inputs:
        - weight.StatusCode.Symbol
      output: ""

لمعرفة المزيد، راجع تعيين البيانات باستخدام تدفقات البيانات وتحويل البيانات باستخدام تدفقات البيانات.

تسلسل البيانات وفقا لمخطط

إذا كنت تريد تسلسل البيانات قبل إرسالها إلى الوجهة، فستحتاج إلى تحديد تنسيق مخطط وتسلسل. وإلا، يتم تسلسل البيانات في JSON مع الأنواع المستنتجة. تتطلب نقاط نهاية التخزين مثل Microsoft Fabric أو Azure Data Lake مخططا لضمان تناسق البيانات. تنسيقات التسلسل المدعومة هي Parquet و Delta.

تلميح

لإنشاء المخطط من نموذج ملف بيانات، استخدم Schema Gen Helper.

بالنسبة لتجربة العمليات، يمكنك تحديد تنسيق المخطط والتسلسل في تفاصيل نقطة نهاية تدفق البيانات. نقاط النهاية التي تدعم تنسيقات التسلسل هي Microsoft Fabric OneLake وAzure Data Lake Storage Gen 2 وAzure Data Explorer والتخزين المحلي. على سبيل المثال، لتسلسل البيانات بتنسيق Delta، تحتاج إلى تحميل مخطط إلى سجل المخطط والإشارة إليه في تكوين نقطة نهاية وجهة تدفق البيانات.

لقطة شاشة تستخدم تجربة العمليات لتعيين تسلسل نقطة نهاية وجهة تدفق البيانات.

بمجرد تحميل مخطط إلى سجل المخطط، يمكنك الرجوع إليه في تكوين تدفق البيانات.

{
  "builtInTransformationSettings": {
    "serializationFormat": "Delta",
    "schemaRef": "aio-sr://<SCHEMA_NAMESPACE>/<SCHEMA>:<VERSION>"
  }
}

بمجرد تحميل مخطط إلى سجل المخطط، يمكنك الرجوع إليه في تكوين تدفق البيانات.

builtInTransformationSettings: {
  serializationFormat: 'Delta'
  schemaRef: 'aio-sr://<SCHEMA_NAMESPACE>/<SCHEMA>:<VERSION>'
}

بمجرد تحميل مخطط إلى سجل المخطط، يمكنك الرجوع إليه في تكوين تدفق البيانات.

builtInTransformationSettings:
  serializationFormat: Delta
  schemaRef: 'aio-sr://<SCHEMA_NAMESPACE>/<SCHEMA>:<VERSION>'

لمزيد من المعلومات حول سجل المخطط، راجع فهم مخططات الرسائل.

الوجهة

لتكوين وجهة لتدفق البيانات، حدد مرجع نقطة النهاية ووجهة البيانات. يمكنك تحديد قائمة وجهات البيانات لنقطة النهاية.

لإرسال البيانات إلى وجهة أخرى غير وسيط MQTT المحلي، قم بإنشاء نقطة نهاية تدفق البيانات. لمعرفة كيفية إجراء ذلك، راجع تكوين نقاط نهاية تدفق البيانات. إذا لم تكن الوجهة وسيط MQTT المحلي، فيجب استخدامها كمصدر. لمعرفة المزيد حول استخدام نقطة نهاية وسيط MQTT المحلية، راجع يجب أن تستخدم تدفقات البيانات نقطة نهاية وسيط MQTT المحلية.

هام

تتطلب نقاط نهاية التخزين مخططا للتسلسل. لاستخدام تدفق البيانات مع Microsoft Fabric OneLake أو Azure Data Lake Storage أو Azure Data Explorer أو التخزين المحلي، يجب تحديد مرجع مخطط.

حدد نقطة نهاية تدفق البيانات لاستخدامها كوجهة.

تتطلب نقاط نهاية التخزين مخططا للتسلسل. إذا اخترت Microsoft Fabric OneLake أو Azure Data Lake Storage أو Azure Data Explorer أو نقطة نهاية وجهة التخزين المحلي، يجب تحديد مرجع مخطط. على سبيل المثال، لتسلسل البيانات إلى نقطة نهاية Microsoft Fabric بتنسيق Delta، تحتاج إلى تحميل مخطط إلى سجل المخطط والإشارة إليه في تكوين نقطة نهاية وجهة تدفق البيانات.
حدد متابعة لتكوين الوجهة.
أدخل الإعدادات المطلوبة للوجهة، بما في ذلك الموضوع أو الجدول لإرسال البيانات إليه. راجع تكوين وجهة البيانات (موضوع أو حاوية أو جدول) لمزيد من المعلومات.

{
  "destinationSettings": {
    "endpointRef": "<CUSTOM_ENDPOINT_NAME>",
    "dataDestination": "<TOPIC_OR_TABLE>" // See section on configuring data destination
  }
}

destinationSettings: {
  endpointRef: '<CUSTOM_ENDPOINT_NAME>'
  dataDestination: '<TOPIC_OR_TABLE>' // See section on configuring data destination
}

destinationSettings:
  endpointRef: <CUSTOM_ENDPOINT_NAME>
  dataDestination: <TOPIC_OR_TABLE> # See section on configuring data destination

تكوين وجهة البيانات (موضوع أو حاوية أو جدول)

على غرار مصادر البيانات، فإن وجهة البيانات هي مفهوم يستخدم للحفاظ على نقاط نهاية تدفق البيانات قابلة لإعادة الاستخدام عبر تدفقات بيانات متعددة. بشكل أساسي، يمثل الدليل الفرعي في تكوين نقطة نهاية تدفق البيانات. على سبيل المثال، إذا كانت نقطة نهاية تدفق البيانات هي نقطة نهاية تخزين، فإن وجهة البيانات هي الجدول في حساب التخزين. إذا كانت نقطة نهاية تدفق البيانات هي نقطة نهاية Kafka، فإن وجهة البيانات هي موضوع Kafka.

نوع نقطة النهاية	معنى وجهة البيانات	‏‏الوصف
MQTT (أو شبكة الأحداث)	الموضوع	موضوع MQTT حيث يتم إرسال البيانات. يتم دعم الموضوعات الثابتة فقط، ولا توجد أحرف بدل.
Kafka (أو مراكز الأحداث)	الموضوع	موضوع Kafka حيث يتم إرسال البيانات. يتم دعم الموضوعات الثابتة فقط، ولا توجد أحرف بدل. إذا كانت نقطة النهاية عبارة عن مساحة اسم لمراكز الأحداث، فإن وجهة البيانات هي مركز الأحداث الفردي داخل مساحة الاسم.
Azure Data Lake Storage Gen2	الحاوية	الحاوية في حساب التخزين. ليس الجدول.
Microsoft Fabric OneLake	جدول أو مجلد	يتوافق مع نوع المسار المكون لنقطة النهاية.
Azure Data Explorer ‏(Kusto)	جدول	الجدول في قاعدة بيانات Azure Data Explorer.
التخزين المحلي	مجلد	اسم المجلد أو الدليل في تحميل وحدة التخزين الثابتة للتخزين المحلي. عند استخدام Azure Container Storage الذي تم تمكينه بواسطة Azure Arc Cloud Ingest Edge Volumes، يجب أن يتطابق هذا مع `spec.path` المعلمة للوحدة الفرعية التي قمت بإنشائها.

لتكوين وجهة البيانات:

عند استخدام تجربة العمليات، يتم تفسير حقل وجهة البيانات تلقائيا استنادا إلى نوع نقطة النهاية. على سبيل المثال، إذا كانت نقطة نهاية تدفق البيانات هي نقطة نهاية تخزين، فستطالبك صفحة تفاصيل الوجهة بإدخال اسم الحاوية. إذا كانت نقطة نهاية تدفق البيانات هي نقطة نهاية MQTT، فستطالبك صفحة تفاصيل الوجهة بإدخال الموضوع، وهكذا.

لقطة شاشة تعرض تجربة العمليات التي تطالب المستخدم بإدخال موضوع MQTT نظرا لنوع نقطة النهاية.

{
  "destinationSettings": {
    "endpointRef": "<CUSTOM_ENDPOINT_NAME>",
    "dataDestination": "<TOPIC_OR_TABLE>" // See section on configuring data destination
  }
}

على سبيل المثال، لإرسال البيانات مرة أخرى إلى وسيط MQTT المحلي موضوع MQTT ثابت، استخدم التكوين التالي:

{
  "destinationSettings": {
    "endpointRef": "default",
    "dataDestination": "example-topic"
  }
}

أو، إذا كان لديك نقطة نهاية مخصصة لمركز الأحداث، فسيبدو التكوين كما يلي:

{
  "destinationSettings": {
    "endpointRef": "my-eh-endpoint",
    "dataDestination": "individual-event-hub"
  }
}

بناء الجملة هو نفسه لجميع نقاط نهاية تدفق البيانات:

destinationSettings: {
  endpointRef: "<CUSTOM_ENDPOINT_NAME>"
  dataDestination: '<TOPIC_OR_TABLE>'
}

على سبيل المثال، لإرسال البيانات مرة أخرى إلى وسيط MQTT المحلي موضوع MQTT ثابت، استخدم التكوين التالي:

destinationSettings: {
  endpointRef: 'default'
  dataDestination: 'example-topic'
}

أو، إذا كان لديك نقطة نهاية مخصصة لمركز الأحداث، فسيبدو التكوين كما يلي:

destinationSettings: {
  endpointRef: 'my-eh-endpoint'
  dataDestination: 'individual-event-hub'
}

مثال آخر باستخدام نقطة نهاية التخزين كوجهة:

destinationSettings: {
  endpointRef: 'my-adls-endpoint'
  dataDestination: 'my-container'
}

بناء الجملة هو نفسه لجميع نقاط نهاية تدفق البيانات:

destinationSettings:
  endpointRef: <CUSTOM_ENDPOINT_NAME>
  dataDestination: <TOPIC_OR_TABLE>

على سبيل المثال، لإرسال البيانات مرة أخرى إلى وسيط MQTT المحلي موضوع MQTT ثابت، استخدم التكوين التالي:

destinationSettings:
  endpointRef: default
  dataDestination: example-topic

أو، إذا كان لديك نقطة نهاية مخصصة لمركز الأحداث، فسيبدو التكوين كما يلي:

destinationSettings:
  endpointRef: my-eh-endpoint
  dataDestination: individual-event-hub

مثال آخر باستخدام نقطة نهاية التخزين كوجهة:

destinationSettings:
  endpointRef: my-adls-endpoint
  dataDestination: my-container

مثال

المثال التالي هو تكوين تدفق البيانات الذي يستخدم نقطة نهاية MQTT للمصدر والوجهة. يقوم المصدر بتصفية البيانات من موضوع azure-iot-operations/data/thermostatMQTT . يحول التحويل درجة الحرارة إلى فهرنهايت ويصفي البيانات حيث تكون درجة الحرارة مضروبة في الرطوبة أقل من 100000. ترسل الوجهة البيانات إلى موضوع factoryMQTT .

استخدم الأمر az iot ops dataflow apply لإنشاء تدفق بيانات أو تغييره.

az iot ops dataflow apply --resource-group <ResourceGroupName> --instance <AioInstanceName> --profile <DataflowProfileName> --name <DataflowName> --config-file <ConfigFilePathAndName>

--config-file المعلمة هي المسار واسم الملف لملف تكوين JSON الذي يحتوي على خصائص المورد.

في هذا المثال، افترض ملف تكوين يسمى data-flow.json بالمحتوى التالي المخزن في الدليل الرئيسي للمستخدم:

{
    "mode": "Enabled",
    "operations": [
      {
        "operationType": "Source",
        "sourceSettings": {
          "dataSources": [
            "thermostats/+/sensor/temperature/#",
            "humidifiers/+/sensor/humidity/#"
          ],
          "endpointRef": "default",
          "serializationFormat": "Json"
        }
      },
      {
        "builtInTransformationSettings": {
          "datasets": [],
          "filter": [
            {
              "expression": "$1 * $2 < 100000",
              "inputs": [
                "temperature.Value",
                "\"Tag 10\".Value"
              ],
              "type": "Filter"
            }
          ],
          "map": [
            {
              "inputs": [
                "*"
              ],
              "output": "*",
              "type": "PassThrough"
            },
            {
              "expression": "fToC($1)",
              "inputs": [
                "Temperature.Value"
              ],
              "output": "TemperatureF",
              "type": "Compute"
            },
            {
              "inputs": [
                "@\"Tag 10\".Value"
              ],
              "output": "Humidity",
              "type": "Rename"
            }
          ],
          "serializationFormat": "Json"
        },
        "operationType": "BuiltInTransformation"
      },
      {
        "destinationSettings": {
          "dataDestination": "factory",
          "endpointRef": "default"
        },
        "operationType": "Destination"
      }
    ]
}

فيما يلي مثال على الأمر لإنشاء تدفق بيانات أو تحديثه باستخدام ملف تعريف تدفق البيانات الافتراضي:

az iot ops dataflow apply --resource-group myResourceGroup --instance myAioInstance --profile default --name data-flow --config-file ~/data-flow.json

param aioInstanceName string = '<AIO_INSTANCE_NAME>'
param customLocationName string = '<CUSTOM_LOCATION_NAME>'
param dataflowName string = '<DATAFLOW_NAME>'

resource aioInstance 'Microsoft.IoTOperations/instances@2024-11-01' existing = {
  name: aioInstanceName
}

resource customLocation 'Microsoft.ExtendedLocation/customLocations@2021-08-31-preview' existing = {
  name: customLocationName
}

// Pointer to the default data flow endpoint
resource defaultDataflowEndpoint 'Microsoft.IoTOperations/instances/dataflowEndpoints@2024-11-01' existing = {
  parent: aioInstance
  name: 'default'
}

// Pointer to the default data flow profile
resource defaultDataflowProfile 'Microsoft.IoTOperations/instances/dataflowProfiles@2024-11-01' existing = {
  parent: aioInstance
  name: 'default'
}

resource dataflow 'Microsoft.IoTOperations/instances/dataflowProfiles/dataflows@2024-11-01' = {
  // Reference to the parent data flow profile, the default profile in this case
  // Same usage as profileRef in Kubernetes YAML
  parent: defaultDataflowProfile
  name: dataflowName
  extendedLocation: {
    name: customLocation.id
    type: 'CustomLocation'
  }
  properties: {
    mode: 'Enabled'
    operations: [
      {
        operationType: 'Source'
        sourceSettings: {
          // Use the default MQTT endpoint as the source
          endpointRef: defaultDataflowEndpoint.name
          // Filter the data from the MQTT topic azure-iot-operations/data/thermostat
          dataSources: [
            'azure-iot-operations/data/thermostat'
          ]
        }
      }
      // Transformation optional
      {
        operationType: 'BuiltInTransformation'
        builtInTransformationSettings: {
          // Filter the data where temperature * "Tag 10" < 100000
          filter: [
            {
              inputs: [
                'temperature.Value'
                '"Tag 10".Value'
              ]
              expression: '$1 * $2 < 100000'
            }
          ]
          map: [
            // Passthrough all values by default
            {
              inputs: [
                '*'
              ]
              output: '*'
            }
            // Convert temperature to Fahrenheit and output it to TemperatureF
            {
              inputs: [
                'temperature.Value'
              ]
              output: 'TemperatureF'
              expression: 'cToF($1)'
            }
          // Extract the "Tag 10" value and output it to Humidity
            {
              inputs: [
                '"Tag 10".Value'
              ]
              output: 'Humidity'
            }
          ]
        }
      }
      {
        operationType: 'Destination'
        destinationSettings: {
          // Use the default MQTT endpoint as the destination
          endpointRef: defaultDataflowEndpoint.name
          // Send the data to the MQTT topic factory
          dataDestination: 'factory'
        }
      }
    ]
  }
}

apiVersion: connectivity.iotoperations.azure.com/v1
kind: Dataflow
metadata:
  name: my-dataflow
  namespace: azure-iot-operations
spec:
  # Reference to the default data flow profile
  profileRef: default
  mode: Enabled
  operations:
    - operationType: Source
      sourceSettings:
        # Use the default MQTT endpoint as the source
        endpointRef: default
        # Filter the data from the MQTT topic azure-iot-operations/data/thermostat
        dataSources:
          - azure-iot-operations/data/thermostat
    # Transformation optional
    - operationType: builtInTransformation
      builtInTransformationSettings:
        # Filter the data where temperature * "Tag 10" < 100000
        filter:
          - inputs:
              - 'temperature.Value'
              - '"Tag 10".Value'
            expression: '$1 * $2 < 100000'
        map:
          # Passthrough all values by default
          - inputs:
              - '*'
            output: '*'
          # Convert temperature to Fahrenheit and output it to TemperatureF
          - inputs:
              - temperature.Value
            output: TemperatureF
            expression: cToF($1)
          # Extract the "Tag 10" value and output it to Humidity
          - inputs:
              - '"Tag 10".Value'
            output: 'Humidity'
    - operationType: Destination
      destinationSettings:
        # Use the default MQTT endpoint as the destination
        endpointRef: default
        # Send the data to the MQTT topic factory
        dataDestination: factory

لمشاهدة المزيد من الأمثلة على تكوينات تدفق البيانات، راجع Azure REST API - تدفق البيانات وBicep التشغيل السريع.

التحقق من عمل تدفق البيانات

اتبع البرنامج التعليمي: جسر MQTT ثنائي الاتجاه إلى Azure Event Grid للتحقق من عمل تدفق البيانات.

تصدير تكوين تدفق البيانات

لتصدير تكوين تدفق البيانات، يمكنك استخدام تجربة العمليات أو عن طريق تصدير المورد المخصص لتدفق البيانات.

حدد تدفق البيانات الذي تريد تصديره وحدد تصدير من شريط الأدوات.

لقطة شاشة لواجهة تجربة العمليات التي تعرض خيار التصدير لتدفق بيانات مكون.

استخدم الأمر az iot ops dataflow show لتصدير تدفق البيانات.

az iot ops dataflow show --resource-group <ResourceGroupName> --instance <AioInstanceName> --name <DataflowName> --profile <DataflowProfileName> --output json > my-dataflow.json

فيما يلي مثال على الأمر لتصدير تدفق بيانات يسمى data-flow إلى ملف JSON يسمى data-flow.json:

az iot ops dataflow show --resource-group myResourceGroup --instance myAioInstance --profile default --name data-flow --output json > data-flow.json

kubectl get dataflow my-dataflow -o yaml > my-dataflow.yaml

تكوين تدفق البيانات المناسب

للتأكد من أن تدفق البيانات يعمل كما هو متوقع، تحقق مما يلي:

يجب استخدام نقطة نهاية تدفق بيانات MQTT الافتراضية كمصدر أو وجهة.
ملف تعريف تدفق البيانات موجود ومشار إليه في تكوين تدفق البيانات.
المصدر هو إما نقطة نهاية MQTT أو نقطة نهاية Kafka أو أصل. لا يمكن استخدام نقاط نهاية نوع التخزين كمصدر.
عند استخدام Event Grid كمصدر، يتم تعيين عدد مثيلات ملف تعريف تدفق البيانات إلى 1 لأن وسيط Event Grid MQTT لا يدعم الاشتراكات المشتركة.
عند استخدام Event Hubs كمصدر، يكون كل مركز أحداث في مساحة الاسم موضوع Kafka منفصل ويجب تحديده كمصدر بيانات.
يتم تكوين التحويل، إذا تم استخدامه، مع بناء جملة مناسب، بما في ذلك الهروب المناسب من الأحرف الخاصة.
عند استخدام نقاط نهاية نوع التخزين كوجهة ، يتم تحديد مخطط.

مشاركة عبر

إنشاء تدفقات البيانات في عمليات Azure IoT

المتطلبات الأساسية

ملف تعريف تدفق البيانات

نقاط نهاية تدفق البيانات

الشروع في العمل

المصدر

الخيار 1: استخدام نقطة نهاية وسيط الرسائل الافتراضية كمصدر

الخيار 2: استخدام الأصل كمصدر

الخيار 3: استخدام نقطة نهاية تدفق بيانات MQTT أو Kafka المخصصة كمصدر

تكوين مصادر البيانات (موضوعات MQTT أو Kafka)

موضوعات MQTT

الاشتراكات المشتركة

موضوعات Kafka

تحديد مخطط المصدر

التحويل

إثراء: إضافة بيانات مرجعية

عامل التصفية: تصفية البيانات استنادا إلى شرط

الخريطة: نقل البيانات من حقل إلى آخر

حسب

إعادة تسمية

خاصية جديدة

إزالة

تسلسل البيانات وفقا لمخطط

الوجهة

تكوين وجهة البيانات (موضوع أو حاوية أو جدول)

مثال

التحقق من عمل تدفق البيانات

تصدير تكوين تدفق البيانات

تكوين تدفق البيانات المناسب

الخطوات التالية

الملاحظات

الموارد الإضافية