Общие сведения о входных данных Azure Stream Analytics
Задания Azure Stream Analytics используют несколько видов входных данных. Все входные данные определяют подключение к имеющемуся источнику данных. Stream Analytics принимает входящие данные от нескольких типов источников событий, включая Центры событий, Центр Интернета вещей и хранилище BLOB-объектов. Входные данные подаются в имени потокового SQL-запроса, которое записывается для каждого задания. В запросе вы можете объединить несколько входных данных для смешивания данных или сравнения потоковых данных с помощью уточняющего запроса ссылочных данных и передачи результатов в выходные данные.
Stream Analytics первоклассно интегрируется с четырьмя типами ресурсов, используемых в качестве входных данных:
- Центры событий Azure
- Центр Интернета вещей Azure
- Хранилище BLOB-объектов Azure
- Azure Data Lake Storage 2-го поколения
Эти входные ресурсы могут существовать в той же подписке Azure, что и задание Stream Analytics, или быть в другой подписке.
Можно использовать портал Azure, Azure PowerShell, .NET API, REST API, Visual Studio и Visual Studio Code для создания, изменения и проверки выходных данных задания Stream Analytics.
Примечание.
Настоятельно рекомендуется использовать средства Stream Analytics для Visual Studio Code, чтобы обеспечить оптимальную работу в локальной среде разработки. У средств Stream Analytics для Visual Studio 2019 (версия 2.6.3000.0) имеются известные функциональные пробелы, и они не будут улучшаться в дальнейшем.
Потоковые и справочные входные данные
Данные, отправляемые в источник данных, принимаются заданием Stream Analytics и обрабатываются в режиме реального времени. Входные данные делятся на два типа:
- Входные потоковые данные
- Входные данные ссылок.
Входные потоковые данные
Поток данных — это несвязанная последовательность событий в динамике по времени. Задания Stream Analytics должны включать хотя бы один входной поток данных. Центры событий, Центр Интернета вещей, Azure Data Lake Storage 2-го поколения и хранилище BLOB-объектов поддерживаются в качестве источников входных данных потока данных. Центры событий используются для сбора потоков событий с нескольких устройств и служб. Это могут быть ленты новостей социальных сетей, сведения о торговле акциями или данные датчиков. Центр Интернета вещей оптимизированы для сбора данных с подключенных устройств в сценариях Интернета вещей (IoT) хранилища BLOB-объектов в качестве источника входных данных для приема массовых данных в виде потока, например файлов журналов.
Дополнительные сведения о входных данных потоковой передачи см. в разделе Stream Data в качестве входных данных в Stream Analytics.
Входные справочные данные
Stream Analytics также поддерживает входные данные, называемые ссылочными данными. Справочные данные являются полностью статическими и изменяются крайне редко. Обычно используется для выполнения корреляции и поиска. Например, можно соединить входные потоковые данные со ссылочными данными так же, как вы бы выполнили соединение SQL для поиска статических значений. Источниками ссылочных данных могут служить хранилище BLOB-объектов, Azure Data Lake 2-го поколения и База данных SQL Azure. Размер источника BLOB-объектов эталонных данных имеет ограничение до 300 МБ в зависимости от сложности запроса и выделенных единиц потоковой передачи. Дополнительные сведения см. в разделе ограничения размера документации по эталонным данным.
Дополнительные сведения о входных данных ссылочных данных см. в статье "Использование ссылочных данных для поиска в Stream Analytics".