Введение

Завершено

Многие организации потратили два последних десятилетия на создание хранилищ данных и решений бизнес-аналитики (BI) на основе систем реляционных баз данных. Многие решения бизнес-аналитики потеряли возможности хранения неструктурированных данных из-за затрат и сложности в этих типах данных в базах данных.

Озера данных стали общим решением этой проблемы. Озеро данных предоставляет файловое хранилище, обычно в распределенной файловой системе, которая поддерживает высокую масштабируемость для больших объемов данных. Организации могут хранить структурированные, полуструктурированные и неструктурированные файлы в озере данных, а затем использовать их оттуда в технологиях обработки больших данных, таких как Apache Spark.

Azure Data Lake Storage 2-го поколения предоставляет облачное решение для хранилища озера данных в Microsoft Azure и поддерживает множество крупномасштабных решений аналитики, созданных в Azure.