Введение в Хранилище BLOB-объектов Azure

Хранилище BLOB-объектов Azure — это решение корпорации Майкрософт для хранения объектов в облаке. Хранилище BLOB-объектов оптимизировано для хранения больших объемов неструктурированных данных. Неструктурированные данные — это данные, которые не соответствуют определенной модели данных или определению, например текстовых или двоичных данных.

Сведения о хранилище BLOB-объектов

Хранилище BLOB-объектов предназначено для:

  • Обслуживание изображений или документов непосредственно в браузере.
  • Хранение файлов для распределенного доступа.
  • Потоковая передача видео и звука.
  • Запись в файлы журнала.
  • Хранение резервных копий и восстановление данных, аварийное восстановление и архивация.
  • Хранение данных для анализа локальной службой или службой, размещенной в Azure.

Пользователи или клиентские приложения могут получать доступ к объектам в Хранилище BLOB-объектов по протоколу HTTP/HTTPS из любой точки мира. Объекты в хранилище BLOB-объектов доступны через REST API службы хранилища Azure, Azure PowerShell, Azure CLI или клиентская библиотека службы хранилища Azure. Клиентские библиотеки доступны для разных языков, включая:

Клиенты также могут безопасно подключаться к хранилищу BLOB-объектов по протоколу SSH File Transfer Protocol (SFTP) и подключать контейнеры хранилища BLOB-объектов по протоколу NFS 3.0.

Сведения об Azure Data Lake Storage 2-го поколения

Хранилище BLOB-объектов поддерживает Azure Data Lake Storage 2-го поколения— корпоративное решение майкрософт для аналитики больших данных для облака. Azure Data Lake Storage 2-го поколения предлагает иерархическую файловую систему, а также преимущества хранилища BLOB-объектов, в том числе:

  • экономичное многоуровневое хранилище;
  • Высокий уровень доступности
  • Строгая согласованность
  • возможности аварийного восстановления.

Общие сведения об Azure Data Lake Storage 2-го поколения см. в этой статье.

Ресурсы хранилища BLOB-объектов

В Хранилище BLOB-объектов предлагается три типа ресурсов:

  • учетная запись хранения;
  • контейнер в учетной записи хранения;
  • большой двоичный объект в контейнере.

На следующей схеме показана связь между этими ресурсами.

Схема, на которой показана связь между учетной записью хранения, контейнерами и BLOB-объектами

Учетные записи хранения

Учетная запись хранения предоставляет для ваших данных уникальное пространство имен в Azure. У каждого объекта, который хранится в службе хранилища Azure, есть адрес, содержащий уникальное имя учетной записи. Сочетание имени учетной записи и конечной точки Хранилища BLOB-объектов формирует базовый адрес для объектов в учетной записи хранения.

Например, если ваша учетная запись хранения называется mystorageaccount, то конечная точка по умолчанию для хранилища BLOB-объектов:

http://mystorageaccount.blob.core.windows.net

В следующей таблице описаны разные типы учетных записей хранения, которые поддерживаются для Хранилища BLOB-объектов.

Тип учетной записи хранения Уровень производительности Использование
Общего назначения версии 2 Standard Стандартный тип учетной записи хранения для больших двоичных объектов, общих папок, очередей и таблиц. Рекомендуется для большинства сценариев, в которых используется Хранилище BLOB-объектов или другая служба хранилища Azure.
Блочный BLOB-объект Premium Тип учетной записи хранения "Премиум" для блочных и добавочных BLOB-объектов. Рекомендуется для сценариев с высокой скоростью обработки транзакций, использующих небольшие объекты или требующих постоянно низкой задержки хранилища. Дополнительные сведения о рабочих нагрузках для учетных записей блочных BLOB-объектов ценовой категории "Премиум"
Страничный BLOB-объект Premium Тип учетной записи хранения "Премиум" только для страничных BLOB-объектов. Дополнительные сведения о рабочих нагрузках для учетных записей страничных BLOB-объектов ценовой категории "Премиум"

Дополнительные сведения об типах учетных записей хранения Azure см. в этой статье. Сведения об устаревших типах учетных записей хранения см. в этой статье.

Сведения о создании учетной записи хранения см. в этой статье.

Контейнеры

Контейнер упорядочивает набор больших двоичных объектов, как каталог в файловой системе. Учетная запись хранения может содержать неограниченное количество контейнеров. В каждом контейнере может храниться неограниченное количество больших двоичных объектов.

Имя контейнера должно быть допустимым DNS-именем, так как оно является частью уникального URI (универсального идентификатора ресурса), используемого для обращения к контейнеру или его BLOB-объектам. При присвоении имени контейнеру следуйте нижеприведенным правилам:

  • Имена контейнеров могут содержать от 3 до 63 символов.
  • Имена контейнеров должны начинаться с буквы или цифры и могут содержать только строчные буквы, цифры и тире (-).
  • В именах контейнеров нельзя использовать два или более последовательных символа тире.

Универсальный код ресурса (URI) для контейнера аналогичен следующему:

https://myaccount.blob.core.windows.net/mycontainer

Дополнительные сведения о контейнерах именования см. в статье Naming and Referencing Containers, Blobs, and Metadata (Именование контейнеров, больших двоичных объектов и метаданных и ссылка на них).

BLOB-объекты

Хранилище Azure поддерживает три типа больших двоичных объектов.

  • Блочные BLOB-объекты хранят текст и двоичные данные. Блочные большие двоичные объекты состоят из блоков данных, которыми можно управлять отдельно. Блочные BLOB-объекты могут хранить до 190,7 ТиБ.
  • Добавочные BLOB-объекты состоят из блоков, как и блочные, но оптимизированы для операций добавления. Добавочные большие двоичные объекты идеально подходят для таких сценариев, как сбор данных журналов из виртуальных машин.
  • Страничные BLOB-объекты используются для хранения файлов прямого доступа объемом до 8 ТиБ. Страничные BLOB-объекты хранят файлы виртуального жесткого диска (VHD) и выступают в качестве дисков для виртуальных машин Azure. Дополнительные сведения о страничных BLOB-объектах см. в статье Общие сведения о страничных BLOB-объектах Azure.

Дополнительные сведения о различных больших двоичных объектах см. в статье Understanding Block Blobs, Append Blobs, and Page Blobs (Основные сведения о блочных, добавочных и страничных BLOB-объектах).

Универсальный код ресурса (URI) для большого двоичного объекта аналогичен следующему:

https://myaccount.blob.core.windows.net/mycontainer/myblob

или

https://myaccount.blob.core.windows.net/mycontainer/myvirtualdirectory/myblob

При присвоении имени большому двоичному объекту следуйте нижеприведенным правилам:

  • Имя BLOB-объекта может содержать любую комбинацию знаков.
  • Имя большого двоичного объекта в службе хранилища Azure должно быть длиной не меньше одного символа, но не больше 1 024 символов.
  • В именах blob-объектов учитывается регистр символов.
  • Зарезервированные веб-адреса должны быть надлежащим образом экранированы.
  • Число сегментов пути, содержащих имя BLOB-объекта, не может превышать 254. Сегмент пути — это строка между последовательными символами-разделителями (например, косая черта"/"), которая соответствует имени виртуального каталога.

Примечание

Избегайте имен объектов, которые заканчиваются точкой (.), косой чертой (/) или последовательностью или сочетанием этих двух символов. Сегменты пути не должны заканчиваться точкой (.).

Дополнительные сведения о больших двоичных объектах именования см. в статье Именование контейнеров, больших двоичных объектов и метаданных и ссылка на них.

Перемещение данных в хранилище BLOB-объектов

Существует ряд решений для переноса существующих данных в хранилище BLOB-объектов:

  • AzCopy — это простая в использовании программа командной строки для Windows и Linux, которая копирует данные в хранилище BLOB-объектов, контейнеры или учетные записи хранения. См. сведения о передаче данных с помощью AzCopy версии 10.
  • Библиотека перемещения данных для службы хранилища Azure — это библиотека .NET для перемещения данных между службами хранилища Azure. Служебная программа AzCopy создана с библиотекой перемещения данных. Дополнительные сведения о библиотеке перемещения данных см. в справочной документации.
  • Фабрика данных Azure поддерживает копирование данных в хранилище BLOB-объектов и из нее с помощью ключа учетной записи, подписанного URL-адреса, субъекта-службы или управляемых удостоверений для ресурсов Azure. Дополнительные сведения см. в статье Копирование данных в Хранилище BLOB-объектов Azure или из Фабрика данных Azure.
  • Blobfuse — это драйвер виртуальной файловой системы для Хранилище BLOB-объектов Azure. BlobFuse можно использовать для доступа к существующим данным блочных BLOB-объектов в учетной записи хранения через файловую систему Linux. Дополнительные сведения см. в статье Что такое BlobFuse? — BlobFuse2 (предварительная версия)).
  • Служба Azure Data Box доступна для передачи локальных данных в хранилище BLOB-объектов, когда большие наборы данных или ограничения сети делают отправку данных по сети нереальной. В зависимости от размера данных вы можете запросить у корпорации Майкрософт устройства Диск Azure Data Box, Azure Data Box или Azure Data Box Heavy. Затем вы можете скопировать данные на эти устройства и отправить их обратно в корпорацию Майкрософт для отправки в Хранилище BLOB-объектов.
  • Служба импорта и экспорта Azure позволяет импортировать большие объемы данных в учетную запись хранения или экспортировать их из нее, используя предоставленные вами жесткие диски. Дополнительные сведения см. в статье Что такое служба импорта и экспорта Azure?

Дальнейшие действия