Поделиться через


Операции управления в Управляемом экземпляре Azure для Apache Cassandra

Azure Managed Instance для Apache Cassandra — это полностью управляемая служба для кластеров Apache Cassandra с полностью открытым исходным кодом. Служба также позволяет переопределять конфигурации в зависимости от конкретных потребностей каждой рабочей нагрузки, что обеспечивает максимальную гибкость и контроль, где это необходимо.

В этой статье описаны предоставляемые службой операции и функции управления. Он также объясняет разделение обязанностей между командой поддержка Azure и клиентами при обслуживании гибридных кластеров.

Сжатие

  • Существуют различные типы сжатия. Эта служба в настоящее время выполняет незначительное сжатие путём восстановления, подробнее см. в разделе Обслуживание. Эта операция выполняет сжатие дерева Merkle, которое является особым типом сжатия.

  • В зависимости от стратегии сжатия, установленной в таблице с помощью CQL, например WITH compaction = { 'class' : 'LeveledCompactionStrategy' }, Cassandra автоматически сжимается, когда таблица достигает определенного размера. Рекомендуется тщательно выбрать стратегию сжатия рабочей нагрузки. Не выполняйте никаких ручных уплотнений вне стратегической схемы.

Исправление

  • Обновления на уровне операционной системы выполняются автоматически каждые две недели.

  • Исправления на уровне программного обеспечения Apache Cassandra устанавливаются при обнаружении уязвимостей безопасности. Частота исправлений может отличаться.

  • Во время установки исправлений компьютеры перезапускаются по одной стойке за раз. Вы не должны столкнуться с какой-либо деградацией на стороне приложения до тех пор, пока параметр кворума ALL не используется, и коэффициент репликации равен 3 или выше.

  • Версия в Apache Cassandra имеет формат X.Y.Z. Вы можете управлять развертыванием основных версий (X) и дополнительных версий (Y) вручную с помощью средств службы. Исправления Cassandra (Z), которые могут потребоваться для этой комбинации основных и дополнительных версий, выполняются автоматически.

Примечание.

В настоящее время служба поддерживает версии Cassandra до версии 5.0. Чтобы указать версию Cassandra при развертывании кластера, см. краткое руководство по Azure CLI.

Обслуживание

  • Служба запускает команду nodetool repair с помощью инструмента Reaper. Это средство запускается каждую неделю. Если вы используете собственную службу для гибридного развертывания, может потребоваться отключить reaper.

  • Служба мониторинга работоспособности узла отвечает за следующие задачи:

    • Активное отслеживание членства каждого узла в кольце Cassandra.
    • Автоматическое обнаружение и автоматическое смягчение проблем инфраструктуры, таких как сбои виртуальных машин, сетей, хранилищ, Linux и вспомогательного программного обеспечения.
    • Проактивный мониторинг ЦП, диска, потери кворума и других проблем с ресурсами.
    • По возможности, автоматически вводить в рабочее состояние неработоспособные узлы и вручную вводить узлы в ответ на автоматически сгенерированные предупреждения.

Поддержка

Управляемый экземпляр Azure для Apache Cassandra предоставляет Соглашение об уровне обслуживания для обеспечения доступности центров обработки данных в управляемом кластере. Если вы столкнулись с проблемами при использовании службы, отправьте запрос на поддержку на портале Azure.

К преимуществам нашей поддержки относятся:

  • Одна точка контакта для проблем с инфраструктурой Cassandra. Нет необходимости отдельно направлять запросы на поддержку в такие команды IaaS, как вычисления, диски и сети.
  • Рекомендации по электронной почте по вопросам производительности, размера и других проблем с ограничением ресурсов.
  • Покрытие поддержки 24x7, включая автоматически созданные инциденты в случае серьезных сбоев.
  • Поддержка исправлений, утвержденных сообществом. См. Устранение уязвимостей.
  • Внутренняя поддержка команды инженеров Java JDK/JVM.
  • Поддержка операционной системы Linux с безопасностью цепочки поставок программного обеспечения.

Внимание

Корпорация Майкрософт изучает и диагностирует проблемы, сообщаемые, используя обращения в службу поддержки. Поддержка разрешает или устраняет возможные проблемы. В конечном счете вы несете ответственность за любое использование уровня конфигурации Apache Cassandra, что приводит к проблемам ЦП, диска или сети.

Вот некоторые примеры таких проблем:

  • Неэффективные операции с запросами.
  • Пропускная способность, превышающая емкость.
  • Поглощение данных, превышающих емкость хранилища.
  • Неправильные параметры конфигурации пространства ключей.
  • Ненадежная модель данных или стратегия ключа раздела.

Корпорация Майкрософт может исследовать случай поддержки и обнаружить, что причина проблемы находится на уровне конфигурации Apache Cassandra. Такая проблема не возникает из каких-либо базовых аспектов уровня платформы, которые поддерживает Azure. Поддержка по-прежнему предоставляет рекомендации и руководство по исправлению или смягчению последствий, когда это возможно, прежде чем они закрывают дело.

Рекомендуется включить метрики и ознакомиться с интеграцией Azure Monitor , чтобы предотвратить распространенные проблемы уровня приложений и конфигурации в Apache Cassandra, например описанные ранее.

Предупреждение

Управляемый экземпляр Azure для Apache Cassandra также позволяет выполнять команды nodetool и sstable для обычного администрирования DBA. Дополнительные сведения см. в командах DBA для Управляемого экземпляра Azure для Apache Cassandra.

Некоторые из этих команд могут дестабилизировать кластер Cassandra. Эти команды следует выполнять тщательно и после тестирования в непроизводственных средах. По возможности сначала используйте --dry-run параметр. Корпорация Майкрософт не предлагает соглашения об уровне обслуживания или поддержку при выполнении команд, которые изменяют конфигурацию базы данных по умолчанию или таблицы.

Резервное копирование и восстановление

Резервные копии моментальных снимков включены по умолчанию и выполняются каждые 24 часа. Резервные копии хранятся во внутренней учетной записи Blob-хранилища Azure и сохраняются до двух дней (48 часов). Первоначальные две резервные копии предоставляются бесплатно. Плата за дополнительные резервные копии. См. сведения о ценах. Чтобы изменить интервал резервного копирования или период хранения, можно изменить политику на портале Azure:

Снимок экрана: страница конфигурации расписания резервного копирования.

Чтобы восстановить существующую резервную копию, отправьте запрос в службу поддержки в портал Azure. При отправке обращения в службу поддержки необходимо выполнить следующие действия.

  1. Укажите идентификатор резервного копирования на портале для резервной копии, которую требуется восстановить. Этот идентификатор можно найти на портале Azure:

    Снимок экрана: страница конфигурации расписания резервного копирования с идентификатором резервного копирования.

  2. Сообщите нам, был ли удален исходный центр обработки данных. Это важно, чтобы определить правильную учетную запись резервного копирования для восстановления.

  3. Если вам не нужно восстанавливать весь кластер, укажите пространство ключей и таблицу, которые необходимо восстановить, если это применимо.

  4. Укажите, нужно ли восстановить резервную копию в существующем кластере или в новом кластере.

  5. Если вы хотите восстановить новый кластер, сначала необходимо создать новый кластер. Убедитесь, что целевой кластер соответствует исходному кластеру с точки зрения количества центров обработки данных. Убедитесь, что соответствующий центр обработки данных имеет одинаковое количество узлов. Вы также можете решить, следует ли хранить учетные данные в новом целевом кластере. Кроме того, можно позволить восстановлению переопределить имя пользователя и пароль тем, что было создано изначально.

  6. Вы также можете решить, оставить или удалить system_auth ключевую область в новом целевом кластере или разрешить восстановлению перезаписать её данными из резервной копии. Пространство system_auth ключей в Cassandra содержит данные авторизации и внутренней проверки подлинности, включая роли, разрешения ролей и пароли. Процесс восстановления по умолчанию перезаписывает ключевое пространство system_auth.

Примечание.

Время, необходимое для ответа на запрос о восстановлении из резервной копии, зависит от критичности вашего обращения в поддержку, соглашения об уровне обслуживания для времени реакции и объема данных, которые нужно восстановить. Мы не предоставляем SLA по времени на выполнение восстановления. Это значение зависит от объема восстанавливаемых данных.

Предупреждение

Резервные копии предназначены для случайных сценариев удаления и не являются геоизбыточными. Мы не рекомендуем использовать резервные копии в качестве стратегии аварийного восстановления (АВ) для регионального сбоя. Чтобы защититься от сбоев на уровне региона, рекомендуется развернуть несколько регионов. Дополнительные сведения см. в кратком руководстве по развертыванию в нескольких регионах.

Безопасность

Управляемый экземпляр Azure для Apache Cassandra содержит множество встроенных явных средств и функций управления безопасностью:

  • Защищенные образы виртуальных машин Linux с управляемой цепочкой поставок.
  • Мониторинг уязвимостей и угроз (CVE) на уровне операционной системы.
  • Смена сертификатов для программного обеспечения Apache Cassandra и Prometheus, размещенного на управляемых виртуальных машинах.
  • Активное сканирование уязвимостей.
  • Активный поиск вирусов.
  • Безопасный программный код.

Дополнительные сведения о функциях безопасности см. в статье "Безопасность в Управляемом экземпляре Azure" для Apache Cassandra.

Поддержка гибридной конфигурации

При настройке гибридного кластера автоматические операции очистки, выполняемые в службе, идут на пользу всему кластеру. Этот аспект включает центры обработки данных, которые не обеспечены службой. Вы несете ответственность за обслуживание локального или внешнего размещенного центра обработки данных.