Перенос тестирования на более ранние этапы разработки с помощью юнит-тестов

Тестирование помогает убедиться, что код выполняется должным образом, но время и усилия по созданию тестов занимает время от других задач, таких как разработка функций. С этой стоимостью важно извлечь максимальное значение из тестирования. В этой статье рассматриваются принципы тестирования DevOps, а так же значение модульного тестирования и стратегию сдвига тестирования влево.

Специализированные тестировщики ранее писали большинство тестов, и многие разработчики продуктов не обучались написанию модульных тестов. Написание тестов может показаться слишком сложным или как слишком много работы. Может быть скептицизм о том, работает ли стратегия модульного теста, плохое взаимодействие с плохо написанными модульными тестами или страх, что модульные тесты заменят функциональные тесты.

Рисунок, описывающий аргументы о внедрении модульного тестирования.

Чтобы реализовать стратегию тестирования DevOps, быть прагматичным и сосредоточиться на создании импульса. Хотя вы можете настаивать на модульных тестах для нового кода или существующего кода, который может быть чисто рефакторингован, возможно, имеет смысл использовать устаревшую базу кода, чтобы обеспечить некоторую зависимость. Если значительные части кода продукта используют SQL, позволить модульным тестам зависеть от поставщика ресурса SQL вместо мокирования этого уровня может быть краткосрочным подходом к прогрессу.

По мере развития организаций DevOps становится проще для руководства улучшать процессы. Хотя может быть некоторое сопротивление изменениям, гибкие организации ценят изменения, которые явно платят дивиденды. Это должно быть легко продавать видение более быстрых запусков тестов с меньшим количеством сбоев, так как это означает больше времени для инвестиций в создание новой ценности через разработку функций.

Таксономия тестирования DevOps

Определение таксономии теста является важным аспектом процесса тестирования DevOps. Тест DevOps классифицирует отдельные тесты по их зависимостям и времени их выполнения. Разработчики должны понимать, какие типы тестов подходят для различных сценариев, а также какие тесты необходимы для различных частей процесса. Большинство организаций классифицируют тесты на четырех уровнях:

Тесты L0 и L1 — это модульные тесты или тесты, которые зависят от кода в сборке при тестировании и ничего другого. L0 — это широкий класс быстрых модульных тестов в памяти.
L2 — это функциональные тесты , которые могут потребовать сборки и других зависимостей, таких как SQL или файловая система.
Функциональные тесты L3 выполняются для тестируемых развертываний служб. Для этой категории тестирования требуется развертывание службы, но для ключевых зависимостей служб могут использоваться заглушки.
Тесты L4 — это ограниченный класс тестов интеграции , выполняемых в рабочей среде. Для тестов L4 требуется полное развертывание продукта.

Хотя это было бы идеально для всех тестов, которые будут выполняться в любое время, это не возможно. Команды могут выбирать, на каком этапе процесса DevOps выполнять каждый тест, и использовать стратегии shift-left или shift-right, чтобы перенести выполнение различных типов тестов на более ранние или более поздние этапы процесса.

Например, ожидается, что разработчики всегда выполняют тесты L2 перед коммитом, pull request автоматически не проходит, если выполнение тестов L3 завершилось неудачей, а развертывание может быть заблокировано, если тесты L4 были провалены. Конкретные правила могут отличаться от организации к организации, но применение ожиданий для всех команд в организации перемещает всех к тем же целям качества зрения.

Принципы тестирования DevOps

Чтобы помочь перевести тестовый портфель на современные процессы DevOps, сформулировать видение качества. Teams должны придерживаться следующих принципов тестирования при определении и реализации стратегии тестирования DevOps.

Схема, демонстрирующая пример качества визуального зрения и перечисляет принципы тестирования.

Перенос тестирования на более ранние этапы разработки

Выполнение тестов может занять много времени. По мере масштабирования проектов число тестов и типов значительно увеличивается. Когда тестовые наборы увеличиваются до такой степени, что требуют часы или дни на выполнение, их выполнение может быть отодвинуто на последний момент. Преимущества тестирования для качества кода проявляются не сразу, а лишь спустя время после того, как код внесён в систему контроля версий.

Длительные тесты также могут приводить к сбоям, на расследование которых уходит много времени. Команды могут развить устойчивость к сбоям, особенно в ранних спринтах. Такая терпимость подрывает ценность тестирования в качестве аналитических сведений о качестве базы кода. Длительные тесты в последний момент также добавляют непредсказуемость к ожиданиям конца цикла спринта, поскольку неизвестный объем технического долга должен быть выплачен, чтобы код был готов к поставке.

Цель перемещения тестирования влево заключается в перемещении качества вверх, выполняя задачи тестирования ранее в конвейере. Благодаря сочетанию улучшений тестов и процессов сдвиг влево сокращает время выполнения тестов и влияние сбоев позже в цикле. Сдвиг влево гарантирует, что большинство тестов завершено до слияния изменений в основную ветвь.

Схема, показывающая переход на перемещение влево тестирование.

Помимо переноса определённых обязанностей по тестированию на более ранние этапы для улучшения качества кода, команды могут перенести другие аспекты тестирования на более поздние стадии в цикле DevOps, чтобы улучшить окончательный продукт. Для получения дополнительной информации см. раздел «Смещение вправо» для тестирования в производственной среде.

Пишите тесты на самом низком возможном уровне

Напишите дополнительные модульные тесты. Рекомендуется использовать тесты с наименьшими внешними зависимостями и сосредоточиться на выполнении большинства тестов в рамках сборки. Рассмотрим параллельную систему сборки, которая может выполнять модульные тесты для сборки сразу после того, как сборка и тесты станут доступными. Невозможно протестировать каждый аспект службы на этом уровне, но принцип заключается в том, чтобы использовать более легкие модульные тесты, если они могут производить те же результаты, что и более тяжелые функциональные тесты.

Цель проверки надежности

Ненадежный тест является организационно дорогостоящим в поддержке. Такой тест непосредственно противоречит цели повышения инженерной эффективности, затрудняя внесение изменений с уверенностью. Разработчики должны иметь возможность вносить изменения в любом месте и быстро получить уверенность в том, что ничего не было нарушено. Поддерживайте высокий стандарт надежности. Не рекомендуется использовать тесты пользовательского интерфейса, так как они, как правило, ненадежны.

Написание функциональных тестов, которые могут выполняться в любом месте

Тесты могут использовать специализированные точки интеграции, разработанные специально для обеспечения тестирования. Одной из причин этой практики является отсутствие тестируемости в самом продукте. К сожалению, такие тесты часто зависят от внутренних знаний и используют сведения о реализации, которые не имеют значения с точки зрения функционального теста. Эти тесты ограничены средами, имеющими секреты и конфигурацию, необходимые для выполнения тестов, что обычно исключает рабочие развертывания. Функциональные тесты должны использовать только общедоступный API продукта.

Разработка продуктов для тестирования

Организации, находящиеся в процессе зрелости DevOps, формируют полное понимание того, что означает доставка качественного продукта в облачной среде. Переключение баланса решительно в пользу модульного тестирования над функциональным тестированием требует от команд сделать варианты проектирования и реализации, поддерживающие тестирование. Существуют различные идеи о том, что представляет собой хорошо разработанный и хорошо реализованный код для тестирования, так же как существуют различные стили программирования. Принцип заключается в том, что проектирование для тестирования должно стать основной частью обсуждения о качестве дизайна и кода.

Рассматривать тестовый код как код продукта

Явное указание на то, что тестовый код является частью кода продукта, дает понять, что качество тестового кода так же важно, как качество кода продукта при выпуске. Команды должны относиться к тестовому коду так же, как они относятся к коду продукта, и применять ту же степень внимания к проектированию и реализации тестов и фреймворков тестирования. Эти усилия аналогичны управлению конфигурацией и инфраструктурой в виде кода. Чтобы проверка кода была полной, следует рассмотреть тестовый код и держать его на тех же строгих стандартах качества, что и код продукта.

Использование инфраструктуры общих тестов

Понизьте планку применения тестовой инфраструктуры для генерации надежных сигналов качества. Просмотрите тестирование как общую службу для всей команды. Храните код модульного теста вместе с кодом продукта и создайте его с помощью продукта. Тесты, которые выполняются в процессе сборки, также должны выполняться в средствах разработки, таких как Azure DevOps. Если тесты могут выполняться в каждой среде из локальной разработки через рабочую среду, они имеют ту же надежность, что и код продукта.

Ответственность владельцев кода за тестирование

Тестовый код должен находиться рядом с кодом продукта в репозитории. Чтобы код был протестирован на границе компонента, отправьте ответственность за тестирование на человека, написавшего код компонента. Не полагайтесь на других для тестирования компонента.

Пример: сдвиг влево с модульными тестами

Команда Microsoft решила заменить устаревшие тестовые комплекты современными модульными тестами в DevOps и процессом сдвига влево. Команда отслеживала ход выполнения по трёхнедельным спринтам, как показано на приведённом ниже графике. График охватывает спринты 78-120, которые представляют 42 спринта в течение 126 недель или около двух с половиной лет усилий.

Команда начала работу с 27K устаревших тестов в спринте 78 и достигла нуля устаревших тестов на S120. Набор модульных тестов L0 и L1 заменил большинство старых функциональных тестов. Новые тесты L2 заменили некоторые тесты, и многие старые тесты были удалены.

Схема, показывающая пример баланс портфеля тестов с течением времени.

В путешествии в области программного обеспечения, которое занимает более двух лет на завершение, многому можно научиться от самого процесса. В целом, усилия по полностью перебору тестовой системы в течение двух лет были массовыми инвестициями. Не каждая команда по разработке функций выполняла работу одновременно. Многие команды по всей организации инвестировали время в каждый спринт, и в некоторых спринтах это составляло большую часть работы команды. Хотя трудно оценить стоимость смены, это было неотменяемым требованием к качеству и производительности команды.

Начало работы

В начале команда оставила старые функциональные тесты, называемые тестами TRA, без изменений. Команда хотела, чтобы разработчики поддержали идею написания модульных тестов, в особенности для новых функций. Основное внимание уделялось тому, чтобы упрощать создание тестов L0 и L1. Команда должна сначала разработать такую возможность и создать импульс.

На приведенном выше графике показано число модульных тестов, которое начало увеличиваться на раннем этапе, поскольку команда увидела преимущество написания модульных тестов. Модульные тесты были проще поддерживать, быстрее выполняться и было меньше сбоев. Было легко заручиться поддержкой выполнения всех модульных тестов в процессе pull request.

Команда не сосредоточилась на написании новых тестов L2 до спринта 101. В то же время число тестов TRA снизилось с 27 000 до 14 000 с Sprint 78 до Sprint 101. Новые модульные тесты заменили некоторые тесты TRA, но многие из них были просто удалены на основе анализа их полезности командой.

Тесты TRA выросли с 2100 до 3800 в спринте 110, так как в исходном дереве обнаружены дополнительные тесты и добавлены в граф. Оказалось, что тесты всегда выполнялись, но не отслеживались должным образом. Это был не кризис, но было важно быть честным и переоценить по мере необходимости.

Ускорение

После того как команда имела сигнал непрерывной интеграции (CI), который был чрезвычайно быстрым и надежным, он стал доверенным индикатором качества продукта. На следующем снимке экрана показан запрос на вытягивание и конвейер CI в действии, а также время, необходимое для прохождения различных этапов.

Схема, показывающая запрос на вытягивание и скользящий конвейер CI в действии.

Уходит около 30 минут, чтобы перейти от создания pull request до его слияния, что включает выполнение 60 000 модульных тестов. От слияния кода до сборки CI проходит около 22 минут. Первый сигнал качества от CI, SelfTest, приходит примерно через час. Затем большая часть продукта тестируется с предлагаемым изменением. В течение двух часов с момента слияния до SelfHost весь продукт тестируется, и изменения готовы к внедрению в рабочую среду.

Использование метрик

Команда отслеживает систему показателей, как показано в следующем примере. На высоком уровне система показателей отслеживает два типа метрик: здоровье или долг, а также скорость.

Схема, показывающая систему показателей метрик для отслеживания производительности теста.

Для метрик работоспособности живых сайтов команда отслеживает время обнаружения, время устранения и количество элементов восстановления, которые команда несет. Задача по устранению — это работа, которую команда определяет на ретроспективе текущего сайта с целью предотвращения повторения подобных инцидентов. В карточке оценки также отслеживается, успевают ли команды закрыть ремонтные задачи в разумные сроки.

Для метрик состояния инженерных процессов команда отслеживает активные ошибки на одного разработчика. Если команда имеет более пяти ошибок на каждого разработчика, команда должна определить приоритет исправления этих ошибок до разработки новых функций. Команда также отслеживает устаревающие ошибки в специальных категориях, таких как безопасность.

Метрики скорости проектирования измеряют скорость в разных частях конвейера непрерывной интеграции и непрерывной доставки (CI/CD). Общая цель заключается в увеличении скорости конвейера DevOps: начиная с идеи, получения кода в рабочую среду и получения данных от клиентов.

Дальнейшие шаги

Обратная связь

Были ли сведения на этой странице полезными?

Last updated on 2025-10-27