CrowdStrike обвиняет ошибки тестирования в обновлении безопасности, из-за которого вышло из строя 8,5 млн компьютеров с Windows

CrowdStrike обвиняет ошибки тестирования в обновлении безопасности, из-за которого вышло из строя 8,5 млн компьютеров с Windows


CrowdStrike обвиняет ошибки тестирования в обновлении безопасности, из-за которого вышло из строя 8,5 млн компьютеров с Windows

Как технический энтузиаст с многолетним опытом работы в сфере ИТ и кибербезопасности, я не могу не почувствовать смесь разочарования и беспокойства, прочитав о неудачном обновлении CrowdStrike, которое вызвало массовые сбои в минувшие выходные. Влияние на миллионы ПК с Windows было значительным: от задержек рейсов до сбоев в работе систем реагирования на чрезвычайные ситуации – это напоминание о том, насколько важно, чтобы обновления программного обеспечения тщательно тестировались и развертывались контролируемым образом.


CrowdStrike опубликовала предварительный отчет об инциденте после ошибочного обновления их решения безопасности Falcon, которое затронуло около 8,5 миллионов компьютеров Windows, что привело к задержкам рейсов, сбоям в работе экстренных служб и повсеместному хаосу в выходные.

Как технический энтузиаст, я бы объяснил это так: около полуночи по восточному времени CrowdStrike выпустила «обновление конфигурации контента» для сбора данных о новых тактиках угроз. Эти обновления контента Rapid Response перед выпуском проходят тщательное тестирование, которое включает в себя их запуск с помощью инструмента под названием Content Validator. К сожалению, в средстве проверки контента произошел сбой, который не уловил проблемные данные контента, скрытые в этом конкретном обновлении, что привело к сбоям в работе системы.

CrowdStrike предпринимает шаги по совершенствованию процедур тестирования, чтобы избежать подобных инцидентов в будущем. Фирма внедряет дополнительные меры проверки в свой Валидатор контента и расширяет этапы тестирования.

Ожидается, что наиболее значительным изменением станет принятие в будущем подхода постепенного выпуска контента быстрого реагирования. При использовании этого метода первоначальный выпуск предоставляется ограниченному числу компьютеров, а затем доступность обновления постепенно расширяется, как только оно демонстрирует минимальные проблемы. Microsoft применила эту стратегию для обновлений безопасности и функций Windows после некоторых серьезных инцидентов, произошедших в период существования Windows 10. Чтобы облегчить поэтапное внедрение, CrowdStrike планирует расширить возможности мониторинга производительности датчиков и системы.

CrowdStrike объявляет об улучшенном контроле обновлений для своих клиентов, что позволяет им выбирать время для развертывания обновлений контента Rapid Response Content. Эта функция предотвращает массовые сбои в работе системы, вызванные обновлениями, развернутыми в нерабочее время, например в полночь, когда доступно меньше персонала. Кроме того, клиенты могут подписаться на уведомления с подробным описанием примечаний к выпуску обновлений.

Постоянное восстановление: системы, в которых возникли проблемы, восстанавливаются различными методами. Многократные перезагрузки системы, в некоторых случаях до пятнадцати (предложение Microsoft), дают им возможность получить свежий, неповрежденный файл обновления до сбоя, тем самым решая проблему. Microsoft также разработала инструменты для запуска загрузки системы с USB или сетевых источников. Эти инструменты позволяют удалить дефектный файл обновления, обеспечивая нормальную перезагрузку системы.

После этого первоначального отчета об инциденте CrowdStrike поделится всесторонним анализом основной причины, когда наше расследование будет завершено.

Смотрите также

2024-07-24 21:54