Крупный сбой в работе AT&T в этом году оказался хуже, чем мы думали

Крупный сбой в работе AT&T в этом году оказался хуже, чем мы думали

Как давний клиент AT&T и человек, который полагался на их сеть как для личного, так и для профессионального общения, я был глубоко разочарован и расстроен массовым сбоем в работе, который затронул более 125 миллионов устройств еще в феврале. Последствия этого сбоя вышли далеко за рамки простого неудобства: было заблокировано более 92 миллионов голосовых вызовов и предотвращены тысячи вызовов в 911 колл-центров.


22 февраля этого года в AT&T произошло крупное обновление сети, которое, к сожалению, пошло не так, как надо, что привело к обширному сбою в работе сети. Появилась новая информация, указывающая на то, что масштабы этого нарушения оказались больше, чем предполагалось первоначально.

Согласно отчету FCC, у клиентов беспроводной связи AT&T возникли сбои в работе более 125 миллионов устройств, в результате чего было заблокировано более 92 миллионов голосовых вызовов и предотвращено около 25 000 вызовов служб экстренной помощи в 911 центров.

Как технический энтузиаст, я не могу не подчеркнуть, насколько неприятно сталкиваться с проблемами в системе 911 во время чрезвычайной ситуации. Это последнее, чего бы вам хотелось – попытаться обратиться за помощью, а вместо этого услышать молчание. Отчет FCC проливает некоторый свет на ситуацию, показывая, что AT&T отдала приоритет восстановлению FirstNet, сети, предназначенной для служб экстренного реагирования, а не частных и коммерческих пользователей. С моей точки зрения, это кажется логичным решением. В конце концов, те, кто ежедневно рискует ради нас своей жизнью, заслуживают не меньше, чем надежную систему связи.

Крупный сбой в работе AT&T в этом году оказался хуже, чем мы думали

FCC выявила множество проблем, связанных с реализацией AT&T изменений в сети, выходящих за рамки простых неудачных испытаний. Регулирующий орган раскритиковал AT&T за неадекватный надзор и проверки, гарантирующие соблюдение процедур или адекватность этих самых процедур. Более того, компания AT&T оказалась недостаточно подготовленной к массовым перегрузкам, вызванным попытками пользовательских устройств одновременно повторно подключиться, что свидетельствует о том, что сети не хватает достаточной устойчивости для эффективного управления такими ситуациями.

Как опытный инженер по телекоммуникациям с многолетним опытом работы за плечами, я твердо убежден, что следование установленным процедурам не подлежит обсуждению, когда дело касается сетевых операций. Недавнее отключение сети AT&T, затронувшее все 50 штатов и территорий, включая Вашингтон, Пуэрто-Рико и Виргинские острова США, стало ярким напоминанием об этом факте.

Если эта ситуация кажется несколько повторяющейся, то это связано с ее поразительным сходством с недавними инцидентами. На прошлой неделе в Microsoft произошел массовый сбой, вызванный ошибочным обновлением с непроверенным кодом, похожий на неудачу с Crowdstrike. Verizon столкнулся с аналогичной проблемой еще в декабре 2022 года, что привело к штрафу FCC и постановлению о согласии из-за дефектного файла обновления.

Похвально, что AT&T признала ответственность за сбой и компенсировала пострадавшим клиентам кредит в размере 5 долларов, хотя это и скудная сумма по сравнению с большинством телефонных счетов. С другой стороны, ситуация может привести к более суровым последствиям со стороны FCC, поскольку Бюро общественной и внутренней безопасности начнет расследование потенциальных нарушений правил FCC со стороны перевозчика.

Крупный сбой в работе AT&T в этом году оказался хуже, чем мы думали

Если AT&T будет привлечена к ответственности, ей может грозить более крупный штраф и необходимость разработать план корректирующих действий, аналогично опыту Verizon в начале 2023 года, когда она выплатила штраф в размере 1,05 миллиона долларов после перерыва в обслуживании в декабре 2022 года. В ответ на сбой AT&T в течение двух дней оперативно ввела в действие новые технические меры безопасности.

FCC заявила, что AT&T провела тщательное расследование, выявив любые сетевые компоненты, не имеющие необходимых мер безопасности, которые могли бы предотвратить сбой. Сразу после этого открытия они внедрили эти меры контроля. Кроме того, AT&S продолжила судебно-медицинский анализ и внесла дальнейшие улучшения для укрепления и усиления своей сети. Компания также ввела новые процедуры, гарантирующие, что работы по техническому обслуживанию могут начаться только после завершения необходимых экспертных проверок.

Основываясь на моем обширном опыте работы в сфере высоких технологий и наблюдении за многочисленными сбоями в работе систем на протяжении многих лет, я считаю, что принятие мер AT&T по предотвращению будущих сбоев является похвальным шагом. Однако тот факт, что такие сбои, похоже, широко распространены во всей отрасли, вызывает беспокойство. Этот недавний инцидент служит ярким напоминанием о потенциальных последствиях быстрого обновления программного обеспечения без надлежащего тестирования.

Смотрите также

2024-07-24 19:27