Глобалното прекъсване на Fastly: Ето какво се обърка

Мрежата за доставяне на съдържание (CDN) набързо обясни основния си прекъсване вчера, което изби много от най-добрите уебсайтове в света, от Amazon до ZDNet.

Широчината на прекъсването демонстрира още веднъж, че CDN, които носят съдържание на крайните потребители от глобално разпределени точки на присъствие (POP), също могат да бъдат единична точка на отказ.

Бързо има POPs по целия свят работи на твърди дискове (SSD), които съставляват своя „облачен облак“ за доставяне на уеб съдържание от центрове за данни, които са по-близо до крайните потребители. Вместо директен достъп до сървърите на уебсайт, потребителите имат достъп до кеша на сайта от кеш памет, поддържана от CDN.

ВИЖТЕ: Политика за мрежова сигурност (TechRepublic Premium)

Неговото глобално прекъсване вчера за кратко попречи на уеб потребителите да имат достъп до The Guardian, Financial Times, The New York Times, ZDNet, Reddit, Twitch, Amazon, PayPal и уебсайта на правителството на Обединеното кралство gov.uk.

Ник Рокуел, старши вицепрезидент на инженеринга на Fastly, каза, че едночасовият прекъсване се е случил, защото клиент е прокарал промяна в конфигурацията, която е предизвикала неоткрита програмна грешка.

Рокуел не обяснява какво точно се е случило, освен че на 12 май компанията внедри софтуерна актуализация, която „въведе грешка, която може да бъде задействана от конкретна конфигурация на клиента при конкретни обстоятелства“.

Тогава вчера, 8 юни, клиент прокара промяна в конфигурацията, която отговаря на условията, за да задейства грешката, която накара 85% от мрежата да върне грешки. Крайните потребители, посещаващи засегнатите сайтове, видяха съобщението за грешка „Грешка 503 не е налична“ в браузърите.

Вчера бързо заяви, че проблемът кара клиентите да видят “увеличено натоварване на произхода и по-ниско съотношение на удара в кеша (CHR)”. CHR е мярка за това колко заявки може да достави кеш в сравнение с това колко искания получава.

“След като непосредствените ефекти бяха смекчени, насочихме вниманието си към отстраняването на грешката и комуникацията с нашите клиенти. Създадохме постоянна корекция на грешката и започнахме да я разгръщаме в 17:25”, каза Рокуел.

Прекъсването започна в 9:47 UTC.

Fastly е седмият по големина доставчик на CDN, следвайки Google, Cloudflare, F5, Amazon CloudFront и jsDelivr, според Datanyze.

ВИЖТЕ: GDPR: Глобите се увеличиха с 40% миналата година и те скоро ще станат много по-големи

Капакът на CDN е, че когато те паднат, както направи Cloudflare през 2019 г. – поради промяна на конфигурацията на бъги – потребителите не могат да имат достъп до уебсайтове, които разчитат на CDN за доставяне на съдържание.

Рокуел призна, че компанията е трябвало да види тази грешка, преди клиентът случайно да я задейства. Той също се извини на клиентите.

“Въпреки че имаше конкретни условия, които предизвикаха това прекъсване, трябваше да го предвидим. Предоставяме критично важни услуги и се отнасяме към всякакви действия, които могат да причинят проблеми с обслужването, с изключителна чувствителност и приоритет”, пише той.

„Извиняваме се на нашите клиенти и тези, които разчитат на тях за прекъсването, и искрено благодарим на общността за подкрепата.“

Публикациите се превеждат автоматично с google translate

Източник: www.zdnet.com