[:ru]Вечером 4 октября по киевскому времени весь мир оказался в ситуации, когда люди не могли зайти в свои любимые сети. Самые популярные сети и сервисы Instagram, WhatsApp, Messenger, Oculus VR не работали. О причинах проблемы НСН расскажет, ссылаясь на Экономическую правду и Общественное.
По данным ресурса Downdetector, проблемы начались около 18:39 по киевскому времени.
Сбои в работе вызвали массовый хаос и повлияли на пользователей по всему миру, кто использует сервисы для общения, особенно для пользователей WhatsApp, а также для компаний и людей, которые полагаются на сайты для ведения бизнеса.
В общем платформы Facebook были недоступны в течение шести-семи часов и начали медленно возвращаться в онлайн после 01:00 по киевскому времени.
“Facebook, Instagram, WhatsApp и Messenger возвращаются в онлайн-режим. Извините за этот срыв сегодня. Я знаю, насколько вы полагаетесь на наши услуги, чтобы оставаться на связи с людьми, которые вам дороги”, – написал на своей странице в FB Марк Цукерберг в 01:54 по киевскому времени.
Что же произошло, и почему возник этот глобальный сбой, уже второй раз за последние два года?
Интернет не знал, где искать facebook.com
Упала даже внутренняя коммуникационная платформа Facebook, Workplace, анонимно сообщил в комментарии для The Washington Post сотрудник соцсети.
Примечательно, что значительное количество рабочих соцсети также потеряло доступ к сторонним инструментам, таким как Slack, потому что механизм Facebook для входа в эти инструменты также не работал.
“Мы знаем, что некоторые люди имеют проблемы с доступом к нашим программам и продуктам. Мы работаем над тем, чтобы как можно скорее нормализовать ситуацию, и приносим извинения за возможные неудобства”, – написал накануне в Twitter директор по коммуникациям Facebook Єнді Стоун.
На 06:00 по киевскому времени в ведущих мировых СМИ отсутствовала достоверная информация о причинах глобального сбоя. Опрошенные технические специалисты выдвигали свои версии того, что происходит.
“Что-то произошло внутри Facebook, что испортило их настройки сети, включая настройки того, как Facebook общается с остальным миром и получает доступ к Интернету”, – сказала The Washington Post старший аналитик по безопасности компании Verica Кортни Нэш.
Похоже, проблема в маршрутах протоколов пограничного шлюза Facebook или путях, которые позволяют маршрутизаторам обмениваться информацией, предположил директор по анализу интернета компании по мониторингу сети Kentik Дуг Медори. Медори называет маршруты протоколов “основой того, как работает Интернет”.
То есть, вероятно, сбой был вызван ошибкой DNS (сервера доменных имен) – это структура имен, что формирует инфраструктуру интернета. То есть, когда пользователи пробовали перейти на facebook.com интернет не знал, где найти facebook.com.
По словам Медори, маршруты Facebook были отменены 4 октября утром (по восточному стандартному времени), и приложения Facebook были невозможно найти в интернете, поскольку эти маршруты содержали адреса серверов систем доменных имен Facebook.
Системы DNS превращают знакомые веб-адреса, такие как facebook.com, в ряд цифр, которые могут читать компьютеры. Когда у серверов возникают проблемы в общении, это может сделать веб-сайты недоступными.
Эту версию подтверждает твит технического директора Facebook Майка Шрепфера, в котором он извинялся и говорил, что “мы чувствуем проблемы с сетью, и команды работают чтобы как можно скорее все наладить и восстановить.
Отладки, которые требуют ручного вмешательства
Телеграмм-канал “Ghost In the Block” обнародовал более подробную интерпретацию предыдущей версии причин падения Facebook и аффилированных платформ.
“В 18: 50 в сети Facebook “раскатали” обновления на все свое сетевое оборудование, которое занималось анонсами BGP (Border Gateway Protocol – протокол динамической маршрутизации), которое объявляет маршрутизацию к их сервисов. Это привело к полной остановке связи между сервисами Facebook, а вместе с этим и прекращении обслуживания их DNS:
Страница входа facebook.com буквально во всем мире около получаса-часа показывала: “Can not resolve domain”. WhatsApp и Instagram также относятся FB и размещаются на их площадке, в связи с чем они также стали недоступны.
Чтобы все наладить, нужно ручное вмешательство: 1. Во все BGP-маршрутизаторы. 2. Во всех датацентрах. 3. Во всех точках присутствия Facebook
Это воплотить в жизнь очень сложно: физического доступа ко всем нужным Цодов (Центров обработки данных) нет, а там, на местах, физически сейчас присутствуют не самые опытные сотрудники, которые дежурят. Их руками приходится проводить манипуляции с большой задержкой, ведь инженеры из главного офиса не могут мгновенно “прилететь” во все необходимые датацентры.
Все осложняется эпидемиологической ситуацией: физическое присутствие персонала в датацентрах сокращенно.
Кроме того, у сотрудников Facebook из-за столь масштабных проблем стали недоступны внутренние средства коммуникации. По этой причине они вынуждены координировать все работы через другие платформы, что также замедляет решение проблемы.
Сервисы не работают слишком долго, поэтому аудитория Facebook, Instagram & WhatsApp плавно перетекает в другие сети и мессенджеры, которые переживают очень резкий наплыв трафика, что выглядит со стороны как замедление их работы”, – отмечалось в сообщении.
Так, после глобального сбоя в Facebook, Whatsapp и Instagram также начались перебои в работе мессенджера Telegram.
Telegram сообщил в Twitter, что “рад, что все зарегистрированные учетные записи переходят с WhatsApp, но серверам сложно справиться со всем сразу”.
Сотрудники Facebook потеряли внутренние системы коммуникации
Внутри Facebook отключения нарушили почти все внутренние системы, которые сотрудники используют для общения и работы. Несколько сотрудников социальной сети рассказали The Verge, что они прибегли к услугам электронной почты Outlook, хотя сотрудники не могут получать электронные письма с внешних адресов.
Сотрудники, которые до отключения были зарегистрированы в таких инструментах как Документы Google и Zoom, длительное время не могли ими пользоваться. Любой работник, которому нужно было войти с помощью своей рабочей электронной почты, блокировался.
По словам двух человек, знакомых с ситуацией, инженеры Facebook были отправлены в центры обработки данных компании в США, чтобы попытаться решить проблему на месте.
Официальное заявление
Утром 5 октября появилось официальное заявление о причинах сбоя сетей. Его обнародован на сайте компании Facebook.
Сбой в работе сервисов от Facebook был вызван неправильной сменой конфигурации на магистральных маршрутизаторах. Данные пользователей не пострадали, – говорится в заявлении.
Представители компании уверяют, что серверы уже снова подключены к сети и в Facebook активно работают над тем, чтобы полностью вернуть их к обычной работы.
Отмечается, что инженеры компании выяснили, что причиной сбоя стали изменения конфигурации на магистральных маршрутизаторах, которые отвечают за координацию сетевого трафика между центрами обработки данных.
«В настоящее время мы хотим прояснить, что, по нашему мнению, основной причиной этого сбоя было неправильное внесение изменений в конфигурации … У нас также нет доказательств того, что пользовательские данные были скомпрометированы в результате этого сбоя», — убеждают в Facebook.
Там извинились перед пользователями и заверили, что работают над тем, чтобы лучше понять проблему и обеспечить более устойчивую инфраструктуру.
Марк Цукерберг обеднел
Компания на триллион долларов, которая может похвастаться 2,9 миллиардами активных пользователей ежемесячно, не работала по меньшей мере шесть часов, пишет TechCrunch.
В то же время акции Facebook снизились примерно на 5,5%. Это снижение произошло в рамках более глобальной тенденции снижения акций, вызванной тем, что Facebook оказался под контролем в Сенате США после того, как разоблачитель информации Фрэнсис Хауген передала внутренние документы социальной сети в The Wall Street Journal.
В свою очередь издание опубликовало большую статью о том, что Instagram существенно негативно влияет на психическое здоровье подростков, особенно девушек и в Facebook об этом хорошо известно.
Сообщается, что в результате снижения стоимости акций владелец компании Марк Цукерберг потерял около 7 миллиардов долларов и опустился на шестую позицию в рейтинге миллиардеров.
Это уже второй сбой
Стоит также напомнить, что первый крупнейший сбой в истории Facebook пережил 14 марта 2019 года. Тогда сервисы Facebook, Instagram, WhatsApp “упали” по всему миру более чем на 14 часов. Все это время главные информационные платформы для многих людей оказались недоступны.
Тогда, в ответ на слухи, опубликованные в других социальных сетях, компания заявила, что сбои не были результатом DDoS-атаки, которая нагружает целевые службы чрезвычайно большими объемами трафика.
Телеканал NBC News со временем сообщил, что причина была связана с “перегруженными” базами данных.
Кстати, недавно “НСН” писал:
Instagram, Facebook та WhatsApp не працюють – стався масштабний збій (оновлюється)
Жінка вважає, що причина головного болю сина -вакциновані вчителі
В Україні знову дорожчає мобільний зв’язок – в чому причина
[:ua]Увечері 4 жовтня за київським часом весь світ опинився в ситуації, коли люди не могли зайти у свої улюблені мережі. Найпопулярніші мережі і сервіси Instagram, WhatsApp, Messenger, Oculus VR не працювали. Про причини проблеми НСН розповість, посилаючись на Економічну правду та Громадське.
За даними ресурсу Downdetector, проблеми почалися близько 18:39 за київським часом.
Збої в роботі викликали масовий хаос і вплинули на користувачів по всьому світу, хто використовує сервіси для спілкування, особливо для користувачів WhatsApp, а також для компаній і людей, які покладаються на сайти для ведення бізнесу.
Загалом платформи Facebook були недоступні протягом шести-семи годин і почали повільно повертатися в онлайн після 01:00 за київським часом.
“Facebook, Instagram, WhatsApp і Messenger повертаються в онлайн-режим. Вибачте за цей зрив сьогодні. Я знаю, наскільки ви покладаєтеся на наші послуги, щоб залишатися на зв’язку з людьми, які вам дорогі”, – написав на своїй сторінці в FB Марк Цукерберг о 01:54 за київським часом.
Що ж сталось, і чому виник цей глобальний збій, уже вдруге за останні два роки?
Інтернет не знав, де шукати facebook.com
Впала навіть внутрішня комунікаційна платформа Facebook, Workplace, анонімно повідомив в коментарі для The Washington Post вочевидь співробітник соцмережі.
Примітно, що значна кількість робітників соцмережі також втратила доступ до сторонніх інструментів таких, як Slack, тому, що механізм Facebook для входу в ці інструменти також не працював.
“Ми знаємо, що деякі люди мають проблеми з доступом до наших програм та продуктів. Ми працюємо над тим, щоб якомога швидше нормалізувати ситуацію, і приносимо вибачення за можливі незручності”, – написав напередодні в Twitter директор по комунікаціям Facebook Єнді Стоун.
На 06:00 за київським часом у провідних світових ЗМІ була відсутня достовірна інформація про причини глобального збою. Опитані технічні спеціалісти висували свої версії того, що відбувається.
“Щось сталося всередині Facebook, що зіпсувало налаштування їх мережі, зокрема настройки того, як Facebook спілкується з рештою світу та отримує доступ до Інтернету”, – сказала The Washington Post старший аналітик з безпеки компанії Verica Кортні Неш.
Схоже, проблема в маршрутах протоколів прикордонного шлюзу Facebook або шляхах, які дозволяють маршрутизаторам обмінюватися інформацією, припустив директор з аналізу інтернету компанії з моніторингу мережі Kentik Дуг Медорі. Медорі називає маршрути протоколів “основою того, як працює Інтернет”.
Тобто, вірогідно збій був викликаний помилкою DNS (сервера доменних імен) – це структура імен, що формує інфраструктуру інтернету. Тобто, коли користувачі пробували перейти на facebook.com, інтернет не знав, де знайти facebook.com.
За словами Медорі, маршрути Facebook були скасовані 4 жовтня вранці (за східним стандартним часом), і програми Facebook неможливо були знайти в інтернеті, оскільки ці маршрути містили адреси серверів систем доменних імен Facebook.
Системи DNS перетворюють знайомі веб-адреси, такі як facebook.com, у ряд цифр, які можуть читати комп’ютери. Коли у серверів виникають проблеми у спілкуванні, це може зробити веб-сайти недоступними.
Цю версію підтверджує твіт технічного директора Facebook Майка Шрепфера, в якому він вибачався і казав, що “ми відчуваємо проблеми з мережею, і команди працюють якомога швидше для налагодження та відновлення”.
Налагодження, яке потребує ручного втручання
Телеграм-канал “Ghost In the Block” оприлюднив більш детальну інтерпретацію попередньої версії причин падіння Facebook і афільованих платформ.
“О18: 50 в мережі Facebook “розкатали” оновлення на все своє мережеве обладнання, яке займалося анонсами BGP (Border Gateway Protocol – протокол динамічної маршрутизації), яке оголошує маршрутизацію до їх сервісів. Це призвело до повної зупинки зв’язку між сервісами Facebook, а разом з цим і припинення обслуговування їх DNS:
Сторінка входу на facebook.com буквально у всьому світі близько півгодини-години показувала: “Can not resolve domain”. WhatsApp і Instagram також належать FB і розміщуються на їх майданчику, в зв’язку з чим вони також стали недоступні.
Щоб все налагодити, потрібне ручне втручання: 1. У всі BGP-роутери. 2. У всіх датацентрах. 3. У всіх точках присутності Facebook
Це втілити у життя дуже складно: фізичного доступу до всіх потрібних ЦОДів (Центрів обробки даних) немає, а там, на місцях, фізично зараз присутні не найдосвідченіші співробітники, які чергують. Їх руками доводиться проводити маніпуляції з великою затримкою, адже інженери з головного офісу не можуть миттєво “прилетіти” в усі необхідні датацентри.
Все ускладнюється епідеміологічною ситуацією: фізичну присутність персоналу в датацентрах скорочено.
Крім того, у співробітників Facebook через настільки масштабні проблеми стали недоступні внутрішні засоби комунікації. З цієї причини вони змушені координувати всі роботи через інші платформи, що також уповільнює вирішення проблеми.
Сервіси не працюють занадто довго, тому аудиторія Facebook, Instagram & WhatsApp плавно перетікає в інші мережі і месенджери, які переживають дуже різкий наплив трафіку, що виглядає з боку як уповільнення їх роботи”, – зазначалось в повідомленні.
Так, після глобального збою в Facebook, Whatsapp та Instagram також почалися перебої в роботі месенджера Telegram.
Telegram повідомив у Twitter, що “радий, що усі зареєстровані облікові записи переходять з WhatsApp, але серверам складно впоратися з усім відразу”.
Співробітники Facebook втратили внутрішні системи комунікації
Всередині Facebook відключення порушило майже всі внутрішні системи, які співробітники використовують для спілкування та роботи. Кілька співробітників соціальної мережі розповіли The Verge, що вони вдалися до розмов через свої надані роботою облікові записи електронної пошти Outlook, хоча співробітники не можуть отримувати електронні листи із зовнішніх адрес.
Співробітники, які до відключення були зареєстровані в таких інструментах як Документи Google і Zoom, тривалий час не могли ними користуватися. Будь-який працівник, якому потрібно було увійти за допомогою своєї робочої електронної пошти, блокувався.
За словами двох людей, знайомих з ситуацією, інженери Facebook були відправлені до центрів обробки даних компанії в США, щоб спробувати вирішити проблему на місці.
Офіційна заява
Вранці 5 жовтня з’явилася офіційна заява про причини збою мереж. Її оприлюднено на сайті компанії Facebook.
Збій в роботі сервісів від Facebook був викликаний неправильною зміною конфігурації на магістральних маршрутизаторах. Дані користувачів не постраждали, – мовиться в заяві.
Представники компанії переконують, що сервери вже знову підключені до мережі і у Facebook активно працюють над тим, щоб повністю повернути їх до звичайної роботи.
Відзначається, що інженери компанії з’ясували, що причиною збою стали зміни конфігурації на магістральних маршрутизаторах, які відповідають за координацію мережевого трафіку між центрами обробки даних.
«На цей час ми хочемо прояснити, що, на нашу думку, основною причиною цього збою було неправильне внесення змін до конфігурації … У нас також немає доказів того, що призначені для користувача дані були скомпрометовані в результаті цього збою», — переконують у Facebook.
Там вибачилися перед користувачами і запевнили, що працюють над тим, щоб краще зрозуміти проблему та забезпечити більш стійку інфраструктуру.
Марк Цукерберг збіднів
Компанія на трильйон доларів, яка може похвалитися 2,9 мільярдами активних користувачів щомісяця, не працювала щонайменше шість години, пише TechCrunch.
У той же час акції Facebook знизилися приблизно на 5,5%. Це зниження відбулося в межах більш глобальної тенденції зниження акцій, викликаної тим, що Facebook опинився під контролем у Сенаті США після того, як викривач інформації Френсіс Хауген передала внутрішні документи соціальної мережі до The Wall Street Journal.
В свою чергу видання оприлюднило велику статтю про те, що Instagram суттєво негативно впливає на психічне здоров’я підлітків, особливо дівчат і в Facebook про це добре відомо.
Повідомляється, що в результаті зниження вартості акцій власник компанії Марк Цукерберг втратив близько 7 мільярдів доларів і опустився на шосту позицію у рейтингу мільярдерів.
Це вже другий збій
Варто також нагадати, що перший найбільший збій у своїй історії Facebook пережив 14 березня 2019 року. Тоді сервіси Facebook, Instagram, WhatsApp “впали” по всьому світу більш ніж на 14 годин. Увесь цей час головні інформаційні платформи для багатьох людей виявилися недоступними.
Тоді, у відповідь на чутки, опубліковані в інших соціальних мережах, компанія заявила, що збої не були результатом DDoS-атаки, яка навантажує цільові служби надзвичайно великими обсягами трафіку.
Телеканал NBC News згодом повідомив, що причина була пов’язана з “перевантаженими” базами даних.
До речі, нещодавно “НСН” писав:
Instagram, Facebook та WhatsApp не працюють – стався масштабний збій (оновлюється)
Жінка вважає, що причина головного болю сина -вакциновані вчителі
В Україні знову дорожчає мобільний зв’язок – в чому причина[:]