Нет, конечно никто всерьёз не полагает, что во всём виноват Уоррен Эллис, но, так или иначе, почта Google висела первого сентября в течении почти двух часов (и это официальная информация, в реальности всё было намного хуже). Паника, поднявшаяся в это время, вполне объяснима - многие люди полагаются на этот сервис для общения друг с другом и для работы.
Произошло вот что: утром (по тихоокеанскому времени) персонал перевёл несколько серверов Gmail в оффлайн для осуществления планового апгрейда. Такие вещи происходят часто и никаких страшных последствий обычно за собой не влекут, так как нагрузка перераспределяется на свободные маршрутизаторы.
В этот раз, однако, сотрудники Google недооценили загрузку роутеров, перенаправлявших запросы, в результате чего в 12:30 они оказались перегружены и в результате стали отвергать запросы, что повлекло перенаправление их на свободные маршрутизаторы. Когда и те перегрузились, доступ пользователей к странице Gmail был отрезан, в то время как с доступом по IMAP/POP было всё в порядке поскольку эти сервера работают на собственных мощностях.
Специалисты достаточно быстро поняли в чём дело и перенаправили на Gmail кучу дополнительных маршрутизаторов. Откуда они взялись - можно только гадать, но скорее всего от Google Docs, в которых на время решения проблемы нельзя было создавать новые докуметнты, можно было только просматривать уже имеющиеся.
Сейчас гугловцы клянутся и божатся, что такого больше не повторится. Для этого будут приниматься меры, как то: наращивание мощностей до показателя, существенно превышающего показатель пиковой нагрузки, а также изменение механизма реакции роутеров на перегрузку. Если раньше роутеры просто отвергали запросы в такой ситуации, то теперь им будет позволено тормозить.
Но это отнюдь не первый раз, когда Google падал. Так, например, не так уж и давно, 2 июля, проблемы испытывал другой сервис поискового гиганта - App Engine, который позволяет пользователям размещать свои веб-приложения в инфраструктуре Google. В тот день он висел около трёх часов. Подобное случилось и в мае - поиск работал медленно или вообще лежал, как и YouTube, Gmail, Google Analytics, Google Maps, Google Docs, AdSence и Blogger. Это было вызвано тем, что ошибка одной из систем перенаправила существенную часть траффика через Азию, в результате чего образовалась "пробка", которая и повлекла за собой плачевные последствия.
Возвращаясь к висяку Gmail "в честь" Дня Знаний, можна заметить, что нечто подобное просходило и в 60-х годах прошлого века, когда ещё никто ни о каком Интернете и слыхом не слыхивал. По той же схеме в 1965 году произошло массове отключение электроэнергии сразу в нескольких штатах на северо-западе США. 12 часов около 25 миллионов человек оставались без света.
Всё произошло из-за ошибки на одной из подстанций, когда один из сотрудников поставил на линию защитное реле, слишком занижавшее максимально допустимую мощность, в результате чего и произошло цепное отключение электричества (вспомните, это очень похоже на то, как отключались роутеры Google). Да что там - по похожей схеме произошло и знаменитое московское отключение электроэнергии 2005 года, но тут уже было виновато изношенное оборудование.
С электричеством, конечно, ничего не поделаешь - оно нужно по любому, но что касается веб-сервисов... Чем больше мы полагаемся на веб-приложения, тем больше вверяем свою собственную информацию другим людям и полагаемся не на себя, а на глобальные хранилища данных, которые, как показывает опыт, могут "упасть" в любой момент. Нет, это не призыв писать бумажные письма и слать телеграммы, но что-то делать ведь нужно...
1. Впрочем, нельзя исключить, что один из 10 тысяч будет заниматься госуправлением на стратегическом уровне через двадцать лет. Не раньше.
2. Интересно, что кафедра социальной самоорганизации и государственного управления РАГС была закрыта весной 2008 года, за несколько месяцев до кризиса.
3. О циклах Кондратьева.
4. В США совсем не так. Президент, путающий Боливию с Бразилией или давший основу для общенациональной дискуссии об отношениях боссов с практикантками, может, судя по результатам, прекрасно справляться со своими задачами, в то время как элита страны - со своей ролью. Там отстроена весьма неплохо работающая система.
5. Это ведь очень ясно проявляется у школьников, студентов и слушателей во время тренингов: все хотят играть "за Путина", "за Медведева" и никак не меньше.
1. О младом племени (лат.).
1. Смирнов С. Т90. Первый серийный российский танк. - М., 2002.
2. Свирин М. Броня крепка. История советского танка. 1919-1937 гг. - М., 2005. Цикл книг этого автора можно адресовать не только любителям военной техники, но и всем интересующимся историей технологий вообще.
1. Есть и описание на русском: www.ddwrt.com/wiki/index.php/%D0%94%D0%BE%D0%BA%D1%83%D0%BC%D0%B5%D0%BD%D1%82%D0%B0%D1%86%D0%B8%D1%8F_DDWRT_%28RU%29