Сейчас понятия World Wide Web и Интернет являются практически синонимами. И тем, кто начал пользоваться Сетью в последние годы, невдомек, зачем перед адресом писать замысловатую строку «http://". Многие ее и не пишут, а сразу набирают адрес – и все работает. Я и сам так делаю, но помню времена, когда большая часть информации в Сети была текстовой, а картинки использовались только по делу и очень умеренно. Ни о каких flash-роликах, потоковом видео, mp3-файлах тогда и слыхом не слыхивали. Даже о протоколе FTP ныне знают немногие.
Классика
Взаимодействие браузера с серверами Gopher по простоте напоминает античность. За протоколом до сих пор закреплен 70-й порт TCP. После того как клиент соединился с сервером, он посылает строку, содержащую запрос на нужный документ, либо пустую строку для получения первой страницы сайта. Сервер отвечает и закрывает соединение.
Развитие технологий идет семимильными шагами. Сейчас, при непрерывно возрастающей пропускной способности каналов связи, вроде и странно говорить о «лишней» информации, которой наводнены страницы. Любой сайт, даже перегруженный баннерами и украшенный гениальным дизайном по самую крышу, грузится меньше чем за секунду. Казалось бы, грузи себе и читай. Но не секрет, что среди этой красоты с каждым годом все труднее отыскать нужную информацию.
Маленький несчастный текст статьи на новостных и информационных сайтах теряется и ужимается до узенькой колонки под натиском многочисленных баннеров, меню, ссылок и заголовков. При созерцании всего этого безобразия меня охватывает ностальгия, начинаешь вспоминать тот старый, текстовый Интернет. И понимаешь, что, с одной стороны, такая «примитивность» (по современным меркам) была продиктована скудными техническими возможностями каналов передачи информации, серверов и клиентов. Но с другой – она имела много полезных свойств, которые были утрачены или отринуты на пути стремительного прогресса технологий.
Но не все потеряно, сохранились еще на просторах Интернета оазисы спокойствия и простоты, в которых можно не опасаться назойливой рекламы, надоедливого дизайна и огромных рекламных баннеров. Тихое, гладкое озеро чистой информации, не испорченной городским смогом рекламных технологий. О таких оазисах, а точнее, о том, как их сотворить для себя своими руками, и хотелось бы поговорить в этой статье.
Gopher: немного истории
Кто сейчас помнит о протоколе Gopher? Разве что кучка энтузиастов да любители истории технологий. А в свое время он был широко распространен в Интернете и являлся предшественником World Wide Web. По некоторым данным, до 1995 года Gopher был самой динамично развивающейся технологией Интернета. Темпы роста числа соответствующих серверов опережали темпы роста серверов всех других типов. В 1993 году в мире было более полутора тысяч gopher-серверов.
Gopher фактически являлся системой распределенного поиска и передачи документов одновременно. Причем эти возможности реализовывались не как дополнительные сервисы-надстройки, подобно современным поисковым машинам, а были встроены в систему как ее базовые функции.
Представьте себе Сеть в виде гигантского виртуального диска, содержащего каталоги и файлы (все это называлось «gopher-пространство»). Причем расположены каталоги не хаотически и названы не как попало. Текстовая система ссылок позволяет быстро и без проблем находить нужную информацию.
С помощь специальной программы Veronica непосредственно в системе Gopher осуществлялся поиск с использованием специального языка запросов, построенного на ключевых словах. Напомню, что эта система работала не только задолго до появления современных поисковых систем, но и задолго до появления самого WWW.
Содержимое каждого каталога фактически описывается текстовым файлом, в котором каждая строка – это указатель либо на файл, либо на другой каталог. Строки могут иметь всего пять атрибутов:
• код типа строки или каталога;
• строка описания;
• путь к файлу в файловой системе на сервере;
• доменное имя сервера, на котором расположен файл;
• номер порта сервера.
Первый атрибут состоит из одного символа и определяет, является ли данная строка каталогом («1») или файлом. Если это файл, то код определяет его формат. На серверах Gopher можно хранить текстовые файлы, zip-архивы, html-документы, изображения в различных форматах (по умолчанию поддерживается GIF) и бинарные файлы. Кроме того, файл может являться ссылкой на поисковый или запасной сервер.
По информации Википедии, в настоящее время в Интернете насчитывается меньше сотни gopher-серверов. Большинство из них мертвы и не обновляются владельцами. Но кое-где еще теплится gopher-жизнь. Остались еще энтузиасты, которые поддерживают этот протокол, открывают новые серверы – скорее всего из любви к искусству, ведь технологии ушли далеко вперед. По меткому выражению автора той же статьи в Википедии: «Сегодня Gopher напоминает почти заброшенный уголок Интернета – можно, например, публиковать адреса электронной почты, не беспокоясь о спаме, и публиковать любую информацию, не заботясь об объемах трафика».
Что же делать жаждущим тишины и покоя? В Internet Explorer версий 5 и 6 для Windows поддержка Gopher отключена с июня 2002-го, с выходом патча, предназначавшегося для исправления уязвимости в обработчике протокола Gopher; однако ее можно вернуть, отредактировав реестр. В IE 7 Gopher не поддерживается вообще. Кстати, не исключено, что именно IE помог забить гвоздь в крышку гроба протокола: в этом браузере Gopher выглядит ужасно. Firefox полностью поддерживает Gopher. Для Opera требуется использовать специальный прокси-сервер.
Тем, кто заинтересовался этим протоколом, советую посетить страницу в англоязычной Википедии, которая содержит исчерпывающее количество ссылок и рекомендаций по работе с Gopher в условиях современного Интернета.
Собственные ленты
Существуют способы сломить упрямство владельцев сайтов с RSS, желающих заработать на рекламе и завлечь побольше посетителей. Один из них – создать свою новостную ленту. Я имею в виду не просто аггрегирование новостных лент с других сайтов, а создание ленты на основе контента сайта, на котором экспорт новостей либо не поддерживается, либо осуществляется в неудобном для вас формате.
Сервис по созданию своих rss-лент сегодня предлагают несколько сайтов (например, www feed43.com или www wotzwot com/rssxl php). Принцип работы подобных конвертеров прост: вы задаете некий постоянный адрес страницы, откуда требуется извлечь интересующие вас новости, и с помощью указания характерных участков html-кода выделяете из этой страницы те части, которые попадут в вашу собственную ленту новостей.
Существуют и «настольные» программы, работающие по такому принципу. Причем подобным приложениям не обязательно использовать технологию RSS. Загружаем нужную страницу, по указанным правилам выделяем ссылки на новостные страницы, закачиваем эти страницы и обрабатываем их, дабы удалить мусор, не относящийся к делу. Скажу по секрету: такая программа существует и для закачки номеров бумажного журнала с сайта «Компьютерры» (с попутной очисткой и переформатированием).
Есть универсальные приложения, которые с помощью несложного гибкого конструктора программ загрузки и обработки контента позволяют загружать свежее содержимое практически с любого сайта. Одна из таких программ, которой я пользуюсь не первый год, называется HiTech Informer (W3Get). К сожалению, автор прекратил работу над нею и сайт этой программы исчез из Сети. Но при желании ее можно найти в различных софтверных хранилищах.
Браузер: урезаем лишнее
Утверждается, что самая полная поддержка Gopher реализована в текстовом браузере Lynx. Текстовые браузеры родились вместе с Интернетом. На сайте «Компьютерры» о них уже писалось. Эти программы существуют и поныне, причем неплохо себя чувствуют. Кстати, главная страница сайта Lynx является образцово-показательным примером текстового дизайна.
Просмотр Сети в текстовых браузерах – это еще один способ избавиться от рекламы и лишних элементов страниц. Рекламные технологии ушли далеко вперед, и подавляющая часть онлайновой рекламы является графической. По понятным причинам в окно текстового браузера она не попадет. Таким образом, одно из главных преимуществ рекламы превращается в ее слабое место. Правда, при этом отфильтруется и полезное содержимое графических файлов – фотографии, иллюстрации, диаграммы. На одних сайтах они носят дополнительный, необязательный характер, на других без них не обойтись. Кроме того, на многих сайтах навигация тоже реализована при помощи графических элементов. При этом дизайнеры забывают давать комментарии к картинкам в html-коде. То есть при просмотре таких сайтов с помощью текстового браузера навигация будет фактически недоступной. Это, разумеется, большие неудобства, однако они присущи только отдельным сайтам.