Ознакомительная версия.
«Яндекс»
Дата создания: 1997 год.
Адрес: http://www.yandex.ru (полная версия), http://www.ya.ru/ (только поле поиска), http://dzen.yandex.ru/ (только кнопка поиска, для случайного поиска) и т. д.
Если вам нужно выполнить поиск страниц на русском языке, то лучше всего воспользоваться поисковой системой «Яндекс». Уже сейчас эта поисковая система считается одной из лучших систем для поиска страниц на русском и английском языках.
Особенностью «Яндекса» является полная поддержка всех правил морфологии русского языка (она и у поисковой системы Google, однако на данный момент не может похвастаться полнотой и правильностью работы). Таким образом, вам не нужно задумываться над тем, в какой форме или падеже указывать искомое слово. Например, если вы выполните поиск по слову компьютер, то поисковая система отобразит перед вами все страницы, на которых встречаются слова компьютер, компьютера, компьютеры и т. д.
С технической точки зрения данная поисковая система работает следующим образом. Поисковый робот просматривает страницу и составляет предварительный индекс ее содержимого. После этого все русские слова приводятся в нормальную форму (например, для существительных это именительный падеж единственного числа, а для глаголов – неопределенная форма), определяется их расположение на странице и характеристики. Все полученные таким образом сведения заносятся в базу данных индексированных страниц. Благодаря тому что перед индексацией слова переводятся в нормальную форму, достигается сокращение размера базы данных индекса на 30 %.
Правила поиска
По умолчанию запрос, состоящий из нескольких слов, трактуется следующим образом: найти все страницы, которые содержат слова запроса, расположенные недалеко друг от друга. При этом не учитывается фактическое расположение слов поискового запроса. Например, запрос красная шапочка приведет к отображению всех страниц, в которых слово красная и слово шапочка находятся в пределах нескольких предложений, причем совершенно не важно, какое из этих слов будет идти первым.
Расстояние между словами. Если же нужно еще больше расширить область поиска и выполнить поиск страниц, в которых введенные слова встречаются в пределах всей страницы, то следует поставить между словами искомой фразы символы &&.
Вместо оператора && можно воспользоваться оператором <<. Он также расширяет область поиска и выполняет поиск страниц, в которых введенные слова встречаются в пределах всей страницы. Однако при этом слово, которое находится справа от оператора <<, не будет влиять на ранжирование страниц результатов запроса.
Вы можете точно определить максимальное количество предложений, которые будут отделять одно искомое слово от другого. Для этого между словами запроса нужно поставить структуру вида &&/<максимальное количество слов>. Например, по запросу культура &&/2 Россия отобразятся все страницы, в которых слово Россия отделяется от слова культура не более чем двумя предложениями.
Кроме того, поисковая система позволяет искать страницы, в которых введенные слова встречаются в одном предложении. Для этого достаточно поставить между словами искомой фразы символы &. Например, по запросу культура & Россия отобразятся все страницы, содержащие в одном предложении и слово культура, и слово Россия.
Более того, вы можете точно определить максимальное количество слов, которые будут отделять одно искомое слово от другого. Для этого между словами вашего запроса нужно поставить оператор /<максимальное количество слов>. Например, по запросу культура /2 Россия отобразятся все страницы, в которых слово Россия отделяется от слова культура не более чем одним словом.
Усложняя задачу, можно прийти к еще одному виду операторов поисковой системы «Яндекс»: /(<минимальное количество слов> <максимальное количество слов>). С помощью такого оператора выполняется поиск фраз, в которых между словами может находиться не более определенного количества слов и не менее другого такого же определенного количества слов. Например, запрос космическая /(2 3) станция найдет страницы, на которых могут присутствовать фразы вида космическая орбитальная станция, космическая российская орбитальная станция, но при этом не будут найдены страницы, на которых есть фразы вида космическая станция.
Если же вы хотите выполнить поиск по жесткой фразе (то есть найти страницы, содержащие точную фразу, которая совпадает с введенной), то следует взять искомую фразу в кавычки. Например, «красная шапочка».
Порядок слов. Если для вашего запроса важен порядок расположения слов искомой фразы, то при его создании следует воспользоваться несколькими дополнительными возможностями поисковой системы «Яндекс».
Так, чтобы найти слова, которые идут в определенном порядке, достаточно поставить между ними знак + (в прямом порядке) или – (в обратном порядке). Например, при запросе Иван + Тургенев будут найдены все страницы, содержащие фразы вида Иван Тургенев и ни одной страницы с фразами вида Тургенев Иван.
Одной из особенностей поисковой системы «Яндекс» является возможность объединения операторов изменения расстояния между словами и операторов изменения порядка слов. Для этого достаточно поставить оператор порядка слов после знака / операторов изменения расстояния между словами. Например, немного усложним предыдущий запрос: Иван / + 2 Тургенев. С его помощью будут найдены все страницы, в которых между словами Иван и Тургенев находится одно слово. Причем, слово Иван всегда должно стоять перед словом Тургенев.
Теперь взгляните на еще один запрос: Васисуалий /(-1 +2) Лоханкин. Данный запрос отобразит перед вами только те страницы, которые содержат одну из фраз следующего вида:
○ Лоханкин Васисуалий;
○ Васисуалий Лоханкин;
○ Васисуалий <слово> Лоханкин.
Логические операторы. Поисковая система «Яндекс» способна обрабатывать логические операторы типа ИЛИ и НЕ.
Так, для того чтобы выполнить поиск или слова 1, или слова 2, нужно поставить между ними знак |. Например, по поисковому запросу отпуск Лондон | Париж будут отображены все страницы, в которых встречаются слова отпуск Лондон или отпуск Париж.
Если же нужно найти все страницы, на которых нет определенного слова, то следует перед этим словом поставить оператор ~~. Например, запрос компьютерный журнал – CHIP отобразит все страницы, на которых встречаются слова компьютерный и журнал, но нет слова CHIP.
Кроме того, поисковая система «Яндекс» поддерживает еще одну разновидность логического оператора НЕ. Вы можете выполнить поиск страниц, на которых определенное слово не встречается рядом с другими словами поискового запроса (в пределах одного предложения). Иными словами, данное слово может встречаться на странице, однако оно не должно находиться рядом с одним из других слов поискового запроса. Для выполнения такого поиска применяется оператор ~. Например, команда дизайн уроки – услуги выполнит поиск всех страниц, на которых встречаются слова дизайн, уроки или услуги и при этом слово услуги не встречается рядом со словами дизайн или уроки.
Настройка морфологии. По умолчанию поиск всех слов, которые вы указываете, выполняется с учетом морфологии. Если же необходимо выполнить поиск без использования морфологии, то следует поставить перед искомым словом символ !. Например, поиск по фразе ! день отобразит все страницы, на которых присутствует слово день. Такие же страницы, на которых встречаются слова дня, дней, дни (а также деть, денешь и т. д., ведь слово день является и одной из форм слова деть) в результаты поиска не попадут.
Одной из проблем поиска с учетом морфологии является то, что формы некоторых слов могут совпадать. Например, форма день слова день и форма день слова деть. Чтобы решить эту проблему, достаточно указать поиск по слову в нормальной форме. Для этого нужно поставить оператор !! перед словом, расположенным в нормальной форме. Например, запрос !!день найдет все формы данного слова (дня, дню, днем и т. д.) и не найдет форм слова деть.
Зависимости между фразами. Мы рассмотрели способы установления зависимостей между отдельными словами, однако, помимо этого, можно определять зависимости между целыми фразами либо даже между зависимостями слов. Это несложно – достаточно взять отдельную фразу в круглые скобки.
Ознакомительная версия.