Ранжированием (от франц. ranger — выстраивать в ряд) называется упорядочение элементов множества по их значимости (рангу). Например, сортировка памятных дат по возрастанию/убыванию. Или выстраивание списка в алфавитном порядке. Или выстраивание шеренги матрёшек по росту. Применительно к поисковой выдаче ранжированием называют построение списка страниц, найденных по запросу. Поисковая система расставляет найденные документы по своим правилам. Цель ранжирования – представить в начале списка документы, наиболее соответствующие ожиданиям пользователя.
На практике распознать реальные ожидания пользователя не всегда можно (и чаще всего это невозможно вообще). В большинстве случаев по запросу нельзя угадать, какого рода информацию хочет найти пользователь. Поэтому найденные документы ранжируются по набору формальных признаков, что позволяет получить статистически приемлемые1) результаты.
Релевантность запросу — самый первый и важный критерий ранжирования. Без неё все остальные критерии просто бесполезны. Тем не менее, с ростом численности сайтов неизбежно возникает вопрос, какую из множества одинаково релевантных страниц показывать в выдаче выше.
Авторитетность — как найденного документа, так и сайта, где он находится — следующий критерий, который позволил эффективно ранжировать документы с одинаковой релевантностью. Авторитетность определяется ссылочной популярностью (Link Popularity) документа.
Это почти мифология SEO. О трастовой составляющей оптимизаторами всех мастей написано множество антинаучно-фантастических статей, постов и комментариев. Но вся эта информация — эмпирика, домыслы и измерения невидимого удава в неопределенных попугаях. Если принципы ссылочного ранжирования подробно разъяснены самими же разработчиками, то о трасте сотрудники поисковиков предпочитают ничего не говорить. Тем не менее, траст существует. Мы верим.
Во многих случаях при ранжировании отдается предпочтение документам, содержащим наиболее свежую информацию по тематике запроса. Если, конечно, её свежесть вообще можно как-то определить.
Сайтов по любой тематике уже развелось так много, что перечисленных критериев стало не хватать для уверенной сортировки сетевого мусора. Поэтому поисковые системы все активнее придираются к качеству исполнения сайтов.
Самый новый критерий, который пока не очень уверенно применяется — это отслеживание поведения пользователей. В последние годы поисковые системы учитывают все переходы на сайты со своих страниц выдачи, а также (в меру возможностей) действия пользователей на сайтах. Это позволяет им делать выводы о предпочтениях пользователей.