Supplemental Results — дополнительные результаты поиска. Термин появился в поисковой системе Google, когда сайтов в поиске стало достаточно много. По запросу выдавались страницы, которые были определены системой как наиболее информативные, а в конце выдачи давалась ссылка на дополнительные результаты поиска. В эту категорию обычно попадали страницы с малым объемом текста, со случайным единичным вхождением слов запроса, полные и нечеткие дубликаты страниц — словом, все то, что обычно не имеет ценности для поиска. Но если уж среди полноценных страниц ничего нужного найти не удалось, пользователю предлагалось порыться еще и в дополнительных результатах.
В русском SEO, как это часто бывает, термин Supplemental Results был сокращен до презрительного «сопли». А как еще относиться к страницам, которые в поиске практически не участвуют?
В 2007 году Google официально объявил об упразднении Supplemental Results. Упразднение объяснялось тем, что поисковая система больше не нуждается в искусственном разделении результатов. Казалось, что остается просто забыть об этом явлении. Но, как это часто бывает, информация для публики не была полной и точной. При отсутствии точной информации всегда появляются мифы. А уж любое несоответствие официальных заявлений реальности порождает мифы просто автоматически.
Как известно, в кругах людей, близких к SEO, но далеких от программирования, индексом поисковой системы часто называют всю ее базу данных. Хотя индекс — лишь отдельная структура данных, удобная для быстрого поиска. Так или иначе, существование дополнительных результатов поиска породило предположение о существовании отдельных индексов для основных и дополнительных результатов. Так появился термин Supplemental Index, о существовании которого Google никогда не заявлял. Больше того, этот термин широко распространился именно с отменой Supplemental Results в выдаче.
Нельзя с уверенностью сказать, был ли когда-нибудь индекс физически разделен на две такие части. С точки зрения самого процесса поиска это представляется выгодным — всегда быстрее делать выборку в базе меньшего размера, поэтому отделение «малоценных» страниц теоретически могло бы ускорить поиск. Но при этом процесс подготовки и апдейтов для двух индексов очень сильно усложняется. При каждом апдейте какие-то страницы из-за изменения содержания придется переносить из одного индекса в другой, при этом внося поправки во все связанные с индексами структуры данных. Легко представить ситуацию, когда одна и та же страница по одним запросам может быть отнесена к основным результатам, а по другим — только к дополнительным. Все это сильно усложняет построение и апдейты разделенных индексов. В итоге перерасход вычислительных ресурсов на обслуживание индексов окажется намного больше, чем экономия на обработке поисковых запросов.
Для эффективной работы поисковой системы вполне достаточно логического «разделения», когда запись в базе снабжается соответствующей меткой. Это позволяет не тратить зря ресурсы и время на перенос записей из одной базы другую. Такое разделение нужно, чтобы не возиться с ранжированием заведомо «слабых» страниц, мало соответствующих запросу. Тем не менее, миф о разделенном индексе оказался живучим. Этому способствовали «хитрые операторы» для определения принадлежности страниц к «основным» результатам.
Оператор представлял собой дополнение к оператору site:domain.tld для просмотра проиндексированных страниц сайта. Отдельно не применялся. Полностью запрос выглядел так:1)
site:domain.tld -inallurl:domain.tld
Позднее были найдены аналоги в виде опций к оператору site:2)
site:domain.tld/* site:domain.tld/&
По легенде, такой запрос, в отличие от просто site:domain.tld, позволял получить список не всех страниц сайта, а только тех, что отнесены к «основному индексу».
Происхождение информации неизвестно. Старательно просеивая Сеть, так и не удалось найти, где впервые была вброшена информация об этом операторе поиска. В официальном списке поисковых опций Google он никогда не появлялся. Тем не менее, все его упоминания появились не раньше 2007 года — того самого года, когда Google официально отказался от дополнительных результатов поиска. Вопрос об этом операторе собрал, наверное, самое большое число уклончивых ответов от сотрудников Google. Смысл ответов сводился к заявлению, что такого оператора не существует вообще, а то, что выдается при его применении, не имеет никакого смысла.
Тем не менее, смысл очевидным образом присутствовал. Выдача по таким запросам не была случайной, состав списка при неизменности страниц сайта оставался стабильным. Страницы, не входившие ранее в выдачу по такому запросу, могли появиться в этом списке, если их текстовое наполнение наращивалось или улучшалось. «Сопливая» страница могла появиться в списке после появления весомых ссылок на нее. И наоборот, при уменьшении наполнения до незначительного объема страница могла уйти из списка. Выборочные сквозные проверки сайтов показали также, что страницы, не попавшие в «основной» список, практически не показывались в поиске и для них не рассчитывался тулбарный PageRank.
Возможность увидеть, как Google сортирует страницы, привела к строительству всевозможных сервисов. Наиболее известный из них — на mapelli.info 3). Естественно, этими сервисами пользовались достаточно интенсивно, Google получал большое количество автоматических запросов такого рода и время от времени блокировал операторы поиска «страниц без соплей». В конце концов оператор inallurl: был убран, а затем прекратила работать и опция /*.