Есть мнение, что фильтров у поисковых систем не существует,1) и то, что мы принимаем за фильтры - это всего лишь работа алгоритма поисковой системы. Это и верно, и не верно. Существуют фильтры или, вернее - санкции, которые официально анонсированы поисковыми системами. Часто - это некий дополнительный «обвес» алогитма, который запускается эпизодически, обычно в апдейты поисковой базы, а иногда и независимо от апдейта.
Причина резкого расхождения мнений о фильтрах проста. Это очень частый в SEO случай неверного использования терминологии. А неверное использование терминов постоянно порождает путаницу.
Фильтр — это программный механизм, проверяющий соответствие данных какому-то условию. Например, при разборе содержимого страницы «отфильтровываются» все ссылки, но наличие ссылок на странице — еще не повод ее «наказывать». Другой фильтр ищет и подсчитывает на странице вхождения известных поисковых запросов. И так далее. Каждый фильтр выбирает какие-то данные, которые нужны ПС для оценки страницы. Но ни один фильтр не является карательным механизмом, все они только собирают сведения.
А после выборки сведений всеми фильтрами результаты оцениваются другим алгоритмом (его можно условно назвать «арбитром»). По сочетаниям каких-то найденных признаков он может принимать решения искусственно понизить релевантность страницы, или вообще убрать ее из выдачи. Продолжим пример: если фильтр для выборки поисковых запросов обнаружил их на странице больше допустимого количества, а отношение объема всего текста к объему этих запросов оказалось маловато — значит, скоро вебмастер будет писать возмущенное письмо Платону Щукину, а в ответ получит сообщение «на некоторых страницах Вашего сайта обнаружены списки поисковых запросов, из-за них мы не можем его нормально ранжировать… поэтому Ваш сайт пошел в баню».
У всех поисковых систем такое явление называется санкциями (или, говоря по-русски, мерами воздействия). Почему в массах оптимизаторов они часто называются фильтрами — трудно сказать. Наверное, слово очень понравилось. Звучит «солидно и научно»…
Достоверно известно, что:
Все обращения к сотрудникам ПС с упоминанием фильтров («фильтр аффилиатов», «фильтр Ты Последний» и тому подобное) кончаются одинаковым ответом: «такого фильтра не существует». И с формальных позиций отвечающие совершенно правы. Нет у них фильтров, и не спрашивайте их о фильтрах. Алгоритмы есть, но алгоритмы они не обсуждают. Это еще одна причина всегда использовать терминологию корректно и по назначению — тогда Платонам Щукиным будет труднее отмахиваться от ваших вопросов.
Но поскольку большинство оптимизаторов говорит именно о фильтрах, мы в данной статье используем это слово, да и найти ее будет легче — статистику поисковых запросов еще никто не отменял.
Бан в поисковой системе. В этом случае содержимое сайта полностью пропадает из индекса. Часто накладывается на весь домен, а в особо злостных случаях и на IP, на котором расположен домен. Иногда бан может накладываться целиком на доменную зону, то есть сайты (обычно вновь созданные) — по умолчанию перестают попадать в индекс. Это происходит обычно с доменными зонами 2-го уровня, где регистрация бесплатна и их используют обычно для создания дорвеев в огромных количествах. Так, совсем недавно Google забанил доменную зону co.cc, где в массовом порядке клепались дорвеи. В свое время Яндекс полностью перестал индексировать зоны net.ru, org.ru и pp.ru, где регистрация тоже была бесплатна.
2. Частичное удаление документов сайта из индекса. В яндексе этот фильтр называется АГС или его модификации — АГС-17, АГС-30 и АГС-40. Накладывается этот фильтр, по официальной версии яндекса) на сайты, которые созданы исключительно для продажи ссылок и манипулирования выдачей. В гугле существует аналогичный «фильтр» который удаляет большинство страниц из основного индекса, он носит условное название «сопли», или Supplemental Results. В отличии от АГС Яндекса, этот вид фильтра работает в самом алгоритме, в то время как АГС запускается отдельно и грузит апельсины бочками массово удаляет сайты из индекса время от времени. Что не мешает ему изредка выносить и отдельные сайты вне очереди.
3. Фильтр аффилиатов. Существует в ядексе, однако официально не признан сотрудниками этой ПС.2) Накладывается на аффилированные сайты (группу сайтов), то есть сайты одной компании (одного человека, группы лиц) созданные с целью зохватить планету занять весь топ и «влиять» и монополизировать продажу. Это не по спортивному, поэтому яндекс не дает одновременно быть в топе по определенному запросу 2-м и более аффилированным сайтам.