Документ (синонимы - страница) общее понятие в сети интернет. Это отдельный объект, содержащий некую полезную или бесполезную информацию. Чтобы понять, что это - представьте себе отдельную страницу из книги, или договор найма гаража (он может быть и на пятидесяти страницах - но это все равно единый документ).
В принципе он может содержать все, что угодно (картинки, ссылки, формы для отправки информации и даже вирусы, однако основная значимая часть документа - это контент. То есть текст - грубо говоря. Именно текстовая составляющая документа является одним из факторов ранжирования документа в поисковых системах. То что вы сейчас читаете - это документ. Тем не менее документ в сети отличается от страницы в книге, поскольку объем текста в нем не лимитирован. По сути он может содержать целую главу книги. Поэтому есть некоторое противоречие - с одной стороны - это страница, но с другой - это целая глава (или - статья). Для удобства чтения документа используется (как и в классической полиграфии)разбивка его на абзацы и другое форматирование. Документ (как и глава) должен иметь название (заголовок). Общепринято прописывать заголовок в так называемой шапке документа, (meta) которая не видна посетителю. Заголовок в шапке выглядит так, на примере данной статьи:
<title>Документ</title>
Именно содержимое этого тега отображается в браузере на вкладке. Кроме того, в документе рекомендуется делать оглавление, которое в HTML называется заголовками
<h1>Документ</h1>
- основное название документа.
<h2>Что содержит документ?</h2>
- подзаголовки документа. Подзаголовков в HTML предусмотрено 5 уровней, но обычно использует 2-3. (h2-h4) Все это улучшает визуальный вид документа, способствует более удобному прочтению оного. Кроме того это помогает поисковым системам точнее ранжировать документ, ведь в заголовках, как правило, пишут наиболее важные ключевые слова.
А сейчас мы перешли к самому главному. Адрес у документа с уникальным контентом в пределах сайта (если рассматривать сайт, как книгу) должен быть, как горец - один. Представьте себе, что вы читаете книгу, где страницы периодически повторяются, а иногда еще и кусками. Ясное дело, вы ничего не поймете. Вы конечно можете выдрать эти лишние страницы, ориентируясь на сюжет, но поисковый робот - не человек, и он не знает какие страницы надо вырвать, а какие оставить, поскольку не может осмыслить сюжет. В результате он выдерет (чтобы не засорять свою базу дублями - произвольные страницы и в индексе у него получится полная каша.
Мы плавно перешли к проблеме дублирования контента - которому скажем однозначно - нет!