Основной смысл дублированного контента – это когда два или несколько веб-сайтов имеют одинаковое содержание. Не просто ту же тему или заголовки, а полностью дублированное слово в слово содержание или, может быть, почти слово в слово.
Это может произойти по нескольким причинам. Вы можете написать статью, а другой сайт или блог разместил статью у себя.
Другая ситуация, может быть при наличии нескольких доменов в разных географических доменных зонах, подробнее про легальное дублирование контента.
т
Почему дублированный контент проблема?
Цель поисковой системы, обеспечить максимально точную интерпритацию для данного ключевого слова или словосочетания. Чем точнее это будет сделано, тем лучше поиск и пользователь будет продолжать использовать эту поисковую систему.
Также цель для поисковой систем исключить дубли одного и того же контента с разных веб-страниц в результатах поиска, таким образом, не создавая путаницу для пользователей. В итоге поисковые системы вынуждены фильтровать все дублированное содержание и выбирать одну страницу на основе определенных критериев.
Проблема в том, что при выборе какую страницу показывать ваша страница может не отображаются в пользу другой страница с таким же содержанием.
Как поисковики поступают с дублированным контентом.
Поисковые системы используют ботов для поиска в Интернете которые собирают все содержание с сайтов, затем оно индексируется и помещается в базу данных.
В ходе этого процесса, содержание сравнивается с другим одинаковым по содержанию. Затем делается попытка определить оригинал. Некоторые критерии, которые помогают определить его являются:
- Насколько домен трастовый с точки зрения поисковой машины.
- Наличие обратных ссылок указывающих, что это оригинал.
- Общее количество ссылок на документ.
- Какое содержание было раньше проиндексировано ботом.
- Имеется ли место частичное использование(цитирование) контента на других ресурсах.
Таким образом в результате сравнения будет принято решение какое содержание использовать в поисковой выдаче, т.е что является оригиналом а что копией или копиями.
Популярность: 3%
Читайте также
Понравился пост, не стесняйся - подпишись на рассылку RSS!

Варезник, 35000 новостей, 25000 страниц в Яше. Почему не бан ? Вроде неуник…так что хрень это все дублированный контент или нет.
Все может быть, я высказал только предположения о возможных критериях оценки оргинала содержания!
Мне кажется что индексация отсыпаеться по тематике,… если тема новая, то в индекс попадают многие сайты, если же копипасты старые – её в индекс недают(страницу)…
кроме того варезники если появляется – то они дают новую инфу…а сеошники, берут и дерут старые статьи, вместо того чтобы написать что-то свое….
Ну наверно тот Варезник просто более трастовый, чем те, которые имеют копии… хз
может быть слово в слово но по разному расположено или разбавлено некими весовыми комбинациями.
У меня сетка сателлитов по рецептам – многие рецепты повторяются – но на каждом сателлиты написаны по разному – где то через таблицы где то через h2 h1 в результате даже copypaste говорит мол нет дубликатов – хотя рецепт Оливье я думаю есть не только на моих сателлитах, а много где и рецепт этот не сложнее чего либо
Правда некоторые сателлиты которые копировали контент один в один и ссылались на сайта который требовалось качать такие сателлиты были выбиты практически сразу по введению АГС 30. Хотя при запуске АГС 17 жили порядка 3 месяцев.
to Zerohold: у меня тоже вылетели многие саты под Сапу, теперь пытаюсь вернуть их взад, но пока безуспешно.
Гугл более лояльно относится к дублям ( теги ), Яндекс иногда нервничает, бывает фильтрует, ну если грамотно отнестись к всему этому и не переборщить, то все будет спокойно сидеть в индексе.
На сегодняшний день ни один поисковик не умеет определять авторство контента. Научен на своем опыте. Жалко до слез, но трастовый ресурс, размещающий у себя Вашу статью, будет выше в поисковой выдаче, чем Ваш сайт. Это реальность.
Будем надеяться, что скоро все поменяется.