Seo Pulse - поисковой оптимизации.

Дублированный контент – как поисковики определяют оригинал.

Январь 4, 2010 | Рубрики: Поисковые машины | 8 Коментариев

Основной смысл дублированного контента  – это когда два или несколько веб-сайтов имеют одинаковое содержание. Не просто ту же тему или заголовки, а полностью дублированное слово в слово содержание или, может быть, почти слово в слово.

Это может произойти по нескольким причинам. Вы можете написать статью, а другой сайт или блог  разместил статью у себя.

Другая ситуация,  может быть при наличии  нескольких доменов в разных географических доменных зонах, подробнее про легальное дублирование контента.

дублированный контентт

Почему дублированный контент проблема?

Цель поисковой системы,  обеспечить максимально точную интерпритацию для данного ключевого слова или словосочетания. Чем точнее это будет сделано, тем лучше поиск и пользователь будет продолжать использовать эту поисковую систему.

Также цель для поисковой систем исключить дубли одного и того же контента с разных  веб-страниц в результатах поиска, таким образом, не создавая путаницу для пользователей. В итоге поисковые системы вынуждены фильтровать все дублированное содержание и выбирать одну страницу на основе определенных критериев.

Проблема в том, что при выборе какую страницу показывать ваша страница может не отображаются в пользу другой страница с таким же содержанием.

Как поисковики поступают с  дублированным контентом.

Поисковые системы используют ботов для поиска в Интернете которые собирают все содержание с сайтов, затем оно индексируется и помещается в базу данных.

В ходе этого процесса, содержание сравнивается с другим одинаковым по содержанию. Затем делается попытка определить оригинал. Некоторые критерии, которые помогают определить его являются:

  • Насколько домен трастовый с точки зрения поисковой машины.
  • Наличие обратных ссылок указывающих, что это оригинал.
  • Общее количество ссылок на документ.
  • Какое содержание было раньше проиндексировано ботом.
  • Имеется ли место частичное использование(цитирование) контента на других ресурсах.

Таким образом в результате сравнения будет принято решение какое содержание использовать в поисковой выдаче, т.е что является оригиналом а что копией или копиями.

Популярность: 3%

Читайте также

Понравился пост, не стесняйся - подпишись на рассылку RSS!

Пост опубликовал admin

Комментарии

8 Комментария to “Дублированный контент – как поисковики определяют оригинал.”

  1. Варезник, 35000 новостей, 25000 страниц в Яше. Почему не бан ? Вроде неуник…так что хрень это все дублированный контент или нет.

  2. admin

    Все может быть, я высказал только предположения о возможных критериях оценки оргинала содержания!

  3. Мне кажется что индексация отсыпаеться по тематике,… если тема новая, то в индекс попадают многие сайты, если же копипасты старые – её в индекс недают(страницу)…
    кроме того варезники если появляется – то они дают новую инфу…а сеошники, берут и дерут старые статьи, вместо того чтобы написать что-то свое….

  4. Ну наверно тот Варезник просто более трастовый, чем те, которые имеют копии… хз

  5. может быть слово в слово но по разному расположено или разбавлено некими весовыми комбинациями.
    У меня сетка сателлитов по рецептам – многие рецепты повторяются – но на каждом сателлиты написаны по разному – где то через таблицы где то через h2 h1 в результате даже copypaste говорит мол нет дубликатов – хотя рецепт Оливье я думаю есть не только на моих сателлитах, а много где и рецепт этот не сложнее чего либо :)
    Правда некоторые сателлиты которые копировали контент один в один и ссылались на сайта который требовалось качать такие сателлиты были выбиты практически сразу по введению АГС 30. Хотя при запуске АГС 17 жили порядка 3 месяцев.

  6. admin

    to Zerohold: у меня тоже вылетели многие саты под Сапу, теперь пытаюсь вернуть их взад, но пока безуспешно.

  7. Гугл более лояльно относится к дублям ( теги ), Яндекс иногда нервничает, бывает фильтрует, ну если грамотно отнестись к всему этому и не переборщить, то все будет спокойно сидеть в индексе.

  8. На сегодняшний день ни один поисковик не умеет определять авторство контента. Научен на своем опыте. Жалко до слез, но трастовый ресурс, размещающий у себя Вашу статью, будет выше в поисковой выдаче, чем Ваш сайт. Это реальность.

    Будем надеяться, что скоро все поменяется.

Оставить комментарий





You must be logged in to post a
video comment.

Comment moderation is enabled. Your comment may take some time to appear.

© 2010 SEO пульс поисковой оптимизации

?>