Что такое дублированный контент в WordPress и способы его устранения
Приветствуем вас! Что такое дублированный контент? У поисковых систем, таких как Google Яндекс, есть проблема — она называется «дублированный контент». Дублированный контент, это похожий контент, который появляется в нескольких местах (URL) в сети, и в результате поисковые системы не знают, какой URL показывать в результатах поиска.
Это может повредить рейтингу веб-страницы, и проблема только усугубляется, когда люди начинают ссылаться на разные версии одного и того же контента. В этой статье мы сосредоточимся в основном на технических причинах дублирования контента и их решениях.
Давайте проиллюстрируем это на примере. Допустим, ваша статья о «ключевом слове x» появляется в http://www.example.com/keyword-x/ в том же контенте, что и в http://www.example.com/article-category/keyword-x/. Эта ситуация не является фиктивной: это происходит во многих современных системах управления контентом.
Тогда предположим, что ваша статья была подхвачена несколькими блоггерами, и некоторые из них ссылаются на первый URL, а другие — на второй. Ваша проблема заключается в дублировании контента, поскольку обе эти ссылки содержат разные URL-адреса. Если бы все они ссылались на один и тот же URL, ваши шансы на ранжирование по ключевому слову x были бы выше.
Причины дублирования контента
Есть множество причин для дублирования контента. Большинство из них являются техническими, таких как:
Идентификатор сессии: сессия представляет собой краткую историю того, что посетитель делал на вашем сайте, и может содержать такие вещи, к примеру такие как товары в корзине. Чтобы поддерживать этот сеанс при переходе посетителя с одной страницы на другую, необходимо где-то хранить уникальный идентификатор сеанса.
Наиболее распространенным решением является сделать это с помощью файлов cookie. Однако поисковые системы обычно не хранят куки.
Но некоторые системы возвращаются к использованию идентификаторов сеансов в URL. Это означает, что каждая внутренняя ссылка на веб-сайте получает этот идентификатор сеанса, добавленный к его URL-адресу, и поскольку этот идентификатор сеанса уникален для этого сеанса, он создает новый URL-адрес и, следовательно, дублирует содержимое.
Нумерация комментариев: WordPress позволяет размещать комментарии к сообщениям. Это приводит к дублированию контента путем добавления URL-адресов к исходному сообщению, например «ArticleURL + comment-page-1, comment-page-2 и т. д.».
WWW / no-WWW: Каждая версия универсального локатора ресурсов вызывает вашу домашнюю страницу или дублирует контент. HTTP или HTTPS, где один и тот же контент распространяется по обоим протоколам.
Дубликаты URL: Если у вас есть несколько URL-адресов, которые направляют пользователей на идентичный контент, опять же, это приведет к дублированию контента на вашем сайте WordPress.
Синдикация контента: Если у вас популярный блог, то у вас будут проблемы с дублированным контентом. Почему? Все просто. Другие малоизвестные сайты будут использовать ваш контент без вашего разрешения, даже если плагиат является незаконным. Поисковые системы будут испытывать трудности при различении двух разных версий одной и той же статьи, что приводит к уже упомянутым проблемам.
Как можно избежать проблем с дублированием контента в WordPress?
- Никогда не назначайте один и тот же заголовок вашим сообщениям и страницам.
- Удалите все страницы и сообщения, которые вы не используете.
- Будьте внимательны к тем страницам, которые вы публикуете, и публикуйте только те, которые вы планируете использовать.
- Перенаправьте дублированный контент на определенный канонический URL.
- Добавьте элемент канонической ссылки на дубликат страницы.
- Добавьте ссылку HTML из дубликата на канонический URL.
Как определить дублирующийся контент
Вы можете идентифицировать дублированный контент, используя множество методов, как вручную, так и с помощью специальных инструментов. Мы не будем рассматривать ручные методы, поскольку это хлопотно, а рассмотрим несколько специальных инструментов для поиска дублированного контента.
CopyScape
CopyScape довольно прост в использовании — все, что нужно сделать, это вставить ссылку в поле на главной странице. После этого CopyScape покажет несколько результатов.
Каждый из результатов кликабелен для более подробной информации о нем. Если результаты ниже 10% ваших постов или страниц — это нормально. Однако, если кто-то копирует более 20% вашего контента, то тут нужно принимать меры.
Siteliner
Для внутренней проверки дублированного контента вы можете использовать Siteliner. Проверка дубликатов контента Siteliner предоставляет много информации, но бесплатная версия ограничена 250 страницами один раз в 30 дней. После поиска вы сможете увидеть процент внутреннего дублированного контента.
SeoReviewTools
В данном сервисе вы найдете более 30 инструментов, которые помогут вам при работе на вашем сайте. Проверка дублирующегося контента — одна из них, и все, что вам нужно сделать, чтобы ее выполнить, это подтвердить, что вы не робот, введя код с картинки. Инструмент покажет вам как внутренний, так и внешний дублированный контент.
Serpstat
Serpstat — это мощная универсальная SEO-платформа премиум-класса. С его помощью вы также можете найти дублированный контент.
Дублированный контент есть практически на любом сайте. Очень трудно найти ресурс с большим колличеством страниц и полным отсутствием дублированного контента. Так что если он у вас есть не нужно паниковать. По попе вы за это не получите, это все поправимо. Ну что у нас на этом все. Всем пока!
С уважением Вячеслав и Валерия!