Что такое канонические страницы (canonical) и зачем их настраивать

Вернуться в блог

Часто можно встретить рекомендацию настраивать canonical для страниц сайта с дублирующимся контентом или даже проставлять каноникал “сам на себя”. В заблуждение вводит то, что это не является обязательным требованием. В этой статье мы разберемся, что же это такое и зачем это необходимо делать.

Что такое canonical?

Атрибут каноникал указывает поисковой системе, что текущая страница является полной или частичной копией другой, более приоритетной. Использование этого тега позволяет решить проблему дублирующегося контента.

На практике это выглядит вот так:

Зачем нужно прописывать каноникал?

Множество факторов может вызвать дублирование контента: пагинация, get-параметры, возможность использовать две версии сайта: с www и без него и т.д.

Если не поставить на страницах с одинаковым контентом rel=”canonical”, поисковая система не будет знать, какая страница является приоритетной, самостоятельно выберет одну и будет индексировать только ее, или же все страницы попадут в индекс и ни одна из них не сможет хорошо ранжироваться. Указание же канонической страницы предотвращает возникновение таких проблем.

Есть мнение, что если краулер будет долго сканировать страницы с одинаковым контентом, он может не добраться до важных, уникальных страниц сайта и хуже его ранжировать. 

301-й редирект также может решить проблему дублирования. Но преимуществом canonical является то, что пользователь может видеть страницу-дубль и взаимодействовать с ней. При настройке редиректа, он сразу попадает на основную страницу. Это не лучшее решение, например, для страниц пагинации или сортировки.

Проблемы дублирования, которых можно избежать с помощью rel=”canonical”

1. Страницы с get-параметрами

  • Фильтрация

Когда фильтр на сайте формирует множество новых страниц, обязательно нужно указать на основные, чтобы не тратить краулинговый бюджет и сосредоточить “внимание” поисковой системы только на посадочных страницах.

  • Пагинация

Существует несколько версий решения проблемы дублирования на страницах пагинации. Это достаточно спорный вопрос. Но одним из вариантов является проставление canonicals. 

  • UTM-метки

utm-метки также причина возникновения почти одинаковых страниц с get-параметрами и проблема может быть решена с помощью тега каноникал.

  • Сортировка

Различные сортировки могут создавать страницы url с get-параметрами, для которых можно указать каноническую. 

2. Дублирование на разных доменах

Каноникал может также помочь в ситуации перехода на другой домен. Просто укажите ссылки на страницы приоритетного домена на старом.

3. AMP и не-AMP версии сайта

Это относительно новая технология, позволяющая создавать более “легкие” версии страниц сайта для ускоренной загрузки. Но и тут мы сталкиваемся с проблемой дублирования содержимого. В таком случае можно проставлять каноникал с amp страниц на аналогичные основные страницы сайта.

4. Мобильная версия сайта

Если Вы принимаете решение отказаться от адаптива и создать мобильную версию, то каноникал поможет избежать дублирования страниц формата https://m.site.com/article и https://site.com/article.  

5. Одна страница в разных подпапках

Бывает так, что одна и та же страница должна быть доступна в нескольких подпапках одновременно. В таком случае появляется несколько страниц с одинаковым содержанием и разными url. Например, один и тот же товар доступен и в каталоге, и на странице распродажи: site.com/catalog/tovar и site.com/sale/tovar. И каноникал поможет указать ПС, за каким url приоритет. 

6. Один контент на разных сайтах

Если Вы владеете несколькими сайтами, на которых часто публикуется одинаковый контент, Вы можете обозначить приоритетный сайт с помощью тегов canonical.

7. www, без www

Рекомендуется всегда определять главное зеркало сайта: с или без www. Указать основную версию можно с помощью тегов каноникал, хотя в этом случае лучше все-таки прибегнуть к настройке 301 редиректа.

8. index.php, index.html, index.htm, index.aspx, index.asp

Часто бывает так, что страница доступна в разных расширениях. Например, адрес https://site.com/index.php отдает код 200 и доступен пользователю одновременно с https://site.com. Одним из вариантов решения проблемы является проставление canonical, хотя в этом, как и в предыдущем, случае 301 редирект — более предпочтительный выход из ситуации. 

На что обратить внимание при внедрении

  1. Хотя Вы можете использовать и относительный url (<link rel=»canonical» href=»/article-1″>) для проставления каноникал, рекомендуется указывать полную версию url (<link rel=»canonical» href=»https://site.com/article-1″>)
  2. Хоть canonical “сам на себя” и не обязателен, его рекомендуется проставлять для того, чтобы в спорных ситуациях Google знал, что Вы хотите индексировать эту страницу.

Цитата Джона Мюллера: 

I recommend self-referential canonical because it really makes it clear to us which page you want to have indexed, or what the URL should be when it is indexed.

Even if you have one page, sometimes there are different variations of the URL that can pull that page up. For example, with parameters in the end, perhaps with upper lower case or www and non-www. All of these things can be kind of cleaned up with a rel canonical tag.

John Mueller, Webmaster Trends Analyst Google

  1. Для одной страницы может быть указан только один каноникал.
  2. Не допускайте ситуаций, когда канонические страницы указывают друг на друга. То есть для страницы А указан каноникал Б, а для Б — А.

Пути внедрения

Google предлагает такие способы обозначения приоритетных страниц:

  1. html атрибут rel=”canonical”
  2. http-заголовок rel=”canonical”
  3. Использовать файл sitemap.xml

Детальнее о каждом из них Вы можете прочесть в официальной документации Google.

Основные ошибки или чего не стоит делать при настройке canonicals:

  1. Каноникал ставится на страницу, заблокированную в файле robots или через noindex.
  2. Указание страницы из другой языковой версии как канонической.
  3. Проставление атрибута hreflang на неканоническую страницу.
  4. Указание канонической страницы, с которой осуществляется редирект на другую.
  5. Отсутствие внутренних ссылок на каноническую страницу.
  6. Наличие не канонических ссылок в картах сайта.
  7. Каноникал с http на https и наоборот.

Примечание: Будьте внимательны! Если содержимое страниц не совпадает или на неканоническую страницу ведет много ссылок, гугл может игнорировать каноникал.

    Готовы покорить первую страницу Google?

    Оставьте заявку и мы подготовим для вас индивидуальный план продвижения вашего бизнеса