Содержание
Атрибут rel со значением nofollow в среде вебмастеров обсуждается с завидной регулярностью: новички интересуются правилами индексации веб-страниц и переживают о потере набранных позиций в поисковой выдаче. О rel=»canonical» споров в разы меньше, а зря – тот же «Яндекс» и Google наказывают тех, кто не способен разобраться с публикацией одинакового контента на разных страницах. Дубли негативно сказываются на ранжирование и снижают репутацию сайта, а потому не помешает разобраться в деталях – как скрыть повторы, не меняя содержимое веб-страниц?
Что такое rel=»canonical«
Rel – атрибут тега <link>, предназначенный для обозначения канонических (оригинальных или даже предпочитаемых) веб-страниц на сайте. Настройка применяется вебмастерами или SEO-оптимизаторами для борьбы с дублями, встречающимися в масштабах блогов, интернет-магазинов или даже информационных ресурсов. Часто повторяющийся контент пагубно влияет на положение сайта и приводит к потере набранных позиций в поисковой выдаче.
Добавляется атрибут rel=»canonical» к страницам дублям с ссылкой, ведущей на каноническую страницу, ту, которая соберет весь трафик и начнет отображаться по совместимым запросам. И выглядит вся настройка следующим образом:
<link rel=»canonical» href=»https://url.ru/»>
Зачем указывать основную версию страницы
Причин добавлять атрибут rel к веб-страницам предостаточно:
- Расставить приоритеты, не столкнуться с санкциями от поисковиков, связанных с дублированием контента;
- Корректно распределить ссылочную массу по страницам сайта;
- Сэкономить бюджет и направить оформленные рекламные мощности на канонические разделы продвигаемого веб-ресурса;
- Выбрать, какой контент обязан демонстрироваться в поисковой выдаче и завлекать новых посетителей.
Неканонические страницы не попадут в индекс?
Веб-страницы даже с добавленными атрибутами периодически появляются в поисковой выдаче, но лишь при соблюдении сразу нескольких правил: опубликованный контент на страницах-дублях несильно, но различается или релевантен по отношению к конкретному пользовательскому запросу.
Google трактует позицию, связанную с индексированием, иначе: атрибут canonical лишь рекомендация для поисковика, а не приказ – поисковые роботы автоматически определят, соответствует ли страница запросу и добавит в выдачу. И все же прописывать rel=»canonical» рекомендуется вручную – так меньше шансов столкнуться с неправильным определением дублей и выдачей некорректных приоритетов при индексации.
Когда канонические ссылки необходимы
Причин проставлять атрибут rel со значением canonical на сайте предостаточно – для предупреждения появления дублей, проведения SEO-оптимизации и повышения статуса сайта в поисковых сервисах «Яндекс» и Google:
- Повторений, возникающих из-за UTM-меток, вроде *utm_source=;
- Страниц с возможностью сортировки и включающих похожий контент (/*sort, asc, list=*);
- Дублей, возникающих из-за работы движка или при появлении разделов с GET-параметрами.
Для доступных по разным URL страниц с очень похожим контентом
Страницы с товарами и сезонными предложениями (схожие карточки, меняющиеся лишь под конкретное время года), информация об услугах, расположенная сразу в нескольких категориях. Рекомендуется сразу проставить атрибут rel и выбрать место, куда переносить весь трафик.
На страницах пагинации, если в категориях сайта есть страницы «Показать всё»
Распространенная рекомендация, представленная в том числе на сайте Google. Речь о добавлении rel=»canonical» на страницы пагинации с доступной кнопкой «Отобразить все» (или «Показать все»). Желательно добавить к каждой странице категории ссылку на своеобразную карту сайта «Показать все».
Как указать основной URL при помощи атрибута rel=»canonical»
Представленную выше конструкцию – <link href=»https://url.ru/» rel=»canonical»> – ведущую на оригинальный контент, предстоит добавить к каждой странице-дублю. А каким образом – зависит от инструментов под рукой и желаемого результата.
Прописать между тегами любой HTML-страницы
Классический способ добавления атрибута rel=»canonical»– интеграция в служебную часть разметки – между тегами <head></head>, где располагается сторонняя служебная информация (подключаемые шрифты и стили CSS).
Преимущество способа: тег подходит для неограниченного количества страниц. Недостатки же связаны с дополнительной нагрузкой на браузер и путаницей в URL, если сайт составлен из тысячи страниц с меняющимися ссылками.
В файле SiteMap
XML-карта сайта вмещает информацию обо всем сайте сразу и разрешает редактировать информацию в ручную, прописывая дополнительные URL для потенциальных дублей.
Плюсы SiteMap проявляются в том случае, если сайт вмещает тысячи страниц – с настройкой и обновлением информации о канонических страницах не возникнет проблем. Минусом выступает проблема с недостаточной значимостью для поисковых роботов сигналов, поступающих со стороны SiteMap. Тот же rel=»canonical» в HTTP или HTML-коде намного эффективнее скрывает дубли.
В заголовке HTTP
Способ предназначен не для HTML-макетов, а для файлов формата PDF. Выглядит итоговая конструкция следующим образом — Link: <https://site.ru/site.pdf>; rel=»canonical». Рекомендуется добавления на любое количество веб-страниц, положительно влияет на скорость загрузки сайта. Проблемы возникнут лишь на ресурсах с плавающими URL-адресами: настройки предстоит каждый раз задавать вручную.
С помощью плагина
Настройка канонических страниц через расширения возможна практически на каждой CMS: в рамках WordPress с поставленной задачей справится Yoast SEO, в OpenCart параметры URL-задаются вручную и без сторонних инструментов, а в Joomla параметры атрибута rel добавляются через функцию SEF (поддерживается начиная с версии 3.X).
Расширять функционал менее распространенных CMS предстоит с помощью Google и «Яндекс»: в сети однозначно найдется подходящее совместимое программное обеспечение.
Как проверить правильно ли настроен rel=»canonical»
Добавленный с помощью HTML-кода или тематических плагинов атрибут сразу вносит коррективы в индексацию веб-страниц, расположенных на сайте. Но вступают перемены в силу лишь в том случае, если ссылки проставлены по всем правилам, а вебмастер не допустил ошибок на этапе добавления новых настроек. А потому специалисты рекомендуют сразу проводить проверку работы дублей и канонических страниц.
С помощью программы Screaming Frog SEO Spider
Screaming Frog SEO Spider – десктопный инструмент, в автоматическом режиме сканирующий сайт по добавленной ссылке и рассказывающий об оптимизации, встречающихся ошибках 404 или проблемах с редиректом. Кроме распространенных подробностей предусмотрен и модуль, связанный с анализом «каноничности»: соответствующие сведения появляются в поле Canonical Link Element и разрешают сразу проверить – правильно ли все настроено.
Распространяется Screaming Frog SEO Spider по модели Freemium: часть контента разработчики выдают без ограничений, но за дополнительные преимущества и безлимитную проверку ссылок (подписка Free не разрешает проверить более 500 URL) предстоит доплатить. Стоимость варьируется и зависит от региона, но часто приближается к 149 фунтам стерлингов за год (15 тысяч рублей).
Программа выводит следующий набор сведений о сайте, связанных с атрибутом rel:
- Страницы, не помеченные значением canonical;
- Страницы с проставленным rel=»canonical» и информацией о каноничных ссылках;
- Статус URL – проиндексирован или проигнорирован поисковыми сервисами.
Кроме Screaming Frog SEO Spider с проверкой состояния веб-страниц частично справляются «Яндекс» (раздел «Исключенные страницы» в сервисе «Яндекс.Вебмастер») и Google (речь об «Инструменте проверки URL» с общими сведениями о добавленных ссылках). Но подробностей выдается не слишком много, да и запрашивать информацию предстоит каждый раз вручную.
Основные ошибки использования rel=»canonical»
Канонические URL не новость для поисковых систем Google, «Яндекс», Yahoo и Bing, а потому если страницы-дубли с сайта вновь появляются в выдаче, то, возможно, настройка проведена некорректно и без правок кода не обойтись:
- Атрибут ссылается на не индексируемую каноническую страницу. Возможно, поисковые роботы не способны взаимодействовать с проставленным URL-адресом из-за ошибок сервера, хостинга или добавленного атрибута noindex в мета-теге robots.
- Конфликт канонических ссылок на веб-странице. Если веб-мастера ссылаются сразу на несколько канонических URL-адресов в head, заголовке или с помощью плагинов, то выставленные настройки сбросятся из-за несовместимости.
- Неправильно добавленные URL-адреса и ошибки в коде. Ссылки обязаны быть абсолютными и содержать необходимую информацию, включая протоколы http или https (то есть, <a href=»https://site.ru/»>)
- Тег link добавлен за пределами <head></head>. Формально, поисковые сервисы распознают link и в body, но служебную информацию рекомендуется размещать непосредственно в head.
- Атрибут rel=»canonical» добавлен неуместно и не соблюдает правила. Дополнительные рекомендации к ссылкам и Google, и «Яндекс» вывели в специальном блоге для вебмастеров.
Рекомендации Google
Не помешает вебмастерам взглянуть и на список рекомендаций, опубликованных на сайте Google для веб-разработчиков под заголовком «Объединение URL повторяющихся страниц». Представители поисковика подробно разобрали и принцип работы поисковых роботов, и сценарии добавления тегов и атрибутов к веб-страницам, и о том, почему не рекомендуется добавлять директиву noindex.
Кроме рекомендаций от Google на сайте «Яндекс» встречается похожая заметка с дополнительными подробностями для начинающих и профессиональных вебмастеров.
Как вернуть неканоническую страницу в поиск
Действовать предстоит в обратном порядке – просканировать сайт через Screaming Frog SEO Spider, найти ссылки с прописанным атрибутом rel, а после – разобраться с параметрами уже на сайте – исправить файл SiteMap, подкорректировать заголовок HTTP или исключить правки, внесенные через плагин. Настройки обновляются не сразу, а через некоторое время, а потому для проверки предстоит еще раз просканировать сайт (справится и «Яндекс.Вебмастер», если бесплатных проверок уже не осталось).
Заключение
Атрибут rel со значением canonical предназначен для проведения полноценной SEO-оптимизации и исключения из индексации страниц-дублей, опубликованных на сайте. Если прописывать дополнительную информацию корректно, то продвигаемый сайт начнет подниматься по результатам поисковой выдачи. Но действовать разработчики из Google и «Яндекс» рекомендуют без лишней спешки: неправильно расставленная информация приведет лишь к ошибкам и конфликтам.