Canonical: как работает защита от дублирования контента

  1. Как создается дублированный контент?
  2. Канонический день против 301 редирект
  3. Канонический для не-HTML
  4. Каноническая метка и нумерация страниц
  5. rel = "next" и rel = "prev"
  6. вывод

22.02.2012, 16:38 Uhr Примечание. В этой статье мы использовали комиссионные ссылки и пометили их знаком "*". Если заказ размещен по этим ссылкам, t3n.de получает комиссию.

Введение канонического тега Google Начало 2009 года имело далеко идущие последствия. С помощью этого тега владельцы веб-сайтов могут легко избежать дублирования контента, но подходящее приложение не так уж тривиально.

Проблема дублированного контента знакома многим операторам сайтов. Если Google распознает страницы с одинаковым содержанием, это может привести к исключению из индекса, потому что Google хотел бы запретить в результатах поиска перечислять несколько страниц с одинаковым содержанием.

22

Особенно на сайтах электронной коммерции может быть дублированный контент из-за разных категорий.

Поэтому канонический тег от Google (rel = "canonical", canonical = авторизованный) является неотъемлемой частью поисковой оптимизации (SEO). С помощью тега владельцы веб-сайтов могут относительно элегантно решать проблемы с дублирующимся контентом, поскольку, таким образом, можно ссылаться как на внутреннего, так и на внешнего носителя фактического (авторизованного) автора контента. [1] ,

Как создается дублированный контент?

Причины дублирования контента [2] разнообразны. Наиболее распространенные из них включают в себя:

  1. Недостаток согласованности
  2. сортировка
  3. пагинация
  4. Категоризация
  5. Разные параметры

Если веб-сайт несовместим, может возникнуть дублированный контент. Часто страницы с одинаковым содержимым имеют несколько версий
достижимо. Типичным примером является версия без www или www. Подобное поведение
Он работает с URL-адресами, заканчивающимися над версией с косой чертой или без нее ("/")
достижимы. Для обеспечения согласованности оператор сайта должен иметь
Выберите версию.

Тот же продукт, тот же контент, но другая категория. Дублированный контент из-за специального предложения.

Сортировка играет важную роль, особенно на сайтах электронной коммерции. Страницы часто различаются только в порядке продукта - все остальное содержимое остается идентичным (сортировка по цене, цвету,
Размер и т. Д.). Это автоматически создает несколько страниц с (почти) идентичным содержанием.

С точки зрения нумерации, дублированный контент также влияет на сайты электронной коммерции, которые предлагают различные продукты. Разбиение на страницы используется для уменьшения количества отображаемых продуктов на странице. Подобно сортировке, страницы отличаются только отображаемыми продуктами.

Блоги предназначены для связывания разных категорий с одними и теми же элементами, или что посетитель может получить доступ к одной и той же категории по нескольким URL-адресам, или Система управления контентом (CMS) автоматически создает несколько версий. В таких случаях Google не может распознать основную категорию.

Наконец, URL-адреса часто содержат дополнительные параметры, такие как идентификаторы сеанса. Это также может быстро создать дублированный контент.

Канонический день против 301 редирект

С точки зрения SEO канонический тег очень похож на редирект 301. Самое большое отличие состоит в том, что перенаправление 301 перенаправляет трафик как пользователю, так и поисковой системе, в то время как тег Canonical сообщает только поисковой системе, где находится контент. Поэтому перенаправление 301 следует использовать при некоторых проблемах с дублированным содержимым, таких как несоответствия URL-адресов. В отличие от этого, следует установить тег Canonical на страницах, которые должны оставаться доступными для пользователя, например, сортировки [3] ,

Канонический тег является частью заголовка HTML, который также определяет тег заголовка и мета-описание. Параметр реализован следующим образом:

HTML

<link rel = "canonical" href = "http://www.domain.de/korrekte-seite" />

Листинг 1

Внутри этого параметра каждый ссылается на «правильный» URL. Подобно перенаправлению 301, мощность входящего канала также пересылается, даже если, конечно, теряется некоторая мощность канала. При введении тега Canonical от Google владельцы веб-сайтов могли изначально использовать только внутреннее перенаправление домена (включая субдомены) - для перенаправления внешнего домена необходимо было продолжать устанавливать перенаправление 301. Спустя всего несколько месяцев Google разрешил использование междоменных канонических тегов. Реализация такая же, как описано выше, вместо внутренней она дает внешний URL. Это помогает Google идентифицировать и, при необходимости, лучше оценивать контентную страницу [4] ,

Канонический для не-HTML

Очень часто на веб-сайтах можно найти содержимое, например документы Office или PDF, которые не являются только HTML. В результате посетители не могут получить их в виде HTML-версии. В результате вы часто получаете ссылки, которые указывают на документы, но не на страницу. Но с помощью тега Canonical можно перенаправить эту ссылку на фактическую страницу. Реализация немного сложнее [5] ,

Для реализации тега Canonical контент также должен быть доступен в виде HTML-версии, чтобы имелось два релевантных URL-адреса для одного и того же контента, например: http://www.example.com/white-paper.html и http://www.example.com/white-paper.pdf ,

Чтобы показать Google, что канонический URL для документа PDF http://www.example.com/white-paper.pdf HTML-версия http://www.example.com/white-paper.html То есть, вы должны установить канонический тег в заголовке HTTP (это делается через конфигурацию веб-сервера):

терминал

GET /white-paper.pdf HTTP / 1.1 хост: www.example.com (... остальные заголовки HTTP-запросов ...) HTTP / 1.1 200 OK Тип содержимого: application / pdf Ссылка: <http: // www .example.com / белый paper.html>; rel = "canonical" Content-Length: 785710 (... остальные заголовки ответа HTTP ...)

Перечисление 2

Конечно, метод более дорогой, если реализация осуществляется по ссылке / документу. Однако вы также можете создать правила для автоматического закрытия URL-адреса PDF и связанного URL-адреса HTML - это особенно полезно для больших страниц, которые публикуют большое количество документов, отличных от HTML. [6] ,

Каноническая метка и нумерация страниц

С rel = "next" и rel = "prev" можно достичь правильной индексации с помощью нумерации страниц Google.

Страницы нумерации страниц, часто используемые на сайтах электронной коммерции для сокращения длинных страниц товаров, часто помечаются каноническим URL-адресом страницы категории. Однако, с точки зрения Google, этого следует избегать, чтобы гарантировать, что Google распознает или проиндексирует все перечисленные продукты. Здесь Google создает новое лекарство с элементами rel = "next" и rel = "prev" [7] ,

rel = "next" и rel = "prev"

Чтобы сделать ясной связь между главной страницей категории и страницами нумерации страниц, следует использовать новые элементы rel = "next" и rel = "prev". С помощью этих элементов можно легко определить главную страницу категории и страницы нумерации страниц и убедиться, что Google сосредоточен на главной странице категории. Следующий пример с тремя страницами проясняет использование:

HTML

На первой странице в заголовке реализовано следующее: <link rel = "next" href = "http://www.example.com/article?story=abc&page=2" /> На второй странице отобразится: <link rel = "prev" href = "http://www.example.com/article?story=abc&page=1" /> <link rel = "next" href = "http://www.example.com/article?story= abc & page = 3 "/> И на третьей странице: <link rel =" prev "href =" http://www.example.com/article?story=abc&page=2 "/>

Перечисление 3

Этот пример проясняет, какие правила должны соблюдаться. Первая страница может содержать только элемент rel = "next", вторая страница (т.е. все страницы, которые находятся между первой и последней страницей), оба элемента rel = "next" и rel = "prev", и только третья страница элемент rel = "prev". Таким образом, Google признает четкое структурирование. Также можно использовать теги Canonical и элементы rel = "next" и rel = "prev" в комбинации. Это имеет смысл, если страница разбиения на страницы дополнительно доступна через URL с идентификатором сеанса, например, http://www.example.com/article?story=abc&page=2&sessionid=123. Чтобы отобразить канонический URL, эта страница нумерации страниц должна содержать в заголовке следующую информацию:

HTML

<link rel = "canonical" href = "http://www.example.com/article?story=abc&page=2" /> <link rel = "prev" href = "http://www.example.com/ article? story = abc & page = 1 & sessionid = 123 "/> <link rel =" next "href =" http://www.example.com/article?story=abc&page=3&sessionid=123 "/>

Листинг 4

вывод

Реализация тегов Canonical очень обширна и может быть подвержена ошибкам. Поэтому в ходе подготовки вы должны точно определить, какие страницы должны получать тег Canonical, а какие - перенаправление 301. Текущие события показывают, что индексация очень важна, и Google стремится найти более чистые и простые решения. Поэтому, чтобы быть в курсе, стоит заглянуть в блог Google для веб-мастеров.

Андре Альпар - выпускник бизнес- информатики, активно работающий в Интернете с 1996 года, а также в сфере онлайн-маркетинга (особенно SEO) с 1998 года в качестве предпринимателя и консультанта Андре Альпар - выпускник бизнес- информатики, активно работающий в Интернете с 1996 года, а также в сфере онлайн-маркетинга (особенно SEO) с 1998 года в качестве предпринимателя и консультанта. Он успешно основал несколько компаний и является бизнес-ангелом. В настоящее время он в основном консультирует Rocket Internet GmbH по европейским стартапам по стратегическим вопросам онлайн-маркетинга в более чем дюжине стран. ( andre.fm / andre-alpar.de )

Как создается дублированный контент?
Как создается дублированный контент?
Com/article?
Com/article?
Com/article?
Com/article?
Com/article?
Com/article?
Com/ article?
Com/article?
 

Категории

  • Новости

  • Новости



     


    © NFL24.RU | 2011.
    Использование материалов сайта NFL24.ru возможно при ссылке на сайт NFL24.ru (для интернет-изданий обязательно размещение активной гиперссылки).
    Официальные сайты команд NFL