Блог

1

Как търсачките третират дублираното съдържание?

Повечето уебмастъри вече са наясно с това, че търсачките не обичат дублираното съдържание. Проблемът е, че многото страници с еднакво съдържание объркват търсачките, чиято основна цел е да индексират релевантно, добре структурирано и уникално съдържание, а не хаотично и копирано от друго място. Следователно, в опита си да предоставят на потребителите максимално разнообразни резултати, търсачките филтрират тези уеб сайтове, които изглеждат твърде еднакви.

Какво казва в Google’s Webmasters Help?

“Гугъл се старае да индексира и показва страници с разнообразна информация на тях. Това “филтриране” означава, например, че ако вашия уеб сайт има нормална и принтер версия за всяка статия и нито една от тези две версии не е забранена чрез файла robots.txt или посредством поставянето на noindex МЕТА таг, Гугъл ще избере да индексира само една от тези две версии”.

С други думи, филтрите за дублирано съдържание представляват алгоритми, създадени да сравняват всеки 2 страници и да търсят за дублирано съдържание. Когато алгоритъмът попадне на 2 или повече страници, които са с прекалено сходно съдържание, те просто поставят тази от тях, която идва от най-надеждния източник в основния си индекс, а всички други – в supplemental results (още наричани supplemental index). Там попадат всички дублирани страници и най-общо той представлява “кошчето на Гугъл”. Повярвайте, не искате вашите страници да попаднат там, затова винаги избягвайте дублираното съдържание, поне на тези уеб сайтове, които са важни за вас.

Наказанията за дублирано съдържание стават все по-строги с нарастването на броя страници със съдържание, което е копирано от други източници. Освен това, с намаляването на съотношението “уникално съдържание : дублирано съдържание” нараства рискът от получаване на наказание от Гугъл.

Спасението наречено “canonical tag”

Както вече неколкократно обсъдихме в тази и в предишната статия, търсачките всячески се стремят да държат страниците с дублирано съдържание далеч от своя основен индекс. За съжаление, това не е никак лесна задача, тъй като такъв тип контент се появява в резултат на много ситуации: публикуване на статии, блог постинги, различни URL-и от един и същ сайт, водещи към еднакво съдържание и др. Съвременните тенденции (trends) изискват известна помощ от притежателите на уеб сайтове, особено към тези имащи ecommerce сайтове с няколко продуктови страници, които описват един и същ продукт.

Ето защо беше добра идея да се създаде нов стандарт под формата на HTML атрибут, който да се справи с проблема “дублирано съдържание”. Такъв е новия “canonical tag” (каноничен таг):

<link rel=”canonical” href=”http://www.example.com/product.php?item=product-name”/>

Този таг, поставен в HEAD секцията на страницата “казва” на търсачките, че страницата http://www.example.com/product.php?item=product-name се счита за предпочитаната версия (оригинал), а всички други сходни на нея страници се признават за нейни дубликати.

Canonical tag е особено полезен в случаи на множество URL-и, сочещи към една и съща уеб страница. На практика, този таг действа по сходен начин с 301 redirect (permanent redirect) за всички страници, на които е поставен този каноничен таг. Можете да използвате както relative, така и absolute links, но търсачките препоръчват absolute links.

Още препоръки от Google Webmasters Help:

“To migrate to a completely different domain, permanent (301) redirects are more appropriate. Google currently will take canonicalization suggestions into account across subdomains (or within a domain), but not across domains. So site owners can specify a canonical page on www.example.com from a set of pages on example.com or help.example.com, but not on example-widgets.com.”

В превод, това звучи така:

“За да мигрирате (преминете) към изцяло нов домейн е най-подходящо да се използват permanent (301) redirects. Каноничният атрибут на Гугъл към момента поддържа само redirect към поддомейни на съответния сайт или към някои от вътрешните му страници. Той не важи, когато се опитвате да го ползвате към други домейни. Например, можете да ползвате каноничния атрибут за контент от www.example.com към example.com или към help.example.com, но не и към example-widgets.com ”

От Гугъл се надяват, че с измислянето на този атрибут ще се решат голяма част от проблемите около дублираното съдържание. На нас ни остава да чакаме, да тестваме и оценяваме реалните ползи от него, ако има такива.

Comments

  • Ludochkka
    June 4, 2009

    Интересно, я даже и недумала об этом…

Leave a Reply

Your email is never published nor shared. Required fields are marked *

*

© SEO оптимизация от инж. Николай Стоянов 2008-2013 г. Всички права запазени.