Как търсачките оценяват уеб страниците? – продължение

1

Как търсачките оценяват уеб страниците? – продължение

По правило, ботовете на търсачките имат предварително зададено ограничение на количеството уеб съдържание, което могат да обходят. Например, Googlebot-ът няма да индексира повече от 100 KB от една страница, независимо, че му е зададено да преглежда за ключови думи в края на уеб страницата. Какво означава това? Това значи, че ако използвате ключови думи извън този лимит от 100 KB, то те няма да са видими за паяците. Следователно, би било много полезно да си създадете навик да не препълвате HEAD секцията на вашите страници с излишни скриптове и стилове. По-добре ги изнесете във външни файлове, защото иначе те просто ще избутат по-надолу в страницата важното текстово съдържание.

Съществуват много примери за индикатори за релевантност, които отчита един паяк, когато посещава дадена уеб страница. Такъв показател, например, е наситеността с ключови думи в началото на страницата. И тук, както казахме в първата част на статията, ботът не вижда задължително същите неща, които вижда интернет потребителят. Да вземем за пример лявото меню (sidebar) на вашия уеб сайт. Хората, които ще посетят вашия сайт обикновено няма първо да обърнат внимание на този sidebar. Вместо това, e много по-вероятно да фокусират вниманието си върху централната секция. Паякът, обаче, ще направи точно обратното – ще започне да обхожда страницата от лявото меню, поради простата причина, че HTML кодът му е най-близо до нейното начало.

Запомнете: по време на първото си посещение, ботът все още няма представа с кои ключови думи е обвързан вашият уеб сайт. Запомнете следната проста истина. Четейки HTML кода, паякът (който е само една компютърна програма) трябва да успее да разпознае точните ключови думи и основната тематика, около които е построен сайта ви.
След това, паякът компресира вашата страница и създава индекс обвързан с нея. За да си представите нещата максимално опростено, можете да мислите за индекса като за списък с всички думи открити във вашата страница, с няколко важни параметъра свързани с всяка дума – тяхната обвързаност, гъстота и т.н.

Едва ли някой може със абсолютна сигурност да каже какво в действителност представлява индексът, но в тази статия ще се опитаме да маркираме основните фактори, които оказват влияние върху него. Думите, които се намират най-близо до началото на една страница, по подразбиране ще се приемат от паяка за ключовите думи в нея. Всъщност, параметрите са многобройни и включват отчитането не само on-page, но и на off-page факторите, защото паякът може да открие думите, които всяка външна страница е използвала, когато е помествала линк към вашата. Следователно, по този начин ботът може да изчисли и фактора релевантност.

Когато извършвате търсене по ключова дума през някоя търсачка, тя изважда от своята база данни (индекс) всички страници, които съдържат съответната дума в съдържанието си. И тук започва истинското “оценяване” (ranking). Всяка уеб страница има определен брой on-page индикатори свързани с нея, както и с известен брой независими от съдържанието на страницата показатели (например PageRank). Сложна комбинация от всички тези фактори определя как ще бъде оценена една уеб страница.

Важно: след като вече сте направили страницата си атрактивна за посетителите, задайте си въпроса дали сте я оптимизирали за търсещите машини. В следващите статии, ще обърнем специално внимание на самата процедура по оптимизация на една уеб страница и съответно – на уеб сайт.

Comments

  • webreklama
    April 9, 2009

    А добре ли е да се тества сайта с текстов браузър?

Leave a Reply

Your email is never published nor shared. Required fields are marked *

*