Robomap Project: подводим итоги.

Пожалуй, пришло время подвести результаты проекта RoboMap.

За прошедшие три недели была собрана довольно занимательная статистика о поведении различных поисковиков и теперь я попробую ее проанализировать.

Бесспорным лидером оказался [b]Google[/b]. С самого начала расковыряв большую часть видов ссылок, он удержал лидерство до конца. Так же интересно заметить, что он подгрузил CSS, использованные на странице. Напрашивается вывод, что это ему необходимо для проверки на скрытые блоки текста и прочие приемы черной оптимизации, основанные на CSS.

Как ни странно, второе место занял [b]MSN/Live[/b] от великой корпорации Майкрософт. Он сумел опознать php-редирект и js-ссылку при помощи window.open(). Тем не менее, налицо неспешность и полное отсутствие любопытства к обновлению контента. В частности, сборщик статистики не зафиксировал его обращения к главной странице, а так же проверок на обновления.

[b]Yandex[/b], [b]Rambler[/b] и [b]Yahoo[/b] поделили третье место: прошли только по редиректу и на том успокоились. В то же время, все они повели себя по-разному. Вкратце обрисую ситуацию по каждому из них.

[b]Yandex[/b] выделился своим собственным вариантом интерпретации robots.txt. Страницы со статистикой были намеренно запрещены для индексации, но директивы Disallow шли после "Allow: /". Ну и согласно мнению Яши, решение о возможности индексации страницы надо принимать по первому правилу, совпадающему с адресом. В итоге статистика попала в индекс. CSS он вроде как не грузил.

[b]Rambler[/b] вообще ничего интересного о себе не рассказал. Впрочем в связи с покупкой Рамблера Гуглем, это уже не слишком актуально.

[b]Yahoo[/b] загрузил только одну CSS из двух. С какой целью он это сделал, не совсем понятно, но есть подозрение, что он догружает их каким-то особым ботом, который сборщиком статистики не определился.

Вот такие вот результаты... Если у кого-то появится желание провести подобное исследование, я могу опубликовать исходный код проекта.



Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
CAPTCHA
This question is for testing whether you are a human visitor and to prevent automated spam submissions.
10 + 4 =
Solve this simple math problem and enter the result. E.g. for 1+3, enter 4.