Добрый день!
Любой вебмастер знаком с понятием
User-Agent, а так же представляет, как диверсифицировать доступ разных поисковых (и не совсем поисковых) роботов к отдельным частям своего ресурса. Я постаралась собрать в одной статье некоторые примеры использования User-Agent-а вебмастером (с одной стороны) и программистом парсеров (с другой стороны). Помимо определения юзерагента и базовых правил настройки robots.txt, для вас может оказаться полезной информация о том, от каких «лишних» ресурсопожирающих спайдеров можно защитить свой ресурс (особенно в буржунете, где проблема роботов более актуальна).
Итак, моя статья
User-Agent и идентификация. Взгляд с разных сторон.
Буду рада всем комментариям, дополняющим и развивающим эту тему.