Админ психанул robots.txt
Да именно так. Создал сайт и только закинув его в Гугл вебмастер не ожидал такой быстрой индексации livestreet. B тут полезли в поиске /talk/, /my, /error/ и ещё много чего. Вот и решил кардинально по закрывать лишнее. Так же закрыл
Disallow:/discussed/
Disallow: /question/
Disallow: /link/
Disallow: /top/
Так же думаю не закрыть ли мне /blog. Так как кратное описание статей блогов это по сути дубли контента
Я прав или мне нужно попить успокоительное ))
Disallow:/discussed/
Disallow: /question/
Disallow: /link/
Disallow: /top/
Так же думаю не закрыть ли мне /blog. Так как кратное описание статей блогов это по сути дубли контента
Я прав или мне нужно попить успокоительное ))
User-agent: * Disallow: /rss Disallow: /search/topics/$ Disallow: /search/opensearch/$ Disallow: /cgi-bin Disallow: /classes Disallow: /config Disallow: /registration/ Disallow: /login/ Disallow: /engine Disallow: /include Disallow: /logs Disallow: /plugins Disallow: /templates Disallow: /feed/ Disallow: /admin Disallow: /webstat Disallow: /mainpreview/ Disallow: /stream Disallow: /my/$ Disallow: /tag/$ Disallow: /page/$ Disallow: /topic/$ Disallow: /profile/$ Disallow: /people Disallow: /subscribe/$ Disallow: /blogs Disallow: /talk/ Disallow: /error/ Disallow: /subscribe/ Disallow: /settings/$ Disallow: /photoset/$ Disallow: /question/$ Disallow: /discussed/ Disallow: /message/$ Disallow: /question/ Disallow: /link/ Disallow: /top/ User-agent: Yandex Disallow: /rss Disallow: /search/topics/$ Disallow: /search/opensearch/$ Disallow: /cgi-bin Disallow: /classes Disallow: /config Disallow: /registration/ Disallow: /login/ Disallow: /engine Disallow: /include Disallow: /logs Disallow: /plugins Disallow: /templates Disallow: /feed/ Disallow: /admin Disallow: /webstat Disallow: /mainpreview/ Disallow: /stream Disallow: /my/$ Disallow: /tag/$ Disallow: /page/$ Disallow: /topic/$ Disallow: /profile/$ Disallow: /people Disallow: /subscribe/$ Disallow: /blogs Disallow: /talk/ Disallow: /error/ Disallow: /subscribe/ Disallow: /settings/$ Disallow: /photoset/$ Disallow: /question/$ Disallow: /discussed/ Disallow: /message/$ Disallow: /question/ Disallow: /link/ Disallow: /top/ Sitemap: http:site.org/sitemap.xml Host: site.org
10 комментариев
Это то чем не угодили?
http://livestreetguide.com/robots.txt
Зачем для яндекса дублировать? он адекватный.
Вопрос. Что такое /robotstxt/$
это все можно унифицировать и писать для всех и гугла в т.ч. — оно ему не мешает.
а это закрытие экшена плагина-редактора robots.txt
User-agent: * # не будет использована роботами Яндекса
Disallow: /cgi-bin
Следующим роботам Яндекса можно указать отдельные директивы:
'YandexBot' — основной индексирующий робот;
'YandexMedia' — робот, индексирующий мультимедийные данные;
'YandexImages' — индексатор Яндекс.Картинок;
'YandexCatalog' — «простукивалка» Яндекс.Каталога, используется для временного снятия с публикации недоступных сайтов в Каталоге;
'YaDirectFetcher' — робот Яндекс.Директа, интерпретирует robots.txt особым образом;
'YandexBlogs' — робот поиска по блогам, индексирующий посты и комментарии;
'YandexNews' — робот Яндекс.Новостей;
'YandexPagechecker' — валидатор микроразметки;
‘YandexMetrika’ — робот Яндекс.Метрики;
‘YandexMarket’— робот Яндекс.Маркета;
‘YandexCalendar’ — робот Яндекс.Календаря.
Для каждого из них также действительно правило: если обнаружены директивы для конкретного робота, директивы 'User-agent: Yandex' и 'User-agent: *' не используются.
Пример:
User-agent: YandexBot # будет использоваться только основным индексирующим роботом
Disallow: /*id=
User-agent: Yandex # будет использована всеми роботами Яндекса
Disallow: /*sid= # кроме основного индексирующего
User-agent: * # не будет использована роботами Яндекса
Disallow: /cgi-bin
это блоги
люди
профиль
почта
Закрыл discussed, question, link, top Так как это по сути дубли одного и того же контента.