Комментарии / Публикации hollywood1 / LiveStreet CMS

hollywood1
27 января 2015, 16:03
0

У меня не один сайт сделан и на разных движках. Как бы не новичок. Везде привык дублировать потому что раньше так рекомендовали при правильном написании роботс. Даже не задумывался. Сейчас просмотрев инфу понимаю что можно от этого пережитка прошлого и отказаться. Но что значит это?
User-agent: * # не будет использована роботами Яндекса
Disallow: /cgi-bin

Следующим роботам Яндекса можно указать отдельные директивы:

'YandexBot' — основной индексирующий робот;
'YandexMedia' — робот, индексирующий мультимедийные данные;
'YandexImages' — индексатор Яндекс.Картинок;
'YandexCatalog' — «простукивалка» Яндекс.Каталога, используется для временного снятия с публикации недоступных сайтов в Каталоге;

'YaDirectFetcher' — робот Яндекс.Директа, интерпретирует robots.txt особым образом;
'YandexBlogs' — робот поиска по блогам, индексирующий посты и комментарии;
'YandexNews' — робот Яндекс.Новостей;
'YandexPagechecker' — валидатор микроразметки;
‘YandexMetrika’ — робот Яндекс.Метрики;
‘YandexMarket’— робот Яндекс.Маркета;
‘YandexCalendar’ — робот Яндекс.Календаря.

Для каждого из них также действительно правило: если обнаружены директивы для конкретного робота, директивы 'User-agent: Yandex' и 'User-agent: *' не используются.

Пример:

User-agent: YandexBot # будет использоваться только основным индексирующим роботом
Disallow: /*id=
User-agent: Yandex # будет использована всеми роботами Яндекса
Disallow: /*sid= # кроме основного индексирующего
User-agent: * # не будет использована роботами Яндекса
Disallow: /cgi-bin

Блог им. hollywood1 → Админ психанул robots.txt 10

hollywood1
27 января 2015, 15:34
0

Я не просто так по закрывал: registration, plugins, mainpreview, profile, people. Гугл вебмастер это все проиндексировал.
Закрыл discussed, question, link, top Так как это по сути дубли одного и того же контента.

Блог им. hollywood1 → Админ психанул robots.txt 10

hollywood1
27 января 2015, 15:16
0

По правилам создания роботс для Яши нужно ( по крайне мере рекомендуют) отдельно прописывать правила. Если Гугл сообразительный то Яша требует прописывать и карту сайта и основной домен в роботс.
Вопрос. Что такое /robotstxt/$

Блог им. hollywood1 → Админ психанул robots.txt 10

hollywood1
27 января 2015, 15:13
0

Да. Гугл вебмастер с какой то балды начал индексировать плагины /mainpreview/ Вот и решил вообще папку /plugins закрыть. И если он такой стал шустрый то не чего ему делать и в шаблонах.

Блог им. hollywood1 → Админ психанул robots.txt 10

hollywood1
4 января 2015, 22:42
0

Ясно. Теперь нужно напрягать разрабов плагинов и шаблона моего )))

Блог разработки LiveStreet → Новогодняя альфа 140

hollywood1
4 января 2015, 01:06
0

Я так понимаю процесс обновления с 1.0 до 2.0 будет без проблем?

Блог разработки LiveStreet → Новогодняя альфа 140

Платные расширения из каталога

hollywood1