Question 1

Чем robots.txt отличается от meta-тега noindex?

Accepted Answer

robots.txt — на уровне сайта, до запроса страницы: «не ходи сюда». noindex — на уровне самой страницы, бот должен зайти и прочитать тег. Для уже проиндексированных страниц noindex надёжнее: бот зайдёт, увидит запрет и уберёт из выдачи. robots.txt Disallow на уже проиндексированной странице может не убрать её сразу — бот туда просто не зайдёт.

Question 2

Можно ли через robots.txt спрятать секретную страницу?

Accepted Answer

Нет, и это типичная ошибка. Файл robots.txt публичный — любой может его открыть и узнать «запрещённые» URL. Если страница реально секретная — закрывайте её авторизацией или удаляйте из публичного доступа на уровне сервера.

Question 3

Что значит Allow: / и Disallow: одновременно?

Accepted Answer

Allow: / разрешает обход всего сайта, Disallow: /admin запрещает один раздел. Более специфичное правило (Disallow на конкретный путь) перекрывает общее (Allow на корень). Большинство ботов корректно обрабатывает такие комбинации.

Question 4

Нужно ли указывать sitemap в robots.txt, если он есть в Я.Вебмастере?

Accepted Answer

Желательно — да. В Я.Вебмастере и Search Console sitemap видят основные поисковики, а AI-боты обычно ищут sitemap в robots.txt. Дублирование (Sitemap: https://site.ru/sitemap.xml в конце robots.txt + регистрация в вебмастерах) — самый надёжный вариант.

robots.txt

Связанные термины

Частые вопросы