Файл robots.txt — это текстовый файл, который сообщает поисковым системам, какие страницы или разделы вашего сайта должны быть сканированы, а какие — нет. Этот файл особенно важен для оптимизации индексации вашего сайта и улучшения его работы в поисковых системах. В этой статье мы разберём, как правильно составить файл robots.txt для сайта на WordPress.
Зачем нужен robots.txt?
— Управление индексацией. Вы можете закрыть от поисковых систем ненужные страницы, такие как административные разделы или страницы с технической информацией.
— Оптимизация бюджета сканирования. Поисковые системы имеют ограниченные ресурсы для сканирования, поэтому важно направить их на нужные страницы.
— Улучшение SEO. Файл robots.txt помогает поисковым системам быстрее индексировать важные разделы сайта, что положительно сказывается на SEO.
Базовая структура файла robots.txt
Файл robots.txt состоит из следующих директив:
— User-agent. Указывает, для какого поискового робота предназначены правила. Например, User-agent: * — это правило для всех поисковых систем.
— Disallow. Запрещает сканирование определённых разделов сайта.
— Allow. Разрешает сканирование, если оно запрещено глобально, но требуется для конкретных страниц.
— Sitemap. Указывает путь к XML-карте сайта.

Пример правильного robots.txt для WordPress
Вот пример файла robots.txt, который подходит для большинства сайтов на WordPress:
User-agent: *
Disallow: /wp-admin/
Disallow: /wp-includes/
Disallow: /wp-content/plugins/
Disallow: /wp-content/cache/
Disallow: /readme.html
Disallow: /xmlrpc.php
Disallow: /?s=
Disallow: /search/
Disallow: /author/
Allow: /wp-admin/admin-ajax.php
Sitemap: https://ваш_сайт/sitemap.xml
Разбор правил
— Запрет сканирования технических разделов:
/wp-admin/ — это административная панель, которая не должна индексироваться.
/wp-includes/ — содержит системные файлы WordPress.
/wp-content/plugins/ и /wp-content/cache/ — папки с плагинами и кэшем, которые не несут ценности для поисковых систем.
— Защита от индексации динамических URL:
/readme.html — файл с информацией о версии WordPress, который лучше скрыть.
/xmlrpc.php — технический файл, который может быть использован для атаки на сайт.
/?s= и /search/ — страницы поиска не содержат уникального контента и могут создать дубли.
— Разрешение для AJAX:
Allow: /wp-admin/admin-ajax.php — разрешает доступ к AJAX-файлам, которые нужны для работы некоторых плагинов.
— Добавление Sitemap:
Указание пути к XML-карте сайта позволяет поисковым системам быстрее находить ваши страницы.

Как создать и загрузить robots.txt
Создание файла:
Откройте текстовый редактор (например, Notepad) и сохраните файл с именем robots.txt.
Загрузка на сервер:
Поместите файл в корневую папку вашего сайта через FTP-клиент или файловый менеджер хостинга.
Проверка работоспособности:
Введите в адресную строку браузера https://ваш_сайт/robots.txt и проверьте содержимое файла.
Полезные советы
— Не закрывайте важные страницы. Убедитесь, что файл robots.txt не запрещает доступ к страницам, которые вы хотите индексировать.
— Используйте Google Search Console. С помощью инструмента «Проверка файла robots.txt» вы можете проверить, правильно ли он настроен.
— Регулярно проверяйте настройки. После установки новых плагинов или тем убедитесь, что они не изменили ваш файл robots.txt.
Заключение
Файл robots.txt — это мощный инструмент управления индексацией вашего сайта. Правильно настроенный, он помогает поисковым системам эффективно сканировать ваш сайт, что положительно сказывается на его видимости и сео продвижении WordPress. Следуйте приведенным рекомендациям, чтобы создать оптимальный файл robots.txt для вашего сайта на WordPress.

