файл robots.txt

Привет друзья, покажу Вам как правильно настраивается, составляется файл robots.txt А так же поймете и запомните почему и каким образом этот маленький казалось бы файл влияет на индексирование сайта поисковыми системами! Составление по всем правилам этого файла — плюс к хорошей индексации вашего сайта / блога. И так давайте приступим и начнем изучение

Рекомендую подписаться на обновление блога чтобы не пропускать выходы нового материала на сайте

Что такое файл robots.txt и для чего он нужен

Вот представьте, когда Вы пишите на бумаге ручкой и используете русские слова. Эти слова составляют предложения и так далее — есть готовый текст. Что Вы используете для правильного написания слов? Не догадались еще? Правила грамотного написания, все мы в школе это проходили. Учили — учили эти самые правила, а затем эти все правила сформировались в привычку, и пишем на автомате грамотно! К чему это все здесь про русский язык?

что такое robots.txt

Поисковые машины ( Яндекс, Google для примера ) использует похожую схему работы. Для понимания поисковой машине что нужно индексировать на сайте, а что нет. И существует этот заветный robots.txt В этом файле и находятся те самые правила, которые указывают Поисковикам — вот это просмотреть, а на это не следует обращать внимания.

Поясню, зачем собственно поисковые машины приходят на сайт, просматривают файл robots.txt и начинают сканировать весь сайт. А все дело друзья в индексации страниц, постов, называйте как хотите. А чем больше проиндексированных страниц на сайте, тем больше их в поисковой выдаче. А раз так, то и посетителей придет больше из поисковых систем на ваш сайт.

что такое индексация

Отнеситесь к составление robots.txt со всей своей ответственностью. И поисковые роботы на Ваш сайт будут приходить с улыбкой =)

Составляем правильный robots.txt для wordpress

— Создаете у себя на компьютере в «Блокноте» новый файл, даете ему имя robots.txt и вставляете код, который представлен ниже, сохраняете файл. Готовый файл копируете / перемещаете на сервер, где находится ваш сайт. Вот здесь я писал о хостинге, он же сервер. Файл должен располагаться в корне вашего сайта например : vpluce.ru/robots.txt , у кого-то может быть иное расположение, такое как vpluce.ru/public_html/robots.txt

Если хотите проверить расположение этого файла, возьмите прям в адресной строке вашего браузера наберите http://vpluce.ru/robots.txt — посмотрите тот же код что и ниже

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
User-agent: *
Disallow: /cgi-bin
Disallow: /wp-admin
Disallow: /wp-includes
Disallow: /wp-content/plugins
Disallow: /wp-content/cache
Disallow: /wp-content/themes
Disallow: /trackback
Disallow: */trackback
Disallow: */*/trackback
Disallow: */*/feed/*/
Disallow: */feed
Disallow: /*?*
 
User-agent: Yandex
Disallow: /cgi-bin
Disallow: /wp-admin
Disallow: /wp-includes
Disallow: /wp-content/plugins
Disallow: /wp-content/cache
Disallow: /wp-content/themes
Disallow: /trackback
Disallow: */trackback
Disallow: */*/trackback
Disallow: */*/feed/*/
Disallow: */feed
Disallow: /*?*
Host: vpluce.ru
Sitemap: http://vpluce.ru/sitemap.xml.gz
Sitemap: http://vpluce.ru/sitemap.xml

Здесь поясню поподробней, чтобы Вы могли читать эти правила для поисковых систем

User-agent: * — директива распространения правил. Звездочкой ( * ) обозначено на все поисковые машины.

User-agent: Yandex — правила для поисковика Яндекс
Disallow: /moi-katalog — директива, которая запрещает индексацию этого самого каталога «moi-katalog».

Таким способом, если у Вас есть каталоги, которые Вы бы не хотите, чтобы индексировались, то добавляете еще одну директиву Disallow: /nazvanie_kataloga

Host: vpluce.ru — здесь прописываете адрес вашего сайта. Очень важно понимать, что есть огромное различие в www.vpluce.ru и vpluce.ru Чтобы не ошибиться в правильности написания, зайдите в настройки WordPress через админ. панель движка и посмотрите в кладке Параметры — Общие . Посмотрите как выглядит у меня в настройках блога:

настройка адреса блога

Sitemap: http://vpluce.ru/sitemap.xml.gz — сжатая карта сайта
Sitemap: http://vpluce.ru/sitemap.xml — карта сайта

Поставьте себе обязательно плагин Google XML Sitemaps который Вам и создаст Карту сайту вашего блога. Как установить плагин и что такое карта сайта ( ссылка на пост!!!) — помогут эти статьи

Подытожим, что мы сделали : создали файл robots.txt , который информирует поисковые системы о правилах индексации вашего блога, плюс в плане индексации самих страниц, которые есть на блоге это будет полезно!