Иногда может возникнуть необходимость убрать из поисковой выдачи ненужные страницы Вашего сайта и заблокировать доступ сканеров к содержимому. Например, страницы, на которых случайно попала персональная информация. В таком случае есть ряд мер, которые можно предпринять, чтобы удалить адрес со страниц поисковой выдачи поисковых машин.
Рекомендуемые методы.
1. .htaccess
Для того чтобы запретить роботу или кому-либо другому доступ к URL, можно страницу или целую папку защитить паролем. Робот не занимается подбором пароля, поэтому это сделает доступ невозможным.
Для этого создаем в корневом каталоге сайта файл с названием “.htaccess”, и прописываем в него такой код чтобы запретить доступ к каталогу:
AuthUserFile /full/path/to/.htpasswd
AuthType Basic
AuthName "Секретный каталог"
Require valid-user
и такой если требуется закрыть определенный файл:
AuthUserFile /full/path/to/.htpasswd
AuthType Basic
AuthName "Секретная страница"
Require valid-user
Далее надо создать файл “.htpasswd” в котором будут хранится логин и пароль для доступа к закрытым каталогая или файлам в таком виде:
login:password
2. URL Removal Tool
Этот инструмент доступен на панели инструментов Google для веб-мастеров так что вы можете занести необходимый адрес в Google чтобы робот не индексировал URL. Кроме того, вы можете удалить весь домен, подкаталог или отдельный URL. Одним из недостатков этого метода является то, что иногда это занимает несколько дней.

тоже самое у Яндекса.

Альтернативные методы.
3. robots.txt
Вы можете запретить роботам доступ к URL в файле robots.txt который находится в корневом каталоге сайта. Проблемой этого метода является то, что Google и другие поисковые системы могут найти Ваш URL, если кто-то поставит ссылку на эту страницу.
Для этого надо создать файл robots.txt в корневой директории сайта с таким кодом:
User-agent: Yandex - бот Яндекса.
User-agent: Googlebot - бот Гугл.
User-agent: Googlebot-Image - бот картиночник Гугл.
User-agent: * - для всех ботов.
Allow: / - разрешить доступ ко всему
Allow: /wp-admin/ - разрешить доступ к папке
Allow: /wp-login.php - разрешить доступ к файлу
Disallow: / - запретить доступ ко всему
Disallow: /wp-admin/ - запретить доступ к папке
Disallow: /wp-login.php - запретить доступ к файлу
Пример
User-agent: Googlebot-Image
Disallow: /images/image.jpg
- этот код запрещает доступ к файлу картинке для бота картинок Гугл.
4. noindex
Использование этого мета-тега представляет собой простой метод, который ограничивает доступ к странице сканерам, но это касается робота Google и Ядекска, с другими поисковиками этот метод может не работать.
Пишем этот код
<meta name=”robots” content=”noindex” />
между тегами head и страница не будет индексировать.
<noindex>Этот текст не будет проиндексирован.</noindex>
Также есть атрибут nofollow – но практически толку от него мало. И отсутствии внешних ссылок на страницу ботам она будет не доступна.
P.S.
Решили приобрести авто, сейчас самое время – каталог авто информация газеты объявлений “Из рук в руки”.
P.S. 2
Вас интересуют большие машины, техника для карьеров – супермощная и суперпроизводительная и в тоже время экономная.
Популярность: 18%
Понравился пост, не стесняйся - подпишись на рассылку RSS!