adamsadriane
Постоялец
- Регистрация
- 27 Мар 2008
- Сообщения
- 62
- Реакции
- 10
- Автор темы
- #1
В связи с большим количеством вопросов по правильной индексации сайтов на основе DLE, выкладываю правила для создания robots.txt для DLE.
Создание robotx.txt для dle.
Ситуация:
Яндекс индексирует страницы для печати (print:...) и, со временем, выбрасывает новости, для которых соответствуют страницы для печати.
Результат:
Со временем сайт в поисковом индексе представляет собой почти сплошное собрание страниц для печати.
Проблема:
Для бирж ссылок трудно продать ссылки с этих страниц.
Решение:
Запрещаем страницы для печати:
User-agent: *
Disallow: /*print
Ситуация:
Индексируются страницы /user/. Спамеры "толкают" страницы на их профили т.к. последние содержат внешние ссылки (спам).
Результат:
Передаются ненужные Вам веса спамерским ссылкам.
Решение:
Запрещаем /user/:
Disallow: /*print
Ситуация:
Индексируются страницы, не содержащие контент.
Результат:
Всё равно выпадут со временем, лишняя нагрузка на поискового робота, ненужные директивы.
Решение:
Запрещаем подобные директории:
Disallow: /backup/
Disallow: /engine/
Disallow: /language/
Disallow: /templates/
Disallow: /upgrade/
Disallow: /uploads/
Disallow: /autobackup.php
Disallow: /admin.php
Ситуация:
Индексируются страницы вида: */index.php?do=*
Результат:
Никакой пользы для сайта не принесут.
Решение:
Запрещаем все такие страницы, а также страницу /index.php?subaction=newposts и /?do=lastcomments. Ну и статистику не мешало бы убрать (Disallow: /statistics.html
Disallow: /index.php?do=addnews
Disallow: /index.php?do=feedback
Disallow: /index.php?do=lostpassword
Disallow: /index.php?do=pm
Disallow: /index.php?do=register
Disallow: /index.php?do=stats
Disallow: /index.php?do=search
Disallow: /index.php?subaction=newposts
Disallow: /?do=lastcomments
Disallow: /statistics.html
Не лишним будет напомнить, что нужно обязательно создавать карту сайта в админ панели.
Карта сайта будет находится по адресу: Ваш_сайт/sitemap.xml
Далее явно задаём местонахождение нашей карты сайта в robots.txt:
Sitemap: Ваш_сайт/sitemap.xml
Явно задаём хост.
Host: Ваш_сайт
Nota bene!: Если иметь много сайтов на одном аккаунте хостинга, на некоторых панелях хостинга (hsphere, directadmin) из-за отсутствия задания хоста может возникнуть склеивание всех сайтов в виде заркал для сайта, идущего первым по алфавиту. Поэтому хост берём за правило прописывать явно.
Nota bene 2!: Задаём хост, учитывая что:
# Ваш_сайт является главным зеркалом Для просмотра ссылки Войдиили Зарегистрируйся,
# тогда корректное использование директивы Host такое
User-Agent: *
Disallow:
Host: Ваш_сайт
Подводим итог и выводим общий вид универсального robots.txt для сайта на CMS DLE:
PS: в зависимости от дефолтных папок, присутствующих в разных панелях хостинга (в частности, папка cgi-bin), а также папок, добавляемых по собственной необходимости, не забываем их вписывать.
Вставляйте в каждый из Ваших сайтов, не ленитесь и всё у Вас будет хорошо.
Создание robotx.txt для dle.
Ситуация:
Яндекс индексирует страницы для печати (print:...) и, со временем, выбрасывает новости, для которых соответствуют страницы для печати.
Результат:
Со временем сайт в поисковом индексе представляет собой почти сплошное собрание страниц для печати.
Проблема:
Для бирж ссылок трудно продать ссылки с этих страниц.
Решение:
Запрещаем страницы для печати:
User-agent: *
Disallow: /*print
Ситуация:
Индексируются страницы /user/. Спамеры "толкают" страницы на их профили т.к. последние содержат внешние ссылки (спам).
Результат:
Передаются ненужные Вам веса спамерским ссылкам.
Решение:
Запрещаем /user/:
Disallow: /*print
Ситуация:
Индексируются страницы, не содержащие контент.
Результат:
Всё равно выпадут со временем, лишняя нагрузка на поискового робота, ненужные директивы.
Решение:
Запрещаем подобные директории:
Disallow: /backup/
Disallow: /engine/
Disallow: /language/
Disallow: /templates/
Disallow: /upgrade/
Disallow: /uploads/
Disallow: /autobackup.php
Disallow: /admin.php
Ситуация:
Индексируются страницы вида: */index.php?do=*
Результат:
Никакой пользы для сайта не принесут.
Решение:
Запрещаем все такие страницы, а также страницу /index.php?subaction=newposts и /?do=lastcomments. Ну и статистику не мешало бы убрать (Disallow: /statistics.html
Disallow: /index.php?do=addnews
Disallow: /index.php?do=feedback
Disallow: /index.php?do=lostpassword
Disallow: /index.php?do=pm
Disallow: /index.php?do=register
Disallow: /index.php?do=stats
Disallow: /index.php?do=search
Disallow: /index.php?subaction=newposts
Disallow: /?do=lastcomments
Disallow: /statistics.html
Не лишним будет напомнить, что нужно обязательно создавать карту сайта в админ панели.
Карта сайта будет находится по адресу: Ваш_сайт/sitemap.xml
Далее явно задаём местонахождение нашей карты сайта в robots.txt:
Sitemap: Ваш_сайт/sitemap.xml
Явно задаём хост.
Host: Ваш_сайт
Nota bene!: Если иметь много сайтов на одном аккаунте хостинга, на некоторых панелях хостинга (hsphere, directadmin) из-за отсутствия задания хоста может возникнуть склеивание всех сайтов в виде заркал для сайта, идущего первым по алфавиту. Поэтому хост берём за правило прописывать явно.
Nota bene 2!: Задаём хост, учитывая что:
# Ваш_сайт является главным зеркалом Для просмотра ссылки Войди
# тогда корректное использование директивы Host такое
User-Agent: *
Disallow:
Host: Ваш_сайт
Подводим итог и выводим общий вид универсального robots.txt для сайта на CMS DLE:
Код:
User-agent: *
Disallow: /*print
Disallow: /user/
Disallow: /backup/
Disallow: /engine/
Disallow: /language/
Disallow: /templates/
Disallow: /upgrade/
Disallow: /uploads/
Disallow: /autobackup.php
Disallow: /admin.php
Disallow: /index.php?do=addnews
Disallow: /index.php?do=feedback
Disallow: /index.php?do=lostpassword
Disallow: /index.php?do=pm
Disallow: /index.php?do=register
Disallow: /index.php?do=stats
Disallow: /index.php?do=search
Disallow: /index.php?subaction=newposts
Disallow: /?do=lastcomments
Disallow: /statistics.html
Host: Ваш_сайт
Sitemap: http://Ваш_сайт/sitemap.xml
Вставляйте в каждый из Ваших сайтов, не ленитесь и всё у Вас будет хорошо.