Как найти откуда идет мертвая внутренняя ссылка

Статус
В этой теме нельзя размещать новые ответы.

BBA1978

Постоялец
Регистрация
1 Сен 2008
Сообщения
103
Реакции
7
Господа, может быть туплю - тогда прошу меня извинить:
Гугл пишет что у него в индексе несколько моих битых страниц. Смотрю на адреса страниц в сводке ошибок гугла - етих страниц банально нет на сайте вообще. Но я не могу найти с из какого места гугл берет на них ссылку. Попробовал сделать сайтмап - та же история, в сайтмапе они тоже указаны - значит гдето в тексте страниц есть реально неправильные внутренние ссылки. НО МНЕ ИХ НЕ НАЙТИ - сайт больше 5000 страниц. Есть какой-нибудь метод поиска тих битых ссылок??? В яше блин та же катрина, и я так понимаю для продвижения то важно :( Прошу помочь новичку
 
ага, сталкивался с таким.
Самое хреновое, что это легко может быть ВНЕШНЯЯ ССЫЛКА. в каком-нибудь Squid отчете у какого-нить провайдера в открытом доступе висит годами что такого -то года пользователь зашел на такую-то страницу. И пусть этой страницы уже давно нет на сервере, а ссылка на нее все равно висит в логе в свободном доступе,
например Для просмотра ссылки Войди или Зарегистрируйся
или Для просмотра ссылки Войди или Зарегистрируйся
и пауки ее индексят..
 
немного не в тему... иногда свои сайты проверяю на ошибки, на правильный ЧПУ и на 404, 500 и т.д. - при помощи зеркалирования, а потом смотрю что скачалось и гляжу в лог.
проще всего делать это консольным wget-ом, запускаю его прямо на сервере, чтобы лишний траф не гонять.
 
Господа, может быть туплю - тогда прошу меня извинить:
Гугл пишет что у него в индексе несколько моих битых страниц. Смотрю на адреса страниц в сводке ошибок гугла - етих страниц банально нет на сайте вообще. Но я не могу найти с из какого места гугл берет на них ссылку. Попробовал сделать сайтмап - та же история, в сайтмапе они тоже указаны - значит гдето в тексте страниц есть реально неправильные внутренние ссылки. НО МНЕ ИХ НЕ НАЙТИ - сайт больше 5000 страниц. Есть какой-нибудь метод поиска тих битых ссылок??? В яше блин та же катрина, и я так понимаю для продвижения то важно :( Прошу помочь новичку

Попробуй в Google вбить site:site.com битая_ссылка.html

еще можно выкачать весь сайт качалкой типо TeleportPRo, и искать в текстах документов.
 
Да, действительно ступил, надо скачать сайт на диск и найти вхождение текста в файлы ... Всем большое спасибо.

А по поводу мертвых ссылок с провайдера - с таким еще не сталкивался, интересный пример - проверю.
 
Попробуй в Google вбить site:site.com битая_ссылка.html

еще можно выкачать весь сайт качалкой типо TeleportPRo, и искать в текстах документов.

Не пашет, этот запрос работает на текстовый - не на ссылочный контент
 
битые ссылки и мёртвые страницы

Убитые ссылки и мёртвые страницы можно собрать и посмотреть на панели Я.вебмастера (сам так чищу сайты периодически)
 
Убитые ссылки и мёртвые страницы можно собрать и посмотреть на панели Я.вебмастера (сам так чищу сайты периодически)

Я там их и смотрю - но загадка состоит в том, что не понятно ОТКУДА НА МЕРТВУЮ СТРАНИЦУ САЙТА ИДЕТ ВНУТРЕННЯЯ ССЫЛКА - С КАКОЙ СТРАНИЦЫ ИЛИ СТРАНИЦ. Вопрос то был в этом.

Кстати, SEMonitor именно выявить откуда на мертвяка идет ссылка не позволяет - действительно пока единственный найденный способ - это качнуть сайт к себе на диск, причем не в виде PHP естественно - а типа простой выкачивалкой сайтов по HTML, и устроить поиск по вхождению текста в файлы.
 
у Дримвивера есть стандартная функция проверки ссылок и ресурсов в проэкте.
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху