Как защитится от NewsGrabber`а

для mehanic:
Ну всё же ... Вы скорее не то что не соглашаетесь, а скорее просто указали один из вариантов ...)
Я именно не соглашаюсь. Это не радикальный способ, он обходится штатными средствами граббера. Исключение - картинки. Тут придется изворачиваться иначе. Но это не сложная проблема. С ней может справиться 5-килобайтный кусок кода.
 
Гарантированных способов для текста нет. А картинки можно и не скачивать, все равно поисковикам на них пох..

Просто спрятать текст еще можно, но тогда он и поисковиам будет не виден (шифровать яваскриптом, рисовать картинкой, ...). А так, что поисковик мог грабить, а сосед не мог - тут гарантированно не получится, к сожалению. А вот испортить ему жизнь вполне получится - а там, если повезет, он и сам обломается. Пойдет к другим грабить, у кого попроще.. :)
 
Гарантированных способов для текста нет. А картинки можно и не скачивать, все равно поисковикам на них пох..

Просто спрятать текст еще можно, но тогда он и поисковиам будет не виден (шифровать яваскриптом, рисовать картинкой, ...). А так, что поисковик мог грабить, а сосед не мог - тут гарантированно не получится, к сожалению. А вот испортить ему жизнь вполне получится - а там, если повезет, он и сам обломается. Пойдет к другим грабить, у кого попроще.. :)
Канает только для говносайтов.
Кста альты и тайтлы картинок по идее могут тоже поисковиками оцениваться. Есть у когонить такая информация?
 
Альты и тайтлы у картинок конечно же оцениваются!
Но при этом скачивать саму картинку ньюсграббером совершенно необязательно. Тем более, что на ней вотермарк может быть.
 
Альты и тайтлы у картинок конечно же оцениваются!
Но при этом скачивать саму картинку ньюсграббером совершенно необязательно. Тем более, что на ней вотермарк может быть.
Ну тады ой. Граббер либо скачал картинку и разместил, либо не скачал и грохнул ее из текста.
 
проще всего кусок каждой новости (серединку) пихать в яваскрипт вверху страницы а уже непосредственно в теле новости выдавать яваскриптом нужный кусочек

т.о. если грабить то надо будет не просто освобождать от тегов новость но и бегать за куском ее вверх страницы и выдирать его из яваскрипта

программеру будет просто лень с этим возиться

к тому же в любой момент можно будет чуть-чуть поправить структуру яваскрипта и подсунуть грабберу ссулку на свой сайт вместо серединки от новости

Добавлено через 52 секунды
может быть мутно описал, как смог :nezn:
 
может быть мутно описал, как смог :nezn:
 
В дополнение могу сказать -
- сделать 30 шаблонов с различной структурой, но похожим дизайном. И менять каждый день.
- закрывать ссылки регистрацией, и ограничить время жизни cookies.
- Можно закрыть текст защитой на js- но тогда поисковики тоже небудут видеть скрытый текст.

Эта защита реализуется довольно просто. Так же читаем пост Для просмотра ссылки Войди или Зарегистрируйся Тоже полезно.
Реализация отсеит 99.9% грабинга. И не надо тут втирать про "определение контента по количеству слов, DOM и положению звёзд". Я знаю, что можно написать грабилку, которая обойдёт все методы защиты- вот только грабят обычно люди далёкие от понимания такой защиты. Вы что, расчитываете что вашем сайтом заинтерисуется пофпрограммер, для когорого код NG- открытая книга? Не зазнавайтесь:D
Тем более, даже это произойдёт, грабить будет всего несколько челов, а не **597 юзеров.
 
Самый лучши способ защиты от грабберов - в каждой статье (где-нибудь в середине) обязательно писать про свой сайт. В каждой статье это описание должно повторяться. Еще как вариант - Если кто-то очень часто забирает страницы с вашего сайта (поисковик или граббер), то можно в текст вписывать слова - ЭТА СТРАНИЦА БЫЛА СВОРОВАНА С САЙТА Для просмотра ссылки Войди или Зарегистрируйся
 
Может не совсем... но все же в продолжение темы:
а как можно от клонирования сайта защитится?
это уже становится актуальной проблемой.
сайт на пхп (движек) а передирают так, что все странички статические хтмл получаются.
 
Назад
Сверху