Как защититься от бана?

Статус
В этой теме нельзя размещать новые ответы.
Просто нужен синонимайзер, который сможет пересказать своими словами, то что он сграбил)))) Я думаю технологии уже на подходе)
 
согласен, да и на джумле тоже. в прошлом году поставил на 300 сайтов систему граббинга с многих сайтов, но одних и тех же статей. что дальше? забанили все, 300 сайтов, у меня уже год траур.
поэтому в перемешку лучше всего грабить, выбрать 10 сайтов разнотопиковых и СДЛ и тогда пойдет дело..


На одном IP висели сайты?
 
Проводил тестирование компонента NewsGrabberJC Pro 1.3 на одной площадке. Были настроены две ленты (rss-граббинг), в новостной блог новости с доноров шли вперемешку. В день копировалось ~по 2 новости с донора. В итоге месяца через три сайт выпал из индекса Яндекса (На сейчас в индексе только главная, до установки скрипта в индексе было страниц 200). При этом в настройках компонента были включены: синонимизация по дефолтному словарю, замена тегов, замена кирилических символов на латинские. Паралельно сайт наполнялся уником, но естественно в заметно меньших объемах. Расскажите свой опыт по теме. Кто как защищается от бана и был ли он?
Если есть навыки программирования можно прямо внутрь каждой статьи что-то свое запихивать. Мне кажется именно из за синомизации и банят.
 
Синонимизация слабо помогает, по опыту могу сказать... Замена букв кириллицы на латинские - тоже не дает никакого положительного эффекта. Перемешивание + изменение Html-структуры, у меня дало наибольший резлультат.
 
Сделай, для грабящихся новостей отдельную категорию, и закрой её в robots.txt, правда seo компонент нужен будет, для ссылки типа site.ru/category/url.html
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху