Баны доров и причина

Статус
В этой теме нельзя размещать новые ответы.
  • Заблокирован
  • #61
Ну дык сколько сайтов не то что 2 дня, месяцами не обновляются и их не банят. В тематиках с высокой конкуренцией, возможно стук одна из главных причин, ведь есть доры с которых трафа очень мало капает, а живут они очень долго, хотя от забаненных (с высокой конкуренцией) ни чем не отличаются

Просто если сайт попал в топ то подразумевается серьёзный подход к проэкту и большая посещаемость, т.е. обновление обязательно. Мне падумалось что гугль может присматриваться к таким "резко всплывшим" и если они неоправдывают доверия то бан.
Но о5 же это просто размышление на тему
 
Но этом доре ТОЛЬКО перелинковка и генерированый (кстати не марков) текст. Дор 26 страничек. Вывод палится текст! Может конечно палится перелинковка, но думаю врятли, тупо банить сайты за удобную навигацию!

Опять же недумаю что мой текст был неуникальным (сканированый, с перемешаными строками) но читабельность конечно страдала..

И как можно выпалить такой текст? Проверяя граматику.. Но согласитесь, тогда то что я пишу на форуме практически генерированый текст! У меня голова так работает, я так и пишу, хоть это и неправильное построение предложения!

А если я неодин такой? - неможет проверятся граматика, палится текст чемто другим.

перемешивание строк безполезно, это не разбивает шингл - "Для каждого десятисловия текста рассчитывается контрольная сумма (шингл). Десятисловия идут внахлест, с перекрытием, так, чтобы ни одно не пропало. А затем из всего множества контрольных сумм (очевидно, что их столько же, сколько слов в документе минус 9) отбираются только те, которые делятся на, скажем, 25. Поскольку значения контрольных сумм распределены равномерно, критерий выборки никак не привязан к особенностям текста. Ясно, что повтор даже одного десятисловия – весомый признак дублирования, если же их много, скажем, больше половины, то с определенной (несложно оценить вероятность) уверенностью можно утверждать: копия найдена! Ведь один совпавший шингл в выборке соответствует примерно 25 совпавшим десятисловиям в полном тексте!"

По поводу возможности анализа поведения юзера гуглом
через тулбар я думаю необходимо внимательно почитать терм оф юз там написано следующее

"Панел инструментов Google предназначена для использования в сочетании с Поисковыми службами. Соответственно, испоьззование панели инструментов Google определяется так же “Условиями предоставления услуг” та “Политикой конфеденциальности и безопасности ” компании Google."

Вобщем в условиях предоставления пишутся стандартные фразы типа "мы не за что не отвечаем". А в условиях конфеденциальности гугл идет в ногу со временем, нарушаете закон - заложим вас с потрохами, кстати преценденты бывали. Еще не мешало бы почитать федеральные законы и законы штата где гугля зареген как юр лицо, на тему личных прав, но это геморно ... Имхо значительно повышаются шансы на анонимность отсутствие галочки в чекбоксе "Помочь гуглу в совершенствовании панели инструментов ", по умолчанию ее там нет, однако однозначных выводов на тему тулбара делать не стоит, разве что Брин в дружественной беседе за кружкой пива не спалил тему))) Еще умельци могут порыться в коде тулбара, думаю это может прояснить некоторые моменты, будет очень интерестно почитать про результаты.
 
мое мнение таково:
сайт анализируется на подозрительность и набирает пойнты за:
- заезженный шаблон,
- отрабатываемые ботами редиректы
- нескрытые рефссылки на спонсоров (скажем ссылка "ПОРНО ЗДЕСЬ!" и урл рефссылки на спонсора)
- слишком большое количество внутренних ссылок на главной странице
- слишком большое количество кейвордов в тексте (пицот кейвордов на 1кб текста)
- несоотвствие тематики ссылок и текста (ссылки скажем фарма, а текст про вышивание крестиком)
- домен свежезареган
- домен зареган на приват персон или зареган на определенное фио
- домен висит на определенных нсах
- сайт расположен на определенном ипе
- на этом ипе уже находится энное количество забанненых сайтов
- на сайте встречаются определенные стоп-слова (скажем, зоо-,некро-,педо- и прочие филии или угрозы насилия)
- на сайт ссылаются сайты, находящиеся в определенных фильтрах (скажем сайты, которые помечены как линкопомойки)
- карма вебмастера (личные характеристики вебмастера, которые каким-то образом передаются на индексируемый бот при определенной фазе луны и других астрономических небесных тел)
 
Касаемо Маркова

Касаемо Маркова. И того, как гугля может палить Марковские доры:

1 Возьмите любой исходный обычный читаемый текст и сожмите его zip-арихватором.

2 Теперь на основе этого текста сгенерите страничку дора Марковым, урежьте ее размер до размера исходного текста и тоже зазипуйте.

Повторить 1 и 2 несколько раз.

Сравните размеры зип-архивов исходных текстов и Марковских.
 
насчет маркова - только один вопрос: и что? не понял, нафиг их зипить...
 
это к тому что много повторений слов :)
 
  • Заблокирован
  • #67
- карма вебмастера (личные характеристики вебмастера, которые каким-то образом передаются на индексируемый бот при определенной фазе луны и других астрономических небесных тел)

Я тоже раньше стебался на эту тему, но сегодня утром убедился что это так)))

Когда выпадает ювелирная работа, прожив всего два дня и даже неуспев вылезти толком, тут только карма =(
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху