Поднять тИЦ

Статус
В этой теме нельзя размещать новые ответы.
Трудно сказать, что приводит к бану, у меня например доры, сгенерённые по маркову не забанили за год.
как правило абузы и спам приводят к бану.
 
если бы абузы... бан происхоид автоматом, как только станивиться понятно что сайт дор, признаки дора - редирект, плотность ключевиков, хостинг, беки и тп цепь маркова в том числе
 
как правило абузы и спам приводят к бану.
Если спам приводил к бану, конкурентов бы топили пачками.

Уже давно заявлено всеми ПС - "За внешние факторы не банят"

Забанят, только если спамишь левый сайт, который неудовлетворяет правилам размещения в поисковых системах. Проще говоря ДОРы и прочие сайты для зароботка.
 
очень любопытно, не забанил кто? Яндекс?
для справки: поисковики определяют маркова на ура
Рамблер не забанил совсем, Яндекс через полгода где-то пессимизировал (трафик сильно уменьшился, но в индексе сайт остался). Откуда кстати инфа про "на ура"?
А как они кушают контент, переведённый автоматическим пеерводчиком? А сгенерированный например яндексовской же "весной"? Хотя зачем всё это, если и на неоригинальный контент реакция нормальная? Ствим news grabber и получаем одновременно автообновляемый сайт и некоторый трафик с SE тоже.
 
Ствим news grabber и получаем одновременно автообновляемый сайт и некоторый трафик с SE тоже.
а если еще и в текст новости вставлять куски (типа анонсов) из других новостей, да еще и синонимами обработать :)
 
Откуда кстати инфа про "на ура"?
проверенный источник, палить его не могу
переведённый автоматическим пеерводчиком?
анализатор морфологии способен понять косяки переводчиков
А сгенерированный например яндексовской же "весной"
шутишь =) неужели яднекс не поймет свой же алгоритм
Хотя зачем всё это
вот вот
 
а если еще и в текст новости вставлять куски (типа анонсов) из других новостей, да еще и синонимами обработать :)

Синонимайзинг сейчас, как мне кажется, достаточно легко распознается поисковыми роботами. Нужно заменять некоторые устойчивые выражения и словоформы на схожие семантике. А это уже другой вопрос и подобных словарей в интернете я еще не встречал. По крайней мере, для русского языка.

Добавлено через 9 минут
если бы абузы... бан происхоид автоматом, как только станивиться понятно что сайт дор, признаки дора - редирект, плотность ключевиков, хостинг, беки и тп цепь маркова в том числе

Хотелось бы как-то систематизировать знания относительно наиболее популярных признаков бана сайта в качестве дора.

1) Редирект. Существуют противоречивые мнения относительно бана по этому признаку. Нередки случаи, когда в топе выдачи находятся сайты с наглым редиректом location.href='http://...'. Хотя, возможно, этот редирект был повешен уже после индексации. В любом случае, нужно надежно шифровать редирект или же выдавать его только для юзер-агентов, отличных от поисковых систем.

2) Плотность ключевиков. Однозначно не стоит набивать страницу ключевиками под завязку, так как это может быть воспринято, как поисковый спам. Оптимально 5-8% текста, но с использованием синонимов.

3) Хостинг. По поводу этого не знаю. Возможно ли такое, что какой-либо хостинг забанен в ПС по IP-адресу?

4) Беклинки. Внешний фактор, но слышал, что за резкое увеличение их количества возможна пессимизация. Кто-нибудь может сказать что-нибудь однозначно по этому поводу?

5) Цепь маркова. Не уверен, что поисковики научились определять семантику текста, вернее её отсутствие.

и от себя хотелось бы добавить:

6) Фильтрация по шаблонам. У поисковиков, наверняка, есть своя база шаблонов наиболее популярных доров по которой они отсеивают похожие на дор сайты.
 
Если спам приводил к бану, конкурентов бы топили пачками.
Уже давно заявлено всеми ПС - "За внешние факторы не банят"
под фильтр улетают за внешние.
если бы абузы... бан происхоид автоматом, как только станивиться понятно что сайт дор, признаки дора - редирект, плотность ключевиков, хостинг, беки и тп цепь маркова в том числе
согласен, много факторов, которые приводят дор к бану
 
Синонимайзинг сейчас, как мне кажется, достаточно легко распознается поисковыми роботами. Нужно заменять некоторые устойчивые выражения и словоформы на схожие семантике. А это уже другой вопрос и подобных словарей в интернете я еще не встречал. По крайней мере, для русского языка.

ну смотри, алгоритм определения уникальности для Яндекса есть ни что иное как контрольная сумма предложения. меняем местами 2 слова и CRC другая. плюс можно в некоторые слова в рандоме ставить ашипки. насчет устойчивых словоформ - это та же замена на синонимы только более крупных объектов. ИМХО если захочешь зауникалить текст для поисковика - это можно сделать приведенными способами. если поисковики начнут уже совсем мощно парсить тексты, править в них ошибки и т.п. - первым сигналом этого станет полное отсутствие доров в поисковой выдаче.

извини, если поисковики еще до сих пор не научились отсекать доры (и какие? тупо сварганенные путем перемешивания тонны кейсов), что говорить про морфологию и т.п.
 
ну смотри, алгоритм определения уникальности для Яндекса есть ни что иное как контрольная сумма предложения. меняем местами 2 слова и CRC другая. плюс можно в некоторые слова в рандоме ставить ашипки. насчет устойчивых словоформ - это та же замена на синонимы только более крупных объектов. ИМХО если захочешь зауникалить текст для поисковика - это можно сделать приведенными способами. если поисковики начнут уже совсем мощно парсить тексты, править в них ошибки и т.п. - первым сигналом этого станет полное отсутствие доров в поисковой выдаче.
извини, если поисковики еще до сих пор не научились отсекать доры (и какие? тупо сварганенные путем перемешивания тонны кейсов), что говорить про морфологию и т.п.

Насколько достоверны данные о том, что уникальность Яндекс проверяет контрольной суммой?
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху