Вопрос по синонимизации.

Какая синонимизация лучше?

  • Слабая (вариант текста №1)

    Голосов: 0 0,0%

  • Всего проголосовало
    9
  • Опрос закрыт .
Статус
В этой теме нельзя размещать новые ответы.

the_stalker

Постоялец
Регистрация
19 Фев 2007
Сообщения
116
Реакции
5
Вот стремаюсь на поводу того, что Яша может спалить автоматическую синонимизацию и забанить, ведь у них там наверняка есть какие-нибудь навороченные лексические алгоритмы обработки текста.
Вот думаю, какая синонимизация лучше?

Исходный текст:

Слабая (более-менее вменяемый текст:(

Или наоборот более глубокая синонимизация в ущерб читабельности?


Просьба голосовать людям которые пробовали разные варианты.
 
Кто тебе сказал что Яндекс палит автоматическую синонимизацию? Откуда такая инфа?

Насколько я знаю палят автоматическую синонимизацию по стуку. Т.е. только человек может опознать это. Алгоритмы - нет.

Если бы алгоритм опознающий человеческое происхождение текста существовал бы, тогда можно было бы с помощью тех же алгоритмов - генерировать неотличимый от написанного человеком текст.
 
Последний вариант потенциально содержит больше уникального контента. Об автоматическом бане синонимизированного текста яшкой пока нет упоминаний.

Учитывая ресурсы яши, реализовать "антисинонимайзерный" фильтр несложно, поэтому синонимизация контента занятие малоперспективное в длительной перспективе.

Вот думаю, какая синонимизация лучше?

От первого варианта толку потенциально 0.
От второго польза может быть, но риск "стука" гораздо выше.
 
Симонимизировать нужно как минимум:
а) с учетом морфологии русского языка;
б) синонимизировать как минимум по частям речи;
в) Процент уникального контента КАК МОЖНО выше.

Со всего выше перечисленного делаем вывод: Второй вариант более приемлем.
О методах синонимизации и уникализации контента, можно почитать например здесь:
 
Яндекс палит слабую синонимизацию. Проверено своим горьким опытом =\
 
В том числе и 2-й вариант, 12% - это недостаточно.

согласен.12 % глубокой синомизацией и назвать трудно. 25 % еще куда не шло. И речь идет не тольк о замене синонимами, а также о перестановке предложений.
 
Люди, может подскажите где на халяву надыбать
базы однозначных синонимов???

Результат парсинга словаря русских синонимов и сходных по смыслу выражений Н. Абрамова (18151 слово и 68729 синонимов)


Другая база синомимов


И еще - синонимов на 19 Мегабайт =)



Это все конечно хорошо, но хотелось бы посмотреть на этого зверя


250$ стоит =(
 
Симонимизировать нужно как минимум:
а) с учетом морфологии русского языка;
б) синонимизировать как минимум по частям речи;
в) Процент уникального контента КАК МОЖНО выше.

Со всего выше перечисленного делаем вывод: Второй вариант более приемлем.
О методах синонимизации и уникализации контента, можно почитать например здесь:*** скрытое содержание ***
Если не против, хотел дополнить.
г) Примерно от 20%. Но и в данном случае очень важной константой будет являться именно читабельность. Все конечно зависит от значимости проекта. Если для белого, то могут конкуренты по стуку в делспам отправить без проблем. Для гс, сплогов, расчитываем на алго, которому будет сложнее отличить "новый уник" от реального оригинала.
согласен.12 % глубокой синомизацией и назвать трудно. 25 % еще куда не шло. И речь идет не тольк о замене синонимами, а также о перестановке предложений.
Вот как раз т.н. метод мэшапа разрывает предложения, правда не всегда качественно, но, этот вариант гораздо лучше для обхода авто фильтров поисковиков и сервисов типа копискейп.
 
Яндекс учитывает морфологии, а посему любая синонимизация будет рано или поздно спалена и сайт как минимум зафильтруют. Лучше меньше да лучше. Делайте СДЛ...

Да, не я яндекс палит морфологию, а конкуренты и недовольные посетители стучат. Пока трафа мизер, почему-то яндекс "не палит" морфологию.
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху