Скрипт генерации текста

Статус
В этой теме нельзя размещать новые ответы.
Наверно не хаффман а алгоритм холмана ;) ... невстречал дорогена работающего по ниму.
А вообще качество контента очень важный момент, темболее в последнее время. Когда то читал на блоге BoG'a про дороген который он написал, так для получения хорошего контента, он собрал большую базу естественых межсловных связей, таким образом получалось что текст практически осмысленый, так что хорощий дороген скоро будет весить порядка 500 мегов не меньше :p
Еще такой момент, эти самые межсловные связи не надо собирать по словарям или чтобы они строго соответствовали правилам, а нужно скорее всего парсить сайты, и при большом количестве пофторов заносить в базу, тогда получится хорошая база... и при определеной генерации получится довольно неплохой текст...

PS вот такой бы дороген это было бы круть :ay:
 
а еще слышал есть алгоритм хафмана какого-то, там текст изначально правильно по грамматике, с учетом частей речи, генерится. на инфы не нашел ((
я сражён этим постом :) :) :) Хаффман бы ьак закодировал текст что серчей у тебя 0 бы было и гугл в а...е был.
 
имхо парсить нужно. Цепи маркова достаточно заменить перемешиванием награбленых слов. Воровством это не назовешь, т. к. конечный итог может быть совершенно не похож на исходник :)
 
Знаю пару авторов, которые этот текст потом проверяют на "правильность", то есть анализируются недопустимые по грамматике пары слов, к примеру.
у них текст внешне очень даже красивый получается.
Интересно было бы посмотреть на их базу недопустимых по грамматике пар слов.
 
посмотри DMII там довольно неплохо сделана генерация текста
 
Щаз сервис есть pipes.yahoo оттуда можно грабить тематический контент всячески его перемешивая.
 
А ты получишь текст для людей?
Вообще если нужен тупо контент для поисковиков, берёте ключевики, разделяете их запятыми и херачите - работает. А вот чтобы сделать текст для людей, надо мозг приложить :)
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху