Где искать книги?

Статус
В этой теме нельзя размещать новые ответы.

DuvE

Старатель
Регистрация
16 Май 2010
Сообщения
510
Реакции
10
Собственно я начинающий дорвейщик. Уже приобрёл синонимайзер, скоро куплю дорген, теперь остался только парсер. Но я решил для начала использовать книги, которые можно скачать в интернете, но тут то я и прошу подсказать. На торрентах мало книг тематических, подскажите сайт с информационными книгами.

Ещё вопрос - какой прогой лучше чистить текст от тегов, стоп слов и строчек? Просто есть один дамп базы в sql.

Заранее благодарен.
 
  • Заблокирован
  • #2
Попробуй Agress parser, он достаточно функциональный

Книги по дорвеестроительству ты вряд ли найдешь, а если найдешь, то информация там скорее всего устарела. Лучше парси выдачу ПС, там все ответы
 
Вы ваще о чём?? Информация в текстовке для доргена устарела??? Что за бред ваще? Да и агрес парсер скорее для других целей нужен.

Что значит "информационные книги"??? На какую-то тему? Все книги информационные)) Даже библия. Ну введите в яндексе "книги по ..." и тему дора. И ваще-т на торрентах дофига книг!
+ есть мнение, что не обязательно текст нужен тематический.
 
Автор, зачем все так сложно? Стоп слова, книги... Сделай нормальный стандартный дорвей доргеном и при клади лучше усилий на раскрутку...
 
Да вы меня не правильно поняли. Я ищу просто контент для доргена, желательно конечно близкой тематики.

Я собираюсь скачивать книгу, прогонять через синонимайзер и вставлять в RBT.

Добавлено через 1 минуту
Автор, зачем все так сложно? Стоп слова, книги... Сделай нормальный стандартный дорвей доргеном и при клади лучше усилий на раскрутку...

Дак как сделать дорвей без тематической текстовки. Говорят на 20 доров по 500 страниц надо где то 1-2 метра текста - это так или преувеличивают?
 
ну включите мозг
Такс по делу, что вам нужно, нужен текст, много, без тегов желательно. Уник и тематичность не обязателен, ведь для этого есть супер-мего-уникализатор-тематизатор* он же дорген. Значит идём в Яндекс вбиваем: книги в формате txt и смотрим на первую строчку и вот оно счастье.

Кстати перед убиванием книги проверьте её на уникальность а вдруг повезёт*

И то совсем не обязательно на каждый дор новый текст, ну в же поймите как этот текст получается (на выходе) там полная каша но уникальная каша. И если вы ипользуете RB, то использование синонимайзера здесь лишнее.
 
ну включите мозг
Такс по делу, что вам нужно нужен текст много без тегов желательно, уник и тематичность не обязателен, ведь для этого есть супер-мего-уникализатор он же дорген. Значит идём в Яндекс вбиваем: книги в формате txt и смотрим на первую строчку и вот оно счастье.
Кстати перед убиванием книги проверьте её на уникальность а вдруг повезёт*

У меня есть парочка уникальных книг в .doc, то есть к ним можно даже применять в RBT "без генерации"?
И ещё вопрос - раз текст уник, то и на сателлиты пойдёт?
 
Ааххаах)) Применять дорген без генерации.. )))) ППц.. Всё равно кеи надо вставлять в текст, какая цель-то у тебя?
Конечно, если уникальные книжки, то лучше их на саты пустить!!!

20 доров по 500 страниц - это 10000 страниц - конечно тут надо дофига текста!!! Но нет смысла для этого книги сканить или распознавать пдф, всё равно дор вылетит в итоге )
 
Уник -- сателитам!
Не уник + генерация -- дорам!
 
Посмотри здесь:

Очень много PDF DJVU Прогоняешь через файнрейдер получаешь уникальный текст:)
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху