парсинг текста

Статус
В этой теме нельзя размещать новые ответы.
*** скрытое содержание ***

При таком подходе не нужны книги, хватит выдачи гугла.

Но в результате таких операций получаются такие стихи, что со стула упасть можно.

Для одной черной операции (результат не был показан аудитории) мне пришлось сделать так. Говорю - такое стыдно выкладывать даже на серых лошадках :D
 
При таком подходе не нужны книги, хватит выдачи гугла.

Но в результате таких операций получаются такие стихи, что со стула упасть можно.

Для одной черной операции (результат не был показан аудитории) мне пришлось сделать так. Говорю - такое стыдно выкладывать даже на серых лошадках :D

Какая разница, главное што бы текст был хоть капельку читабельный и уникальный, а то што там выходит никого не волнует, или ты разделом ошибся?
По теме:
Пишу в ya.ru "эротические рассказы" выдираю и проганяю через синомайзер.
 
при переводе советую не пользоваться сторонними переводчиками (не гуглом)
 
Пользуюсь самописным скриптом для парсинга текста с сайтов из выдачи гугл news (параметры задаются через GET переменные прямо в строке браузера)
- чистит полученный текст от посторонних тэгов
- аккуратно складывает напарсеный текст в файл

для дорвейщика - самое то!
 
Для парсинга тоже использую самописный парсер гугла + парсер рсс лент (последнее хуже, т.к. контента зачастую мало) А потом через яху трубы прогоняю в гугл переводчике (трубы нужны для разбивки контента, т.к. стоит ограничение на кол-во переводимых символов). Кстати, можно нехилый парсер написать на трубах - работает не на твоем серве + не требует особых знаний программирования, подойдет начинающему дорвейщику ;)
 
Для парсинга тоже использую самописный парсер гугла + парсер рсс лент (последнее хуже, т.к. контента зачастую мало) А потом через яху трубы прогоняю в гугл переводчике (трубы нужны для разбивки контента, т.к. стоит ограничение на кол-во переводимых символов). Кстати, можно нехилый парсер написать на трубах - работает не на твоем серве + не требует особых знаний программирования, подойдет начинающему дорвейщику ;)

Как то пробовал работать с трубами ну там все как то муторно. С переводчика брать контент тоже не то.
Лучше брать нормальный контент с рушных сайтов, грамотно его обработать, разбить на абзацы повставлять картинки и все будет норм.

Также в топике отписывались, что у вас есть персональный скрипты и т.д. это конечно отрадно но, подскажите пожалуйста какую нить декстопную прогу фришную или ломаную, которая бы парсила текст с указанных сайтов, и сохраняла его без всего лишнего т.е. тегов и т.д. Готов был бы и купить, но это деньги не малые а на выходе может оказаться не тем, чем хотелось бы, а деньги уже не вернеш.
 
Как то пробовал работать с трубами ну там все как то муторно. С переводчика брать контент тоже не то.
Лучше брать нормальный контент с рушных сайтов, грамотно его обработать, разбить на абзацы повставлять картинки и все будет норм.
Также в топике отписывались, что у вас есть персональный скрипты и т.д. это конечно отрадно но, подскажите пожалуйста какую нить декстопную прогу фришную или ломаную, которая бы парсила текст с указанных сайтов, и сохраняла его без всего лишнего т.е. тегов и т.д. Готов был бы и купить, но это деньги не малые а на выходе может оказаться не тем, чем хотелось бы, а деньги уже не вернеш.

Для просмотра ссылки Войди или Зарегистрируйся - парсер сниппетов Google по введенному кейворду

много говорят о Для просмотра ссылки Войди или Зарегистрируйся - парсер Google, Yahoo, MSN, а также Yandex и Overture - сам не пробовал
 
  • Нравится
Реакции: 4ip
Агрессом сам пользуюсь, дает неплохие результаты
 
подскажет ктонить синонимайзер ато не знаю какой лучше
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху