/Montana
Постоялец
- Регистрация
- 27 Май 2008
- Сообщения
- 119
- Реакции
- 6
- Автор темы
- #1
Посоветуйте решения для парсинга и чиски контента для доров. Желательно десктопное. Все что нашел в гугле парсит крайне мало и оочень грязно.
Нужно примерно 10-20 мб текста найденного по указанному кею, ну или на край с конкретно сайта. Чистка же нужна от урлов, слов типа child porn, дат и прочих строк подобно %%%%%%%%%%%12"""gvxm.
Нужно примерно 10-20 мб текста найденного по указанному кею, ну или на край с конкретно сайта. Чистка же нужна от урлов, слов типа child porn, дат и прочих строк подобно %%%%%%%%%%%12"""gvxm.