naytilius
Постоялец
- Регистрация
- 18 Окт 2008
- Сообщения
- 306
- Реакции
- 161
- Автор темы
- #1
Привет нужен серверний пхп парсер.
Именно сервений так как декстопний парсер смогу на зено постере навалять за 5 мин, но у меня канал в инет пиец тугой (обичной модем не сильно разженешся.)
С требований возможность настроить что парсить (тоесть настроить метки между которими брать контент.) и работа через прокси.
2.настраиваемий формат вивода. (просто чтоб навания статьи в тег н2 заключить) или воопше просто всю текстовку сохранить
3. Чтоб парсер полностью удалял разметку, ссилки (если они анткорние то анкор чтоб оставлял.) все включения ява. Воопшем на виходе голий текст.
НУжен именно серверний скрипт так как есть контент довнлоадс. но из за скорости инети у меня не оч сильно разгонится в парсинге могу.
Скрипт ну3жен под парсинг нескольких буржуйских каталогов статей. тоесть на вход я задаю линки на статьи а на виходе статьи в одном файле с нужним мне форматом.
так 3-4 каталога.
Да и интересно сколько будет стоит заказ подобного скрипта в фрилансеров. тоесть парсеров под нужние директории.
нада промишленно парсить
1.ezinearticles.com
2.Для просмотра ссылки Войдиили Зарегистрируйся
и парочка топових каталогов
Именно сервений так как декстопний парсер смогу на зено постере навалять за 5 мин, но у меня канал в инет пиец тугой (обичной модем не сильно разженешся.)
С требований возможность настроить что парсить (тоесть настроить метки между которими брать контент.) и работа через прокси.
2.настраиваемий формат вивода. (просто чтоб навания статьи в тег н2 заключить) или воопше просто всю текстовку сохранить
3. Чтоб парсер полностью удалял разметку, ссилки (если они анткорние то анкор чтоб оставлял.) все включения ява. Воопшем на виходе голий текст.
НУжен именно серверний скрипт так как есть контент довнлоадс. но из за скорости инети у меня не оч сильно разгонится в парсинге могу.
Скрипт ну3жен под парсинг нескольких буржуйских каталогов статей. тоесть на вход я задаю линки на статьи а на виходе статьи в одном файле с нужним мне форматом.
так 3-4 каталога.
Да и интересно сколько будет стоит заказ подобного скрипта в фрилансеров. тоесть парсеров под нужние директории.
нада промишленно парсить
1.ezinearticles.com
2.Для просмотра ссылки Войди
и парочка топових каталогов