Парсер текста с сайта.

Поиск рулит, в этой теме выше есть
Для просмотра ссылки Войди или Зарегистрируйся
Он же vipbablo web grabber. Грабит все, импортирует куда угодно. весчь универсальная в любом смысле если есть руки не из ж...ы...
 
я юзаю sibir textmaker - довольно неплохой скрипт, парсит медленно, но верно, поддерживаются различные варианты экспорта текста
 
а так чтоб картинки парсил и таблицы?
 
Пользуюсь
Умеет грабить весь сайт. Записывает результат в один файл.
 
А может кому попадался и граббер сайтов ? Скрипт серверный интересует.
Не просто wget -bget а с css и картинками из css и т.д.
 
подскажите, какой из вышеназванных парсеров может тексты с форумов грабить? под систему nipel надо настроить
 
Вот самый простой парсер на php^

PHP:
$text = implode('', file ('http://news.yandex.ru/finances.rss'));
preg_match_all('|<item>(.*)</item>|Uis', $text, $item);

for($i = 0; $i < count($item['0']); $i++){
	preg_match('|<title>(.*)</title>|Uis', $item['0'][$i], $res['title'][$i]);
	preg_match('|<pubDateUT>(.*)</pubDateUT>|Uis', $item['0'][$i], $res['pubDateUT'][$i]);
	preg_match('|<description>(.*)</description>|Uis', $item['0'][$i], $res['description'][$i]);
}

for($i = 0; $i < 4; $i++){
	echo date('d.m.y H:i', $res['pubDateUT'][$i]['1']).'<br />';
 
Назад
Сверху