Примеры настройки html-граббинга в NewsGrabberJC Pro

Статус
В этой теме нельзя размещать новые ответы.

Phoenix168

Профессор
Регистрация
15 Ноя 2007
Сообщения
182
Реакции
44
Приведу свой пример:

1. На вкладке обработчик переключиться в режим html.
2. Поля режима одиночной страницы пропускаем.
3. Начальная и конечная точки контейнера - по аналогии с rss-граббингом - начальная и конечная точки контейнера ссылок на полные тексты новостей. Должны быть уникальны.
4. Маска href якоря. В случае контейнера ссылок содержащего линки типа http://www.site.ru/news1.html…www.site.ru/news99.html маска будет выглядеть следующим образом - news\d+?\.html. Подробнее инфу о синтаксисе регулярных выражений можно посмотреть например Для просмотра ссылки Войди или Зарегистрируйся.
5. Префикс якоря в этом случае будет таким - http://www.site.ru/
6. Заголовок новости есть смысл взять из якоря ссылки на полный текст новости.
7. Шаблоны начальной и конечной точки текста новости настраиваются аналогично настройке начальной и конечной точек при rss-граббинге.

Принимаю предложения и замечания по уточнению.
 
кто нибудь подскажите как сграбить html страницу
никак не получается

мои настройки:

Адрес ленты - _http://rubin-kazan.ru/
Режим одиночной страницы - нет
Перезаписать старое - Нет
Заголовок из якоря - Нет
Маска href якоря - /.news.+?/
Префикс якоря - Для просмотра ссылки Войди или Зарегистрируйся
Шаблон заголовка - <a[^>]*>.+?<\/a>
Начальная точка -
Конечная точка -
URL картинок -_http://rubin-kazan.ru
 
  • Заблокирован
  • #3
на этом сайте пытался сграбить, не получается ни в какую. Даже с отцом невсграббера не получилось. Грабит одну только статью, другие не хочет. Мож там какая защита стоит
 
  • Заблокирован
  • #4
Нет там защиты просто Вы по ходу дела маску плохо проставили.
 
У кого-нибудь вообще получилось настроить html граббинг? У меня RSS настраивать более менее получается, а вот с HTML ничего не выходит...:nezn:
 
У кого-нибудь вообще получилось настроить html граббинг? У меня RSS настраивать более менее получается, а вот с HTML ничего не выходит...:nezn:
Здесь два рабочих примера описали. Один с донором. Повторите действия и проверьте сами - работает или нет.
Конкретно заданный вопрос - половина ответа.
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху