GROB
Гуру форума
- Регистрация
- 28 Мар 2006
- Сообщения
- 177
- Реакции
- 76
- Автор темы
- #1
С парсингом особых дел не имел, но тут решил автоматизировать работу.. поэтому хочу написать скрипт на PHP копирования(сдирания) новостей.
На сайте как обычно краткая новость на фэйсе и ссылка на подробную.
Алгоритм, на сколько я понимаю такой:
1. Через курл берем страницу.
2. Выдираем все ссылки на новости, заголовок ее и краткий текст.
3. Закачиваем каждую страницу, и выдираем только сам текст новости.
Допустим с 1 - все просто, но пункт 2, это все можно написать на регулярных выражениях, даже если двиг самописный?
Кто нибудь может пояснить хотя бы как это вообще?
А с rss так же через регулярные выражения? Если я хочу не только краткую но и полну новость себе на сайт.
На сайте как обычно краткая новость на фэйсе и ссылка на подробную.
Алгоритм, на сколько я понимаю такой:
1. Через курл берем страницу.
2. Выдираем все ссылки на новости, заголовок ее и краткий текст.
3. Закачиваем каждую страницу, и выдираем только сам текст новости.
Допустим с 1 - все просто, но пункт 2, это все можно написать на регулярных выражениях, даже если двиг самописный?
Кто нибудь может пояснить хотя бы как это вообще?
А с rss так же через регулярные выражения? Если я хочу не только краткую но и полну новость себе на сайт.