Парсер через Perl

Статус
В этой теме нельзя размещать новые ответы.

Otto

Постоялец
Регистрация
12 Май 2008
Сообщения
485
Реакции
161
Очень часто встречаю когда парсеры пишут на Perl. Отсюда у меня несколько вопросов новичка:
1. Почему на Perl, а не надругом яз. чем-то парсер лучще работает на Perl? Или исходя из того откуда надо парсить?

2. Требуется ли код Perl компилировать и так выводить на сервер код, или демоны может требуются, или как в PHP, можно изменить и сразу будет заметно изменение...

3. На каком яз. посоветуете писать (заказать) Парсер? и почему?

спс.Ув.
 
Парсеры пишутся на разных языках, и язык програмированния значения не имеет. За несколькими исключениями, если вам ,например, будет что-то нужно только под свои цели.
Парсеры также пишутся и на Питоне, и на РНР, Делфи и т.д
Опять же советов вам конкретных никто не даст, каждый из ЯП имеет свои плюсы и минусы, и так ,как поставлен вопрос, какой язык выбрать, тема грозит перейти в глобальный флуд
Опять же, заказывать смысла нету, проще купить готовый, или попросить в автора добавить небольшой функционал за дополнительную плату.
Неплохой парсер и причем недорогой Content downloader. Эту програмку все знают ,и думаю его функционала будет достаточно для обеспечения контента
 
Парсеры с готовым функционалом, конечно, хороши. Но они не такие гибкие как написанные вручную. Сам пишу на Python и PHP. Так вышло что начинал с Питона, он меня более чем устраивает. Хочу на многих ЯП проверить и сравнить, но, наверно, все равно вернусь к нему
 
1. Perl входит в состав любого современного дистрибьютива Linux, Основной особенностью языка считаются его богатые возможности для работы с текстом, в том числе работа с регулярными выражениями, встроенная в синтаксис. Перл унаследовал много свойств от языков Си, AWK, скриптовых языков командных оболочек UNIX.
В общем без разницы на чем писать парсер, все зависит от поставленных задач и имеющихся ресурсов.

2. Компилировать код на Perl не требуется, язык PHP очень похож на Perl.

3. Парсер на PHP будет работать у большинства хостеров, а на Питоне парсер ИМХО писать проще, а значить быстрее.
 
Что значит проще?
Проще писать на любом языке который ты хорошо знаешь
Проще - значит синтаксис проще. То что на PHP делается в 5 строчек - на Питоне можно красиво и быстро сделать в 1. Не везде такое радикальное соотношение, конечно, но по смыслу так
 
  • Нравится
Реакции: Ewgi
Проще - значит синтаксис проще. То что на PHP делается в 5 строчек - на Питоне можно красиво и быстро сделать в 1. Не везде такое радикальное соотношение, конечно, но по смыслу так

Именно это я и имел ввиду.
 
Если все же решишь использовать python - grab, весьма достойная библиотека для парсинга сайтов
 
Лично я пишу парсеры на Perl по следующим причинам:
1. Есть многопоточность (без извратов с fork и т.д.);
2. Нормальные библиотеки для работы с HTTP.
3. Привык.

Но, если учить с 0 чисто для парсеров и подобного, то лучше все таки брать C# или другой язык, позволяющий удобно работать с СОМ-объектом IE (или Chromium). Потому что многие сайты делают защиту через JS,играться с которой нa Perl не очень удобно.
 
  • Нравится
Реакции: cocs
Мне товарищ написал на перл. При том сначала парсер, потом то что спарсивается перепарсивается, потом я некоторые параметры вбиваю в ручную. Потом всё это генерируется в описание товаров. ХЗ почему на перл но у меня всё круто работает. PHP кодеров, которых просил с этим не справились
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху