Убрать массив текста (парсинг html)

Тема в разделе "Регулярные выражения", создана пользователем Kolass, 21 сен 2016.

Статус темы:
Закрыта.
  1. Kolass

    Kolass Писатель

    Регистр.:
    23 дек 2009
    Сообщения:
    2
    Симпатии:
    0
    Подскажите кто может - как и чем лучше убирать массив текста например после <BODY> и перед первым тегом <TABLE> например? учитывая, что попадаются пустые строки. все регулярки работают ок для 1 строки, а как вырезать абзац с пустыми строками?..

    пользовал кучу редакторов.. беда( ненайду никак что-то удобное, с пакетной обработкой
    помогите плиз?
     
  2. sbob

    sbob Создатель

    Регистр.:
    10 мар 2016
    Сообщения:
    14
    Симпатии:
    1
    есть специальные опции выражения которые указывают что нужно работать в мультилайн режиме, зависит от движка регулярок
    для PHP например:
    http://www.php.su/lessons/?lesson_17
    ---------------------------
    m - многострочный поиск.
    --------------------------

    Пример указания модификатора:
    --------------------------
    /выражение/m
    --------------------------
     
  3. xpert13

    xpert13 <(*_*)>

    Регистр.:
    7 ноя 2008
    Сообщения:
    182
    Симпатии:
    458
    Код:
    <body>[\S\s]*?<table>
     
  4. javx

    javx

    Регистр.:
    28 авг 2015
    Сообщения:
    527
    Симпатии:
    252
  5. xpert13

    xpert13 <(*_*)>

    Регистр.:
    7 ноя 2008
    Сообщения:
    182
    Симпатии:
    458
    Ну вот какой смысл после правильного ответа давать другой? Тем более что он не верный (добавьте еще одну таблицу в исходник)
     
  6. javx

    javx

    Регистр.:
    28 авг 2015
    Сообщения:
    527
    Симпатии:
    252
    https://regex101.com/r/2USgHT/3
    Смысл в том что бы человек научился работать с регулярками в сервисе по ссылке а не просто скопипастил "верный ответ". Про то что до первой таблицы я не заметил, но добавив модификатор жадности это решиться.
     
Статус темы:
Закрыта.