Чем вытащить ключи?

Статус
В этой теме нельзя размещать новые ответы.

sherh

Постоялец
Регистрация
12 Июн 2007
Сообщения
129
Реакции
53
Напарсил агрессом редбаттоновские map.html
Чем можно вытащить оттуда кейворды? Посоветуйте скрипт какой-нибудь.
 
Напарсил агрессом редбаттоновские map.html
Чем можно вытащить оттуда кейворды? Посоветуйте скрипт какой-нибудь.
Либо TextTipePro настраивай фильтр, либо ручками ctrl+с ctrl+v (если карт немного).
А вообще чужие карты неблагародное это занятие, народ ленится и ключи там мягко говоря не самые лучшие...

ps если не секрет по каким признакам парсил, мне просто интересно как можно признаком отсортировать именно доры и именно определенной тематики
 
Либо TextTipePro настраивай фильтр, либо ручками ctrl+с ctrl+v (если карт немного).
А вообще чужие карты неблагародное это занятие, народ ленится и ключи там мягко говоря не самые лучшие...

ps если не секрет по каким признакам парсил, мне просто интересно как можно признаком отсортировать именно доры и именно определенной тематики

Карт около 3к... доры вообще неблагодарное занятие:D
Свою базу собрал, но кажеться что мало, поэтому нужно посмотреть какие еще можно использовать.

Не секрет. Напарсил только по Untitled, вытяну ключи, потом буду отбирать по нужной тематике и чистить от мусора.
 
елси не сложно, то выложи пример, не обязательно с реальными данными, но чтобы структура совпадала. Что есть и что хочешь получить. Попробую помочь :)
 
Карт около 3к... доры вообще неблагодарное занятие:D

да не я к тому что там мусора очь много будет

Не секрет. Напарсил только по Untitled, вытяну ключи, потом буду отбирать по нужной тематике и чистить от мусора.

:haha: ппц все ленивые, имя даже не поменять

елси не сложно, то выложи пример, не обязательно с реальными данными, но чтобы структура совпадала. Что есть и что хочешь получить. Попробую помочь :)

там все банально
надо выдернуть текст между > </a>
 
елси не сложно, то выложи пример, не обязательно с реальными данными, но чтобы структура совпадала. Что есть и что хочешь получить. Попробую помочь :)
Есть 3 к урлов c кодом:
Код:
<HTML class="site.ru" >
  <HEAD>
    <TITLE>Untitled page</TITLE>
  </HEAD>
  <BODY>
    <UL>
      <LI>
        <A href="http://www.site.ru/index.html" >key</A>
      </LI>
      <LI>
        <A href="http://www.site.ru/page1.html" >key2</A>
      </LI>
      <LI>
       <A href="http://www.site.ru/page2.html" >key3</A>
       ...
       <A href="http://www.site.ru/page-n.html" >key-n</A>
      </LI>
    </UL>
  </BODY>
Требуется вытащить все key в текстовый файл.
Регулярка

думаю не подойдет, так как это страница в чистом виде. А много урлов на фришниках, где присутствует дополнительный код (баннеры и т.п.)
Нужно вытаскивать от
<UL>
<LI>
до
</LI>
</UL>
</BODY>
на сколько я понимаю.
Причем будут встречаться битые урлы, которые надо пропускать, если нет совпадений по шаблону.
Моих знаний php на такую элементарную вешь недостаточно. Если нет готовых решений и никто не поможет, придется научиться самому... или копипаст:eek:
 
все делается элементарно. даешь скрипту список урлов, он закачивает по одной мапе, выдирает ключи и ложит их в файл.
в чем сложность??

А много урлов на фришниках, где присутствует дополнительный код (баннеры и т.п.)

ну будет немного мусора. что за проблема загнать кеи в kwk и почистить?

 
Имхо, лучше сам напиши скрипт. Посмотри сайт php.su, этого будет достаточно. Скрипт пишется за 5 мин, но зато потом будет уже проще, всегда сможешь сам сделать нужную вещь. Я именно так и начинал, зато сейчас не запариваюсь, когда нужно автоматизировать какие-то мелочи.
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху