РегЭксп для определения склейки PR

Статус
В этой теме нельзя размещать новые ответы.

dig555

Постоялец
Регистрация
22 Июн 2007
Сообщения
365
Реакции
160
Что-то в последнее время почти все доступные скрипты для определения склейки PR начали врать. Нужно заиметь рабочий вариант.

Склейку можно узнать по запросу вида:
info:site.com
Если найден тот же сайт - то всё ОК. Если другой - клей.

Пример. Домен xbox360.com склеен с xbox.com

Вообщем, я забираю curl'ом страницу по запросу info:xbox360.com

Естественно, единственная позиция в выдаче выдаёт сайт xbox.com

Ниже кусок страницы с нужными данными.

HTML:
<h2 class=hd>Результаты поиска</h2><div><ol><li class=g><h3 class=r><a href="http://www.xbox.com/" target=_blank class=l onmousedown="return clk(this.href,'','','res','1','')">Xbox.com | Xbox.com Home</a></h3><span class="std nobr">&nbsp;- [ <a href="http://translate.google.ru/translate?hl=ru&amp;sl=en&amp;u=http://www.xbox.com/&amp;sa=X&amp;oi=translate&amp;resnum=1&amp;ct=result&amp;prev=/search%3Fq%3Dinfo:xbox360.com%26hl%3Dru%26newwindow%3D1%26rlz%3D1T4GFRB_ruBY246BY246" class=fl target=_blank>Перевести эту страницу</a> ]</span>

Помогите выдрать из этого безобразия url найденной страницы :thenks:
Тогда сравнив её с страницей в запросе c info: я смогу узнать склеен ли домен, и если склеен, то с кем...
 
PHP:
preg_match_all('#<h2 class=hd>.*?<\/h2><div><ol><li class=g><h3 class=r><a href="(.*?)" target=_blank class=.*?>.*?<\/a><\/h3><span class="std nobr">.*?<\/span>#i', $text, $matches)

Пробуй этот
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху