Помогите с патерном на извлечение числа проиндексированных страниц яндексом

Статус
В этой теме нельзя размещать новые ответы.

G-Null

Местный житель
Регистрация
6 Сен 2007
Сообщения
178
Реакции
21
Код:
/страниц\&nbsp;\&mdash; \<b\>(.*)\<\/b\>/
??
 
в $str содержимое страницы

preg_match('/страниц&nbsp;&mdash;<b>(.*?)<\/b><br>/',$str,$p);

print "Кол-во стрнаниц: ".str_replace("&nbsp;","",$p[1]);
 
PHP:
$html = join(file($url)); // получение html-кода страницы
if (ereg('страниц &mdash; <b>([0-9 ]+)</b>', // после '0-9' есть пробел
str_replace('&nbsp;',' ',$html),$res)) echo $res[1];
else echo 'Шаблон не найден.';
 
Хочу вытащить весь тайтл яндексовской страницы поиска. При использовании следующего кода
PHP:
$html = join(file('http://yandex.ru/yandsearch?pag=u&surl=nulled.ws'));

$yaQtyPattern = "!<title>(.*?)<\/title>!si";

preg_match($yaQtyPattern, $html, $matches);
echo $matches[1];

в рез-тате чего получаю следующую штуку
- Яндекс: нашлось 97 тыс. страниц

подскажите, пожалуйста, как исправить этот баг с кодировкой ..
 
Соединю всё вместе и выкину лишнее на мой взгляд:
PHP:
$html = join(file('http://yandex.ru/yandsearch?pag=u&surl=nulled.ws'));
if (preg_match('~<title>(.*)</title>~si',$html,$matches)) echo iconv('UTF-8','WINDOWS-1251',$matches[1]);
 
Если нет iconv можно просто файл скрипта сохранить в кодировке UTF8 при помощи EmEditor, Notepad++ или другого редактора.
Полет нормальный )
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху