Парсинг хитрого листа прокси

Статус
В этой теме нельзя размещать новые ответы.
я могу напарсить... только как ты собираешься из урла картинки получить её md5
получиться так?
 
PHP:
preg_match_all("/<td>\s*([0-9\.]+)\s*<\/td>.*<td><img src=\"(.+)\"/iUs", $html, $matches);

$matches[1], $matches[2]

С мд5 картинки - это ты круто придумал. :)
 
вот в файлике:
*** скрытое содержание ***
а как из списка урлов получить список хэшей?
Очень просто - копируем картинку к себе на хост, а потом через md5_file() получаем её слепок (хеш тобишь). Прописываем соответствия. И тогда я буду знать, что, например, строке b8c6d9167dc2e7e41dfa2df7ff9498f5 соответствует 80 порт.
 
как успехи? можешь поделиться списком? ;)
 
приколюшка)


а вообще алгоритм с md5 очень медленный..там кстати, есть параметр c отвечает за цвет фона, его учитывайте тоже ,чтоб везде одинаковым был при анализе.
 
алгоритм с md5 не медленный, а совсем неподходящий. файлы разные на выходе. и их не анализировать, а прогонять через OCR надо.

под никсами проще, но есть варианты и под вынь. откапал у себя пару тулз урезанный finereader стометровый и из другой оперы convert.exe
распазнается ессно 100%, времени 3 сек примерно, но можно и точнее замерить.

прокси штука хорошая, пока они в BL не засветились... те же 1к проксей, что на ресурсе выше баловства ради умирают уже через полчаса. нужно или реально хорошое кол-во от 50к или пользовать там, где админы ушли в отпуск и про BL не слышали.
 
dig555, а не легче насканить проксей, чем этот паблик собирать? :-]
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху