Яндекс xml

Статус
В этой теме нельзя размещать новые ответы.

ar4ik

Постоялец
Регистрация
26 Ноя 2007
Сообщения
331
Реакции
100
Думаю в этот раздел больше всего подходит.
Пишу скрипт для парсинга выдачи Яндекс XML. Он мне пихает постоянно украинскую выдачу, хотя я никаких параметров дополнительных не задавал. Через обычную форму все в порядке.
Может быть у кого есть опыт работы с Яндекс xml.
Какие есть идеи для нормализации выдачи?
 
Наверно у тебя украинский IP и он автоматом подсовывает тебе выдачу, решение - юзать проксик
 
Наверно у тебя украинский IP и он автоматом подсовывает тебе выдачу, решение - юзать проксик

почему тогда через обычный поиск нет такого
таргетирования?
 
А ты в инет ходиш с того же IP что и скрипт запускаеш?
 
скрипт то ты запускаешь локально но выходит он в инет с твоего ip который принадлежит региону.......................:D

Я за это и говорю. Через форму поиска - все нормально, через xml - украинская выдача. Залил скрипт на хостинг выдача так же отличается. Странно.
 
В браузер он тебе тоже выдает в украинской кодировке, только браузер распознает строку
<meta http-equiv="Content-Type" content="text/html; charset=ридна_украина"/>
в коде страницы или в хедере и соответствующим образом настраивает отображение вывода.
Выход - юзать библиотеку iconv и одноименную функцию для перекодировки: Для просмотра ссылки Войди или Зарегистрируйся
Если iconv недоступна - придется самому писать функцию для перекодировки.
 
В браузер он тебе тоже выдает в украинской кодировке, только браузер распознает строку

в коде страницы или в хедере и соответствующим образом настраивает отображение вывода.
Выход - юзать библиотеку iconv и одноименную функцию для перекодировки: Для просмотра ссылки Войди или Зарегистрируйся
Если iconv недоступна - придется самому писать функцию для перекодировки.

Вы не так поняли. Под выдачей я имел ввиду список сайтов в результате поиска, а не кодировку. Вопрос актуален и по сегодня.:bc:
 
Так в чем вопрос?

1) Посмотри, какой запрос шлет бровзер твоему яндексу, и воспроизведи в скрипте такой же - все хидеры, куки, короче слово в слово. Поскольку ты выполняешься на том же хосте, с тем же ip, то и выдача в итоге будет 100% совпадать.

Полагаю, тут дело именно в куке, которую яша когда-то давно поставил твоему бровзеру и все никак не поставит скрипту..


2) Заведи логин на яндексе, залезь там в настройки, выбери страну, город и т.п. - и потом грабь xml из-под этого логина. Способ не лучше первого, но возможно проще - надо будет сначала ломиться на login за сессией и потом этот sessid передавать при каждом запросе, при этом на остальные хидеры можно будет забить.
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху