Как воспримут поисковики текст в таком виде ? или как его сконверитить ?

Статус
В этой теме нельзя размещать новые ответы.

DOKTOR_666

Мой дом здесь!
Регистрация
14 Июн 2006
Сообщения
532
Реакции
256
В общем проблема такая
при конвертации PDF в HTML

на выходе софт заменяет все русские буквы на их HTML-коды

т.е. получается вот так примерно ...
PHP:
<TR class="tr0">
	<TD class="td0"><FONT class="ft14">& #1059;& #1089;& #1086;& #1074;& #1086;& #1077;
вот хочу узнать как воспримут поисковики странички в таком виде ....
отображается то оно нормально прям как надо ... а вот внутри ... сплошные коды ни единой русской буквы ...


или может кто посоветует софтинку которая может это конвертнуть в приличный вид ...
т.е. поменять HTML коды на сами буквы ...

???
 
Попробуйте следующее решение:


Не знаю насколько хорошо поисковики читают html entities, но размер документов вырастет в несколько раз.
 
спасибо .... ща попробую ....

но я уже перепробывал такую кучу софта ... что вряд ли найду что-то лучше ...
проблема всех конверторов из ПДФ в ХТМЛ то что на выходе получается на вид нормально а вот код полное гавно ... просто отвратный ...

а вот тут код на выходе чистый ... прям отличный ... но проблема с русскими буквами - они в хтмл-кодах все ....
 
попробывал решение

работает ... но извращенно ....
на выходе код не полное гавно ... но все равно какой-то некрасивый и жутко не логичный ...
например таблицы эта утилита режет на кучу div-ов по 1-2-3 символа ...

напишу за небольшое вознаграждение конвертор ) поисковики то может воспримут и нормально, но вот вес у таких документов будет заоблачный )

жадные какие все )))
че-почем ???
нужно очень срочно ... прям очень очень ....

я конечно нашел уже способ конвертить ... но это способ через одно известное место на букву "жопа" ....
что-нить побыстрее бы и по-удобнее
 
Попробуйте VeryPDF PDF2HTML.
 
Попробуйте VeryPDF PDF2HTML.
пробывал .... на выходи исходник страницы поганый ...


из всего что перепробывал ... а перепробывал я штук 10 разных софтин
работает вот этот сервис


но он как раз отдает русские буквы в виде хтмл-кодов ....
но за то код весьма чистый ... особенно если его еще зеброидом почистить от стилей и прочих параметров
 
Могу на .net утилитку переделать под твои нужды. Берет файлы из папки In, конвертит и записывает в Out. Нужно будет Net Framework 3.0 поставить.
 
Smuggler огромный тебе респект и уважуха ))))
помог )))) со своей маленькой утилиткой ))))
 
это было бы здорово )
конечно такие задачи не часто встречаются ... но все равно ...
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху