[Ищу] Определение тематики сайта

Menro

web, seo, email, hack
Регистрация
27 Янв 2008
Сообщения
689
Реакции
138
Добрый день!

Люди, вот собрался искать исполнителя для скрипта/программы, главной задачей которого должно стать определение тематики сайта. Перед тем как создавать тему, опробовал множество сервисов, но к сожалению не один из них не дал хорошего результата, а именно из 10 сайтов, только 2 определяются верно.

Связи с этим вопрос:

Есть у кого какие соображения? Помимо анализа текста, откуда можно брать данные?

Мои соображения:

1.Анализ текста главной страницы на предмет часто встречающихся слов
2.Парсинг сайтов из Liveinternet
3.Парсинг сайтов из Rambler TOP 100
4.Парсинг сайтов из каталога Mail.ru
5.Парсинг сайтов из каталога Aport.ru
6.Парсинг сайтов из более или менее популярных каталогов, например vsego.ru
7.Нахождение ключевого слова в имени домена
8.Передача данных из Яндекс.Каталог
9.Передача данных из каталога DMOZ
10.Анализ заголовков title
12.Анализ meta keywords

В добавок определение типа ресурса:

1.Анализ сайта на предмет ссылок типа "О компании", "Схема проезда" - коммерческий
2.Анализ сайта на предмет ссылок типа "Реклама на сайте" "Последние новости" и т.д - новостной
 
Назад
Сверху