Кстати, теоретики, по запросу site:nulled.ws гугола мне сейчас выдала 70400 страниц ей проиндексированных. Померив размер текстовой части нескольких открытых сейчас у меня страниц нулледа, получив средний вес страници и умножив его на 70400 я получил около 9 гигов чистого текста.
Конечно, нуллед это нуллед. Он такой один и он реально большой сайт. Больше среднего. Тогда я взял пару из популярных своих местных ресурсов и для каждого получил значение порядка 700 мегов. При этом в индексе около 4к страниц у каждого. А это совсем не много.
Это цифры чистого текста. Это даже не "сохраненная копия" из поисковика потому что я не считал цсс и графику, она увеличит в 4-5 раз цифру Кроме того, загнав этот текст даже без графики просто чисто текст в БД с более менее подходящей для поисковика структурой мы уже получит по примерно 1.2-1.5 гига на сайт к этому надо добавить еще и собственно поисковые индексы. Возмем для примера поис встроенный в форумы. На моей памяти был пример когда один из мемберов нулледа столкнулся по работе своей сеошником с ситуацией когда форум на пхпбб2 был настроен на 100% поиск всего что на нем есть. при размере БД в 9 гигов размер поискового индекса сотавил 8.8 гигов. и только 200 мегов составляли остальные таблици. Но даже если мы и не будем маньячить, нам всеравно нуно будет под индекс раза в 2-3 больше места чем под саму информацию. Естественно это будет именно полный поиск, как на гугле, а не с ограничениями на 3 символа как на нулледе.
Сколько получается? Получается уже 6 гигов на сайт минимум. Опять таки я иду в локалку свою которая на самом деле очень не большая по размеру и смотрю реально на сайты. Сайтов более крупных по сравнению с примером считаем что нет, примерно таких как пример штук 10, еще сайтов раза в 2 помельче тоже штук 10. И всякой мелочевки около сотни. Итого чисто БД поисковика под локалку выходит размером 150 гигов минимум.
Так что думайте исходя из этого когда решите поисковик свой делать. Сможете в доли секунды обработать запрос по такой БД?
П.С. Если кто-то скажет сразу "да я без проблем сделаю у этой БД такую структуру чтоб в доли секунды обрабатывало..." то сначала подумайте серьезно над тем насколько вы отвечаете за эти свои слова, а потом подумайте еще раз и не пишите глупости.