ПРОЕКТЫ 


  АРХИВ 


Apache-Talk @lexa.ru 

Inet-Admins @info.east.ru 

Filmscanners @halftone.co.uk 

Security-alerts @yandex-team.ru 

nginx-ru @sysoev.ru 

  СТАТЬИ 


  ПЕРСОНАЛЬНОЕ 


  ПРОГРАММЫ 



ПИШИТЕ
ПИСЬМА














     АРХИВ :: Apache-Talk
Apache-Talk mailing list archive (apache-talk@lists.lexa.ru)

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re[2]: [apache-talk] =?koi8-r?Q?Re=3A_=5Bapache-talk=5D_=E1=CE=C1=CC=C9=DA=C1



Hello Slawa,

Sunday, June 18, 2000, 10:07:48 PM, you wrote:

SO> On Sun, Jun 18, 2000 at 09:39:22PM +0400, Oleg Ilin wrote:

>> >> >>  OI>>> А вы можете узнать какие странички запросил определенный ip в
>> >> >>  OI>>> определенный день?
>> >> >>  at> Ого. Вы представляете, какого размера должна быть база с такими
>> >> >>  at> логами хотя бы за месяц? У меня за неделю с гиг набегает, это без
>> >> >>  at> индексации, а если это в SQL засунуть, мне и подумать страшно 
>сколько
>> >> >>  at> выйдет.
>> >> >> Проблема не в объеме.
>> >> >> IP - 4 байта, дата - 4 байта, user-agent - 2-3 байта (+ "словарь"), 
>URL - пусть 
>> >> >> 4 байта (хотя покажите мне у кого оно не влезет в 3 байта :), referer 
>- 4 
>> >> >> байта. Итого - 20 байт на строчку лога, думаю можно и меньше.
>> >> SO> Про referer не понял, почему так мало?
>> >> А вам мало для индекса 16^8 индексов для рефереров?
>> 
>> SO> А черт их разберет, с альтавистами этими.
>> 
>> http://info.webcrawler.com/mak/projects/robots/active/html/index.html
>> 
>> Для этих вполне зватит.
>> А вордсы действительно в отдельный индекс ;)

Ой, а кто спайдерит странички? Роботы -> Поисковые системы к которым
они привязаны: как говорится: "смотрите внимательнее":
http://info.webcrawler.com/mak/projects/robots/active/html/scooter.html

а?

Best regards,
 Oleg                            mailto:ilin@rinet.ru


=============================================================================
=               Apache-Talk@lists.lexa.ru mailing list                      =
Mail "unsubscribe apache-talk" to majordomo@lists.lexa.ru if you want to quit.
=       Archive avaliable at http://www.lexa.ru/apache-talk                 =



 




Copyright © Lexa Software, 1996-2009.