ПРОЕКТЫ 


  АРХИВ 


Apache-Talk @lexa.ru 

Inet-Admins @info.east.ru 

Filmscanners @halftone.co.uk 

Security-alerts @yandex-team.ru 

nginx-ru @sysoev.ru 

  СТАТЬИ 


  ПЕРСОНАЛЬНОЕ 


  ПРОГРАММЫ 



ПИШИТЕ
ПИСЬМА














     АРХИВ :: Apache-Talk
Apache-Talk mailing list archive (apache-talk@lists.lexa.ru)

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re[2]: [apache-talk] htdig 3.1.5.



День добрый,
    Den!

Friday, March 10, 2000, 9:23:26 PM, Вы написали:



DP> "Alexey V. Meledin" wrote:

>> Хотя поиск у ht/dig все таки кривоват. :)

DP> xxx.dict & xxx.aff нужны только для образования словоформ. Он и без них 
вполне
DP> ищет. А с кривым поиском Вы правы. Я наблюдал этот феномен с помощью emacs -
DP> смотрел файлы, которые создают последовательно htdig & htmerge (4 их там). 
Так
DP> вот, в процессе всех преобразований, до последнего файла (название не 
помню, а
DP> смотреть лень) доходит только ~20% русских слов. У меня это вылечилось 
установкой
DP> параметра allow_numbers: true. Найден исключительно на шару. Может кто мне
DP> объяснит популярно, почему оно так?
Я попробовал.
Если у меня в конфиге не стоит locale ru_RU.*, то файлы окончаний
генеряться размером в 17Мб. Если стоит, то на 70Мб, что есть очень
даже большая разница. Просто англицкий на 4Мб.
Т.е. по идее на www.lexa.ru/htdig.html надо внести уточнее, что
запускать htfuzzy надо с настроенным конфигом. Текущая инструкция
этого не предусматривает.


С уважением, Алексей В. Меледин
InterForge Developers Group, Saint-Petersburg
look_to: <www.etcompany.ru><www.businessweb.ru>
<www.inplan.spb.ru><www.pia.ru>>>>>>>>>>>>>>>>>
mail_to: <avm@webclub.ru><nick_as: <cureman>>>>


=============================================================================
=               Apache-Talk@lists.lexa.ru mailing list                      =
Mail "unsubscribe apache-talk" to majordomo@lists.lexa.ru if you want to quit.
=       Archive avaliable at http://www.lexa.ru/apache-talk                 =



 




Copyright © Lexa Software, 1996-2009.