ПРОЕКТЫ 


  АРХИВ 


Apache-Talk @lexa.ru 

Inet-Admins @info.east.ru 

Filmscanners @halftone.co.uk 

Security-alerts @yandex-team.ru 

nginx-ru @sysoev.ru 

  СТАТЬИ 


  ПЕРСОНАЛЬНОЕ 


  ПРОГРАММЫ 



ПИШИТЕ
ПИСЬМА














     АРХИВ :: Apache-Talk
Apache-Talk mailing list archive (apache-talk@lists.lexa.ru)

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [apache-talk] Re: =?KOI8-R?B?W2FwYWNoZS10YWxrXSBSZTogW2FwYWNoZS10YWxrXSDQ0sHXyczYzs/FINDP?==?KOI8-R?B?18XExc7JxSDQz8nTy8/XycvBINDPINPBytTV?=



On Tue, 5 Feb 2002, Alex Tutubalin wrote:
> >
>
> Посмотрел на документацию.
> - Способ хранения данных в SQL (а другое мне на данном этапе не интересно)
>   - безумный. В этом смысле Postgres-овские GiST-индексы большое подспорье.

Безумный. Он под mySQL сделан, а не под нормальную базу, Но зато крайне
простой. Поэтому очень
удобно искать по этому индексу не штатными средствами, а своими
запросами, подцепляя по необходимости информацию о рубрикации и типах,
живущую в той же базе.


> - судя по отсутствию соответствующей главы в документации, о морфологии
>  и формах слов эта штука ничего не знает, что печально.

Знает. Испелловские словари она умеет.
Причем задачу нормализации слова она по этим словарям решает в разы
лучше чем сам ispell

ispell -c как правило выдает на любое слово три-четыре ложных
"нормальных" формы,
а многосерчевский spelld этим, как правило, не страдает.
Опять же наличие нормализатора в качестве отдельного демона, очень
удобно когда разбираешь поисковые запросы сам.


> Соответственно, желания смотреть на сам софт не возникло.

Вот в код туда местами лучше не глядеть. Это точно.


-- 
Victor Wagner                   vitus@ice.ru
Chief Technical Officer         Office:7-(095)-748-53-88
Communiware.Net                 Home: 7-(095)-135-46-61
http://www.communiware.net      http://www.ice.ru/~vitus

=============================================================================
=               Apache-Talk@lists.lexa.ru mailing list                      =
Mail "unsubscribe apache-talk" to majordomo@lists.lexa.ru if you want to quit.
=       Archive avaliable at http://www.lexa.ru/apache-talk                 =



 




Copyright © Lexa Software, 1996-2009.