ПРОЕКТЫ 


  АРХИВ 


Apache-Talk @lexa.ru 

Inet-Admins @info.east.ru 

Filmscanners @halftone.co.uk 

Security-alerts @yandex-team.ru 

nginx-ru @sysoev.ru 

  СТАТЬИ 


  ПЕРСОНАЛЬНОЕ 


  ПРОГРАММЫ 



ПИШИТЕ
ПИСЬМА














     АРХИВ :: Apache-Talk
Apache-Talk mailing list archive (apache-talk@lists.lexa.ru)

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[apache-talk] Re: =?KOI8-R?B?W2FwYWNoZS10YWxrXSBSZTogW2FwYWNoZS10YWxrXSBSZTogW2FwYWNoZS10?==?KOI8-R?B?YWxrXSDQ0sHXyczYzs/FINDP18XExc7JxSDQz8nTy8/XycvBINDPINPBytTV?=



> > - Способ хранения данных в SQL (а другое мне на данном этапе не интересно)
> >   - безумный. В этом смысле Postgres-овские GiST-индексы большое подспорье.
> 
> Безумный. Он под mySQL сделан, а не под нормальную базу, Но зато крайне
> простой. Поэтому очень
Сдохнуть должно на многословных запросах. Проверено в день утонутия Курска
на базе из ~300 тыс. документов в одном крупном российском портале :).
Я не про mnogosearch а про эту схему хранения :)

> удобно искать по этому индексу не штатными средствами, а своими
> запросами, подцепляя по необходимости информацию о рубрикации и типах,
> живущую в той же базе.
Ну и в FTS - та же фигня. Точнее, лучше брать от FTS-а куски SQL-я
(where, from) - он умеет их возвращать - и добавлять свои условия.
Соответственно, на OpenFTS при этом остается только работа со словарями.

> > - судя по отсутствию соответствующей главы в документации, о морфологии
> >  и формах слов эта штука ничего не знает, что печально.
> 
> Знает. Испелловские словари она умеет.
> Причем задачу нормализации слова она по этим словарям решает в разы
> лучше чем сам ispell
Морфология не ограничивается ispell-ом, тут должны быть морфологические
плагины со стандартным интерфейсом. Иначе будут всякие интересные траблы,
которые тут у меня недавно были с немецким языком

Алексей Тутубалин
mailto: lexa@lexa.ru

=============================================================================
=               Apache-Talk@lists.lexa.ru mailing list                      =
Mail "unsubscribe apache-talk" to majordomo@lists.lexa.ru if you want to quit.
=       Archive avaliable at http://www.lexa.ru/apache-talk                 =



 




Copyright © Lexa Software, 1996-2009.