Текст для поиска: «Company, S.A.»
LUCENE 2.4:
Результат ParseQuery:
Код: Выделить всё
text:"company sa"
LUCENE 3.1
Результат ParseQuery:
Код: Выделить всё
text:"company s.a"
Самое смешное, что когда я выполняю поиск с помощью Lucene 2.4, он возвращает результаты, которые я Я ожидаю, что при использовании версии Lucene 3.1 этого не произойдет.
Я искал, как работает поиск по фразе в Lucene, и узнал, что когда Lucene создает индекс документа, он сохраняет информацию о словах, принадлежащих документу, и их положении в нем. Итак, я понял, что в анализаторе версии 3.1 есть изменения и способ извлечения терминов другой, но когда он извлекает термины, он должен работать так же!
Еще одно. Я не понимаю, что когда я выполняю аналогичный поиск (удаляю точки), обе версии возвращают одни и те же результаты.
Текст для поиска: «Компания, SA»
Текст для поиска: «Компания, SA»
LUCENE 2.4:
Результат ParseQuery:
Код: Выделить всё
text:"company sa"
LUCENE 3.1
Результат ParseQuery:
Код: Выделить всё
text:"company sa"
Итак, когда Lucene индексирует термин "s.a" (в версии 3.1), что, черт возьми, с ним происходит и почему нет позиционировать его после термина «компания»?
Подробнее здесь: https://stackoverflow.com/questions/785 ... lucene-3-1