Разница в полнотекстовом поиске в Lucene 2.4 и Lucene 3.1JAVA

Программисты JAVA общаются здесь
Ответить Пред. темаСлед. тема
Anonymous
 Разница в полнотекстовом поиске в Lucene 2.4 и Lucene 3.1

Сообщение Anonymous »

Я столкнулся с некоторыми проблемами при выполнении одного и того же поиска в двух разных версиях Lucene (2.4 и 3.1) с использованием одного и того же индекса. Я думаю, что проблема связана с развитием класса Standard Analyser, который я использую в обеих версиях.
Текст для поиска: «Company, S.A.»
LUCENE 2.4:
Результат ParseQuery:

Код: Выделить всё

text:"company sa"
N результатов.
LUCENE 3.1
Результат ParseQuery:

Код: Выделить всё

text:"company s.a"
0 результатов (ожидались те же результаты, что и в версии 2.4)
Самое смешное, что когда я выполняю поиск с помощью Lucene 2.4, он возвращает результаты, которые я Я ожидаю, что при использовании версии Lucene 3.1 этого не произойдет.
Я искал, как работает поиск по фразе в Lucene, и узнал, что когда Lucene создает индекс документа, он сохраняет информацию о словах, принадлежащих документу, и их положении в нем. Итак, я понял, что в анализаторе версии 3.1 есть изменения и способ извлечения терминов другой, но когда он извлекает термины, он должен работать так же!
Еще одно. Я не понимаю, что когда я выполняю аналогичный поиск (удаляю точки), обе версии возвращают одни и те же результаты.
Текст для поиска: «Компания, SA»
Текст для поиска: «Компания, SA»
LUCENE 2.4:
Результат ParseQuery:

Код: Выделить всё

text:"company sa"
N результатов.
LUCENE 3.1
Результат ParseQuery:

Код: Выделить всё

text:"company sa"
результат тот же N, что и в версии 2.4
Итак, когда Lucene индексирует термин "s.a" (в версии 3.1), что, черт возьми, с ним происходит и почему нет позиционировать его после термина «компания»?

Подробнее здесь: https://stackoverflow.com/questions/785 ... lucene-3-1
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «JAVA»