У меня 100 тыс. документов, из которых только 50 имеют свойство alias. Рассмотрим следующие два документа:
Код: Выделить всё
doc1:
{
"name" : "FAC",// no alias property
}
doc2:
{
"name" : "some data",
"alias" : [ "FCC"]
}
Я использую следующий запрос с несколькими совпадениями:
Код: Выделить всё
{
"query": {
"multi_match": {
"query": "FCC",
"type": "most_fields",
"fuzziness": 1,
"prefix_length": 0,
"operator": "AND",
"fields": [
"alias",
"name"
]
}
}
}
doc1 появляется в ответе раньше doc2, что является неожиданным результатом. Оценка документа doc1 выше, чем у документа doc2, поскольку свойство alias отсутствует в большинстве документов. Алгоритм сходства по умолчанию BM25 использует повышение, IDF и TF для расчета оценки. IDF выше для doc1 по сравнению с doc2, поскольку это зависит от свойства. Я могу использовать логическое сходство для достижения ожидаемого поведения, но я не хочу обновлять сходство по умолчанию до логического значения и менять поведение для всех других запросов.
Можно ли каким-либо образом добиться поведение аналогично логическому сходству с использованием function_score или обеспечению сходства во время выполнения?
Подробнее здесь:
https://stackoverflow.com/questions/784 ... s-in-elast