У меня есть гибридный индекс поиска с отображением: < /p>
{
...
"raw_content": {
"type": "text",
"term_vector": "with_positions_offsets"
},
"text_passages": {
"type": "nested",
"properties": {
"vector": {"type": "dense_vector": "dims": 768},
"content": {"type":"text", "term_vector": "with_positions_offsets"}
...
}
}
...
}
< /code>
У меня есть запрос, который использует поиск KNN, чтобы получить куски, которые соответствуют некоторым запросу: < /p>
"knn": {
"field": "text_passages.vector",
"query_vector": image_embedding,
"k": 10,
"num_candidates": 10 * 3,
"boost": 1,
"inner_hits": {
"name": "matching_passages",
"size": 2,
"_source": ["text_passages.content", "text_passages.chunk_num"],
}
}
< /code>
Я надеюсь использовать Highlighter, чтобы выделить два возвращенных внутренних хита в этом запросе, но для жизни я не могу понять это. Я пытался поместить маркер: < /p>
"highlight": {
"order": "score",
"fields": {
"text_passages.content": {
"type":"unified",
"fragment_size": 150,
"number_of_fragments":3 ,
"pre_tags": [""],
"post_tags": [""]
}
}
}
< /code>
Внутри Knn, внутри inner_hits, вне KNN, я не могу получить эту работу, которая сбивает с толку, потому что документы говорят, что они поддерживают выделение в inner_hits. Кто -нибудь делал раньше? Я подхожу к встраиванию неправильно, и текстовые куски/векторы документа должны быть в массиве вместо вложенного объекта? очень смущен. Любая справка приветствуется.>
Подробнее здесь: https://stackoverflow.com/questions/794 ... tic-search
Выделение полученных вложенных текстовых кусков в эластичном поиске? ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение