Выделение полученных вложенных текстовых кусков в эластичном поиске? - Цифровое Кемерово

Выделение полученных вложенных текстовых кусков в эластичном поиске? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Выделение полученных вложенных текстовых кусков в эластичном поиске?

Цитата

Сообщение Anonymous » 25 фев 2025, 21:52

У меня есть гибридный индекс поиска с отображением: < /p>
{
...
"raw_content": {
"type": "text",
"term_vector": "with_positions_offsets"
},
"text_passages": {
"type": "nested",
"properties": {
"vector": {"type": "dense_vector": "dims": 768},
"content": {"type":"text", "term_vector": "with_positions_offsets"}
...
}
}
...
}
< /code>
У меня есть запрос, который использует поиск KNN, чтобы получить куски, которые соответствуют некоторым запросу: < /p>
"knn": {
"field": "text_passages.vector",
"query_vector": image_embedding,
"k": 10,
"num_candidates": 10 * 3,
"boost": 1,
"inner_hits": {
"name": "matching_passages",
"size": 2,
"_source": ["text_passages.content", "text_passages.chunk_num"],
}
}
< /code>
Я надеюсь использовать Highlighter, чтобы выделить два возвращенных внутренних хита в этом запросе, но для жизни я не могу понять это. Я пытался поместить маркер: < /p>
"highlight": {
"order": "score",
"fields": {
"text_passages.content": {
"type":"unified",
"fragment_size": 150,
"number_of_fragments":3 ,
"pre_tags": [""],
"post_tags": [""]
}
}
}
< /code>
Внутри Knn, внутри inner_hits, вне KNN, я не могу получить эту работу, которая сбивает с толку, потому что документы говорят, что они поддерживают выделение в inner_hits. Кто -нибудь делал раньше? Я подхожу к встраиванию неправильно, и текстовые куски/векторы документа должны быть в массиве вместо вложенного объекта? очень смущен. Любая справка приветствуется.>

Подробнее здесь: https://stackoverflow.com/questions/794 ... tic-search

Реклама

1740509570

Anonymous

 У меня есть гибридный индекс поиска с отображением: < /p>
{
...
"raw_content": {
"type": "text",
"term_vector": "with_positions_offsets"
},
"text_passages": {
"type": "nested",
"properties": {
"vector": {"type": "dense_vector": "dims": 768},
"content": {"type":"text", "term_vector": "with_positions_offsets"}
...
}
}
...
}
< /code>
У меня есть запрос, который использует поиск KNN, чтобы получить куски, которые соответствуют некоторым запросу: < /p>
"knn": {
"field": "text_passages.vector",
"query_vector": image_embedding,
"k": 10,
"num_candidates": 10 * 3,
"boost": 1,
"inner_hits": {
"name": "matching_passages",
"size": 2,
"_source": ["text_passages.content", "text_passages.chunk_num"],
}
}
< /code>
Я надеюсь использовать Highlighter, чтобы выделить два возвращенных внутренних хита в этом запросе, но для жизни я не могу понять это. Я пытался поместить маркер: < /p>
"highlight": {
"order": "score",
"fields": {
"text_passages.content": {
"type":"unified",
"fragment_size": 150,
"number_of_fragments":3 ,
"pre_tags": ["[b]"],
"post_tags": ["[/b]"]
}
}
}
< /code>
Внутри Knn, внутри inner_hits, вне KNN, я не могу получить эту работу, которая сбивает с толку, потому что документы говорят, что они поддерживают выделение в inner_hits. Кто -нибудь делал раньше? Я подхожу к встраиванию неправильно, и текстовые куски/векторы документа должны быть в массиве вместо вложенного объекта? очень смущен. Любая справка приветствуется.> 

Подробнее здесь: [url]https://stackoverflow.com/questions/79467583/highlighting-retrieved-nested-text-chunks-in-elastic-search[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как получить ограничительные коробки (Bbox) для кусков в тряпичном трубопроводе, чтобы выделить 5 лучших кусков в докуме

Последнее сообщение Anonymous « 24 янв 2025, 17:53
Добавлено в форуме Python

Anonymous » 24 янв 2025, 17:53 » в форуме Python

Я работаю над конвейером RAG (генерация с расширенным поиском), где сначала предварительно обрабатываю PDF-документ и разбиваю его на фрагменты. При запуске процесса RAG я извлекаю 5 верхних фрагментов и генерирую ответ. Чтобы обеспечить контекст, я...

0 Ответы

28 Просмотры

Последнее сообщение Anonymous
24 янв 2025, 17:53
Как получить ограничительные коробки (Bbox) для кусков в тряпичном трубопроводе, чтобы выделить 5 лучших кусков в докуме

Последнее сообщение Anonymous « 26 янв 2025, 11:29
Добавлено в форуме Python

Anonymous » 26 янв 2025, 11:29 » в форуме Python

Я работаю над конвейером RAG (генерация с расширенным поиском), где сначала предварительно обрабатываю PDF-документ и разбиваю его на фрагменты. При запуске процесса RAG я извлекаю 5 верхних фрагментов и генерирую ответ. Чтобы обеспечить контекст, я...

0 Ответы

26 Просмотры

Последнее сообщение Anonymous
26 янв 2025, 11:29
Как сортировать данные перед применением агрегации терминов в эластичном поиске

Последнее сообщение Гость « 13 окт 2023, 17:17
Добавлено в форуме Elasticsearch aggregation

Гость » 13 окт 2023, 17:17 » в форуме Elasticsearch aggregation

мы хотим отсортировать данные, используя несколько полей, прежде чем применять агрегацию терминов, попробовали использовать термины и отсортировать подагрегацию, используя сортировку, которая работает, однако агрегация терминов дает повторяющиеся...

0 Ответы

321 Просмотры

Последнее сообщение Гость
13 окт 2023, 17:17
Используйте логическое сходство или добивайтесь аналогичного поведения для определенных запросов в эластичном поиске.

Последнее сообщение Anonymous « 10 май 2024, 09:02
Добавлено в форуме JAVA

Anonymous » 10 май 2024, 09:02 » в форуме JAVA

У меня 100 тыс. документов, из которых только 50 имеют свойство alias. Рассмотрим следующие два документа:
doc1:
{
name : FAC ,// no alias property
}

doc2:
{
name : some data ,
alias :
}

Я использую следующий запрос с несколькими...

0 Ответы

94 Просмотры

Последнее сообщение Anonymous
10 май 2024, 09:02
Как построить динамические запросы в эластичном поиске?

Последнее сообщение Anonymous « 28 янв 2025, 01:40
Добавлено в форуме JAVA

Anonymous » 28 янв 2025, 01:40 » в форуме JAVA

Мне нужно использовать страницу, и я использую метод поиска после метода, мне сначала нужно опубликовать яму, затем получить поиск по размеру X, используя эту яму, а затем продолжать плюс после поиска после ответа для предыдущего вида. Как я могу...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
28 янв 2025, 01:40

Вернуться в «Python»

Programmiererforum