RAG с Haystack: компилируется, но возвращает пустые ответы

RAG с Haystack: компилируется, но возвращает пустые ответы ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

RAG с Haystack: компилируется, но возвращает пустые ответы

Цитата

Сообщение Anonymous » 08 окт 2024, 17:51

Мой конвейер RAG (с использованием Haystack) компилируется и запускается, но возвращает пустые ответы.

Из моих проверок я подумал, что это может быть связано с несовместимостью моделей внедрения и llm, поэтому я изменена на модель внедрения, основанную на той же модели, что и моя модель llm (обе основаны на мистрале).

Код: Выделить всё

mymodel = "occiglot/occiglot-7b-eu5-instruct"  # llm model
# embedding_model = "Alibaba-NLP/gte-Qwen2-7B-instruct"  # old embedding model
embedding_model = "intfloat/e5-mistral-7b-instruct"

Мой соответствующий импорт следующий:

Код: Выделить всё

from haystack import Pipeline
from haystack.components.builders import PromptBuilder
from haystack.components.embedders import SentenceTransformersTextEmbedder
from haystack.components.embedders import SentenceTransformersDocumentEmbedder
from haystack.components.generators import HuggingFaceLocalGenerator

Инструменты для внедрения и генератор:

Код: Выделить всё

embedder = SentenceTransformersDocumentEmbedder(model=embedding_model)
text_embedder = SentenceTransformersTextEmbedder(model=embedding_model)
generator = HuggingFaceLocalGenerator(model=mymodel)

конвейер индексирования (

Код: Выделить всё

question

соответствует загруженному документу):

Код: Выделить всё

indexing_pipeline = Pipeline()

indexing_pipeline.add_component("converter", MarkdownToDocument())
indexing_pipeline.add_component("splitter", DocumentSplitter(split_by="sentence", split_length=2))
indexing_pipeline.add_component("embedder", embedder)
indexing_pipeline.add_component("writer", DocumentWriter(document_store))

indexing_pipeline.connect("converter.documents", "splitter.documents")
indexing_pipeline.connect("splitter.documents", "embedder.documents")
indexing_pipeline.connect("embedder", "writer")

query_pipeline:

Код: Выделить всё

query_pipeline = Pipeline()

query_pipeline.add_component("text_embedder", text_embedder)
query_pipeline.add_component("retriever", MilvusEmbeddingRetriever(document_store=document_store, top_k=3))
query_pipeline.add_component("prompt_builder", PromptBuilder(template=prompt_template))
query_pipeline.add_component("generator", generator)

query_pipeline.connect("text_embedder.embedding", "retriever.query_embedding")
query_pipeline.connect("retriever.documents", "prompt_builder.documents")
query_pipeline.connect("prompt_builder", "generator")

Код: Выделить всё

.run()

вызывает:

Код: Выделить всё

indexing_pipeline.run({
"converter": {"sources": [file_path]},
})
results = query_pipeline.run({
"text_embedder": {"text": question},
})
print("RAG answer:", results["generator"]["replies"][0])

Вывод простой: Ответ RAG:
Кроме того, при загрузке средства внедрения отображается следующая строка: В словарь добавлены специальные токены, убедитесь, что соответствующие встраивания слов точно настроены или обучены.
Я не уверен, связана ли проблема с моделями, которые я выбрал? или в моем конвейере (может быть, проблемы с внедрением документа и текста вместе?)

Я рад получить любой совет, помочь с этим.

РЕДАКТИРОВАТЬ 1. Следуя предложениям @Stefano-Fiorucci, внесены следующие изменения:

разделен конвейер для индексации и запроса (см. код выше) ).
вот код подсказки, может быть, проблема здесь? :

Код: Выделить всё

prompt_template = """Answer the following query based on the provided context. If the context does
not include an answer, reply with 'I don't know'.\n
Query: {{query}}
Documents:
{% for doc in documents %}
{{ doc.content }}
{% endfor %}
Answer:
"""

проверено также с помощью Alibaba-NLP/gte-large-en-v1.5

Но, к сожалению, я все равно получаю пустую строку из системы.
полный вывод результатов (т. е. query_pipeline.run( {"text_embedder": {"text": вопрос},})) — это:

Код: Выделить всё

{'generator': {'replies': ['\n']}}

Подробнее здесь: https://stackoverflow.com/questions/790 ... -responses

1728399073

Anonymous

Мой конвейер RAG (с использованием Haystack) компилируется и запускается, но возвращает пустые ответы.

Из моих проверок я подумал, что это может быть связано с несовместимостью моделей внедрения и llm, поэтому я изменена на модель внедрения, основанную на той же модели, что и моя модель llm (обе основаны на мистрале).
[code]mymodel = "occiglot/occiglot-7b-eu5-instruct"  # llm model
# embedding_model = "Alibaba-NLP/gte-Qwen2-7B-instruct"  # old embedding model
embedding_model = "intfloat/e5-mistral-7b-instruct"
[/code]
Мой соответствующий импорт следующий:
[code]from haystack import Pipeline
from haystack.components.builders import PromptBuilder
from haystack.components.embedders import SentenceTransformersTextEmbedder
from haystack.components.embedders import SentenceTransformersDocumentEmbedder
from haystack.components.generators import HuggingFaceLocalGenerator
[/code]
Инструменты для внедрения и генератор:
[code]embedder = SentenceTransformersDocumentEmbedder(model=embedding_model)
text_embedder = SentenceTransformersTextEmbedder(model=embedding_model)
generator = HuggingFaceLocalGenerator(model=mymodel)
[/code]
конвейер индексирования ([code]question[/code] соответствует загруженному документу):
[code]indexing_pipeline = Pipeline()

indexing_pipeline.add_component("converter", MarkdownToDocument())
indexing_pipeline.add_component("splitter", DocumentSplitter(split_by="sentence", split_length=2))
indexing_pipeline.add_component("embedder", embedder)
indexing_pipeline.add_component("writer", DocumentWriter(document_store))

indexing_pipeline.connect("converter.documents", "splitter.documents")
indexing_pipeline.connect("splitter.documents", "embedder.documents")
indexing_pipeline.connect("embedder", "writer")
[/code]
query_pipeline:
[code]query_pipeline = Pipeline()

query_pipeline.add_component("text_embedder", text_embedder)
query_pipeline.add_component("retriever", MilvusEmbeddingRetriever(document_store=document_store, top_k=3))
query_pipeline.add_component("prompt_builder", PromptBuilder(template=prompt_template))
query_pipeline.add_component("generator", generator)

query_pipeline.connect("text_embedder.embedding", "retriever.query_embedding")
query_pipeline.connect("retriever.documents", "prompt_builder.documents")
query_pipeline.connect("prompt_builder", "generator")
[/code]
[code].run()[/code] вызывает:
[code]indexing_pipeline.run({
"converter": {"sources": [file_path]},
})
results = query_pipeline.run({
"text_embedder": {"text": question},
})
print("RAG answer:", results["generator"]["replies"][0])
[/code]
Вывод простой: Ответ RAG: 
Кроме того, при загрузке средства внедрения отображается следующая строка: В словарь добавлены специальные токены, убедитесь, что соответствующие встраивания слов точно настроены или обучены.
Я не уверен, связана ли проблема с моделями, которые я выбрал? или в моем конвейере (может быть, проблемы с внедрением документа и текста вместе?)

Я рад получить любой совет, помочь с этим.

РЕДАКТИРОВАТЬ 1. Следуя предложениям @Stefano-Fiorucci, внесены следующие изменения:
[list]
[*]разделен конвейер для индексации и запроса (см. код выше) ).
[*]вот код подсказки, может быть, проблема здесь? :
[/list]
[code]prompt_template = """Answer the following query based on the provided context. If the context does
not include an answer, reply with 'I don't know'.\n
Query: {{query}}
Documents:
{% for doc in documents %}
{{ doc.content }}
{% endfor %}
Answer:
"""
[/code]
[list]
[*]проверено также с помощью Alibaba-NLP/gte-large-en-v1.5
[/list]
Но, к сожалению, я все равно получаю пустую строку из системы.
полный вывод результатов (т. е. query_pipeline.run( {"text_embedder": {"text": вопрос},})) — это:

[code]{'generator': {'replies': ['\n']}}[/code] 

Подробнее здесь: [url]https://stackoverflow.com/questions/79062223/rag-with-haystack-compiles-but-returns-empty-responses[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

RAG с Haystack: компилируется, но возвращает пустые ответы

Последнее сообщение Anonymous « 07 окт 2024, 16:49
Добавлено в форуме Python

Anonymous » 07 окт 2024, 16:49 » в форуме Python

Мой конвейер RAG (с использованием Haystack) компилируется и запускается, но возвращает пустые ответы.

Из моих проверок я подумал, что это может быть связано с несовместимостью моделей внедрения и llm, поэтому я изменена на модель внедрения,...

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
07 окт 2024, 16:49
Modulenotfounderror: нет модуля с именем 'haystack.document_store.elasticsearch'; 'Haystack.document_store' не является

Последнее сообщение Anonymous « 25 июн 2025, 09:36
Добавлено в форуме Python

Anonymous » 25 июн 2025, 09:36 » в форуме Python

Я строю Q & A WebApp с Elasticsearch. Я только что успешно установил Farm-haystack == 1.3.0 и ферма с требованиями. Txt.
Теперь, когда я импортирую библиотеку, она выявляет ошибку:
from haystack.document_store.elasticsearch import...

0 Ответы

5 Просмотры

Последнее сообщение Anonymous
25 июн 2025, 09:36
Моя программа должна сравнивать тестовые ответы из файла, но она не регистрирует пустые ответы. Как мне это исправить?

Последнее сообщение Anonymous « 27 ноя 2024, 05:08
Добавлено в форуме C++

Anonymous » 27 ноя 2024, 05:08 » в форуме C++

Моя программа читает файл из файла, где первая строка содержит правильные ответы, а следующие строки содержат идентификатор учащегося и его ответы.
TTFTFTTTFTFTFFTTFTTF
ABC54102 T FTFTFTTTFTTFTTF TF
DEF56278 TTFTFTTTFTFTFFTTFTTF
ABC42366...

0 Ответы

26 Просмотры

Последнее сообщение Anonymous
27 ноя 2024, 05:08
Моя программа должна сравнивать тестовые ответы из файла, но она не регистрирует пустые ответы. Как мне это исправить? [

Последнее сообщение Anonymous « 28 ноя 2024, 22:39
Добавлено в форуме C++

Anonymous » 28 ноя 2024, 22:39 » в форуме C++

Моя программа читает файл из файла, где первая строка содержит правильные ответы, а следующие строки содержат идентификатор учащегося и его ответы.
TTFTFTTTFTFTFFTTFTTF
ABC54102 T FTFTFTTTFTTFTTF TF
DEF56278 TTFTFTTTFTFTFFTTFTTF
ABC42366...

0 Ответы

49 Просмотры

Последнее сообщение Anonymous
28 ноя 2024, 22:39
Конвейер RAG с использованием Haystack — ошибка при внедрении Pipeline

Последнее сообщение Anonymous « 03 окт 2024, 17:30
Добавлено в форуме Python

Anonymous » 03 окт 2024, 17:30 » в форуме Python

Я пытаюсь запустить конвейер RAG с использованием Haystack (и Milvus) на своем экземпляре кластера с использованием Python (3.10.12).

Показаны импортированные и соответствующие пакеты, которые у меня есть в этой среде. в конце этого вопроса.
мой...

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
03 окт 2024, 17:30

Вернуться в «Python»