Почему ConversationalRetrievalChain/RetrivalQA включает в ответ подсказку, вызывающую рекурсивный рост текста? - Цифровое Кемерово

Почему ConversationalRetrievalChain/RetrivalQA включает в ответ подсказку, вызывающую рекурсивный рост текста? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Почему ConversationalRetrievalChain/RetrivalQA включает в ответ подсказку, вызывающую рекурсивный рост текста?

Цитата

Сообщение Anonymous » 14 ноя 2024, 12:05

Я создаю чат-бота RAG на собственных данных, используя langchain. Существует множество руководств, как это сделать, например это
Большинство руководств рекомендуют использовать ConversationalRetrievalChain. Однако я заметил, что он рекурсивно анализирует предыдущие тексты несколько раз, что приводит к квадратичному увеличению длины текста с каждым новым вопросом. Это ожидаемое поведение? Как это исправить?
Минимальный воспроизводимый пример
Для простоты давайте проигнорируем средство внедрения (предположим, что соответствующих документов нет). Итак, базовый код будет следующим:

Код: Выделить всё

import gradio as gr
from langchain.chains import ConversationalRetrievalChain
from langchain_community.embeddings import HuggingFaceEmbeddings
from langchain_community.llms.huggingface_pipeline import HuggingFacePipeline
from langchain_core.vectorstores import InMemoryVectorStore
from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline

LLM_MODEL_NAME = 'meta-llama/Llama-3.2-1B-Instruct'  # can be any other model
EMBEDDER_MODEL_NAME = 'dunzhang/stella_en_1.5B_v5'  # doesn't matter here

model = AutoModelForCausalLM.from_pretrained(LLM_MODEL_NAME)
tokenizer = AutoTokenizer.from_pretrained(LLM_MODEL_NAME)
llm_pipeline = pipeline(
'text-generation',
model=model,
tokenizer=tokenizer,
max_new_tokens=256,
)
llm = HuggingFacePipeline(pipeline=llm_pipeline)

# just mock of embedder and vector store
embedder = HuggingFaceEmbeddings(model_name=EMBEDDER_MODEL_NAME)
vector_store = InMemoryVectorStore(embedder)

retriever = vector_store.as_retriever()
chain = ConversationalRetrievalChain.from_llm(
llm=llm,
retriever=retriever,
return_source_documents=True,
)

def predict(message: str, history: list[list[str]]) -> str:
history = [tuple(record) for record in history]
result = chain.invoke({
'question': message,
'chat_history': history,
})
return result['answer']

gr.ChatInterface(predict).launch()

Когда я запускаю этот код, модель рекурсивно анализирует одну и ту же часть все больше и больше раз. Эта часть выделена красным прямоугольником на экране:

< /p>
PS Такое поведение также происходит в случае цепочки RetrivalQA
UPD Я обнаружил аналогичную проблему в этом сообщении Reddit для RetrivalQA цепочка, но у нее нет полезного ответа

Подробнее здесь: https://stackoverflow.com/questions/791 ... answer-tha

Реклама

1731575100

Anonymous

Я создаю чат-бота RAG на собственных данных, используя langchain. Существует множество руководств, как это сделать, например это
Большинство руководств рекомендуют использовать ConversationalRetrievalChain. Однако я заметил, что он рекурсивно анализирует предыдущие тексты несколько раз, что приводит к квадратичному увеличению длины текста с каждым новым вопросом. Это ожидаемое поведение? Как это исправить?
Минимальный воспроизводимый пример
Для простоты давайте проигнорируем средство внедрения (предположим, что соответствующих документов нет). Итак, базовый код будет следующим:
[code]import gradio as gr
from langchain.chains import ConversationalRetrievalChain
from langchain_community.embeddings import HuggingFaceEmbeddings
from langchain_community.llms.huggingface_pipeline import HuggingFacePipeline
from langchain_core.vectorstores import InMemoryVectorStore
from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline

LLM_MODEL_NAME = 'meta-llama/Llama-3.2-1B-Instruct'  # can be any other model
EMBEDDER_MODEL_NAME = 'dunzhang/stella_en_1.5B_v5'  # doesn't matter here

model = AutoModelForCausalLM.from_pretrained(LLM_MODEL_NAME)
tokenizer = AutoTokenizer.from_pretrained(LLM_MODEL_NAME)
llm_pipeline = pipeline(
'text-generation',
model=model,
tokenizer=tokenizer,
max_new_tokens=256,
)
llm = HuggingFacePipeline(pipeline=llm_pipeline)

# just mock of embedder and vector store
embedder = HuggingFaceEmbeddings(model_name=EMBEDDER_MODEL_NAME)
vector_store = InMemoryVectorStore(embedder)

retriever = vector_store.as_retriever()
chain = ConversationalRetrievalChain.from_llm(
llm=llm,
retriever=retriever,
return_source_documents=True,
)

def predict(message: str, history: list[list[str]]) -> str:
history = [tuple(record) for record in history]
result = chain.invoke({
'question': message,
'chat_history': history,
})
return result['answer']

gr.ChatInterface(predict).launch()
[/code]
Когда я запускаю этот код, модель рекурсивно анализирует одну и ту же часть все больше и больше раз. Эта часть выделена красным прямоугольником на экране:
[img]https://i.sstatic.net/82tSNqnT.png[/img]
< /p>
PS Такое поведение также происходит в случае цепочки RetrivalQA
UPD Я обнаружил аналогичную проблему в этом сообщении Reddit для RetrivalQA цепочка, но у нее нет полезного ответа 

Подробнее здесь: [url]https://stackoverflow.com/questions/79185128/why-does-conversationalretrievalchain-retrievalqa-include-prompt-in-answer-tha[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Почему ConversationalRetrievalChain вызывает рекурсивный рост текста?

Последнее сообщение Anonymous « 13 ноя 2024, 16:33
Добавлено в форуме Python

Anonymous » 13 ноя 2024, 16:33 » в форуме Python

Я создаю чат-бота RAG на собственных данных, используя langchain. Существует множество руководств, как это сделать, например это
Большинство руководств рекомендуют использовать ConversationalRetrievalChain. Однако я заметил, что он рекурсивно...

0 Ответы

22 Просмотры

Последнее сообщение Anonymous
13 ноя 2024, 16:33
Могу ли я предотвратить рост ребенка в контейнере «гибкий рост»?

Последнее сообщение Anonymous « 29 июл 2025, 13:41
Добавлено в форуме Html

Anonymous » 29 июл 2025, 13:41 » в форуме Html

У меня есть следующая иерархия (упрощенная):

Структура разработана таким образом, что если содержание сайта меньше всего экрана, она будет охватывать вертикально до размера экрана. Но если контент больше экрана, сайт будет расти,...

0 Ответы

8 Просмотры

Последнее сообщение Anonymous
29 июл 2025, 13:41
Могу ли я предотвратить рост ребенка в контейнере «гибкий рост»?

Последнее сообщение Anonymous « 29 июл 2025, 13:41
Добавлено в форуме CSS

Anonymous » 29 июл 2025, 13:41 » в форуме CSS

У меня есть следующая иерархия (упрощенная):

Структура разработана таким образом, что если содержание сайта меньше всего экрана, она будет охватывать вертикально до размера экрана. Но если контент больше экрана, сайт будет расти,...

0 Ответы

7 Просмотры

Последнее сообщение Anonymous
29 июл 2025, 13:41
Могу ли я предотвратить рост ребенка в контейнере «гибкий рост»?

Последнее сообщение Anonymous « 07 авг 2025, 09:23
Добавлено в форуме Html

Anonymous » 07 авг 2025, 09:23 » в форуме Html

У меня есть следующая иерархия (упрощенная):

Структура разработана таким образом, что если содержание сайта меньше всего экрана, она будет охватывать вертикально до размера экрана. Но если контент больше экрана, сайт будет расти,...

0 Ответы

3 Просмотры

Последнее сообщение Anonymous
07 авг 2025, 09:23
Могу ли я предотвратить рост ребенка в контейнере «гибкий рост»?

Последнее сообщение Anonymous « 07 авг 2025, 09:23
Добавлено в форуме CSS

Anonymous » 07 авг 2025, 09:23 » в форуме CSS

У меня есть следующая иерархия (упрощенная):

Структура разработана таким образом, что если содержание сайта меньше всего экрана, она будет охватывать вертикально до размера экрана. Но если контент больше экрана, сайт будет расти,...

0 Ответы

3 Просмотры

Последнее сообщение Anonymous
07 авг 2025, 09:23

Вернуться в «Python»

Programmiererforum