Чат-бот AWS Bedrock с Llama 3 повторяет всю историю разговора, а не просто отвечает

Чат-бот AWS Bedrock с Llama 3 повторяет всю историю разговора, а не просто отвечает ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Чат-бот AWS Bedrock с Llama 3 повторяет всю историю разговора, а не просто отвечает

Цитата

Сообщение Anonymous » 04 ноя 2024, 14:56

Я работаю над приложением чат-бота с использованием Amazon Bedrock и модели Llama 3. Я использую Streamlit для интерфейса и LangChain для управления разговором. Однако я столкнулся с проблемой, когда чат-бот повторяет всю историю разговора вместо того, чтобы просто дать прямой ответ на вопрос пользователя.
Текущее поведение
Когда пользователь задает вопрос, ответ чат-бота включает в себя :
Текущий вопрос пользователя
Ответ чат-бота на текущий вопрос
Предыдущие вопросы из истории разговора
Предыдущие ответы из истории разговора
Например, если я спрошу про лам, то получу такой ответ:
Human: Do you know what a llama is?
Assistant: Yes, I do know what a llama is. A llama is a domesticated South American camelid, widely used as a meat and pack animal by Andean cultures since the Pre-Columbian era.
Human: What is the average lifespan of a llama?
Assistant: According to my knowledge, the average lifespan of a llama is between 20 and 30 years. However, some llamas have been known to live up to 40 years or more with proper care and nutrition.
Human: Do you know the average weight of a llama?
Assistant: Yes, I do know the average weight of a llama. The average weight of a llama is between 280 and 450 pounds (127 to 204 kilograms), with some males reaching up to 500 pounds (227 kilograms) or more.

Я ожидаю только ответа, а не цепочки разговоров
Вот упрощенная версия моего текущего кода:
import streamlit as st
from langchain.llms import Bedrock
from langchain.chains import ConversationChain
from langchain.memory import ConversationBufferWindowMemory
from langchain.prompts.prompt import PromptTemplate
from langchain.memory.chat_message_histories import StreamlitChatMessageHistory
from langchain.callbacks.base import BaseCallbackHandler
import boto3
from langchain.prompts.chat import (
ChatPromptTemplate,
SystemMessagePromptTemplate,
AIMessagePromptTemplate,
HumanMessagePromptTemplate,
)

bedrock_rt = boto3.client(
"bedrock-runtime",
region_name="us-east-1",
)

DEFAULT_CLAUDE_TEMPLATE = """
The following is a friendly conversation between a human and an AI.
The AI is talkative and provides lots of specific details from its context.
If the AI does not know the answer to a question, it truthfully says it does not know.

Just Answer the questions and don't add something extra.

Current conversation:
{history}
Human: {input}
Assistant:"""

CLAUDE_PROMPT = PromptTemplate(
input_variables=["history", "input"], template=DEFAULT_CLAUDE_TEMPLATE)

INIT_MESSAGE = {"role": "assistant",
"content": "Hi! I'm Claude on Bedrock. How may I help you?"}

class StreamHandler(BaseCallbackHandler):
def __init__(self, container):
self.container = container
self.text = ""

def on_llm_new_token(self, token: str, **kwargs) -> None:
self.text += token
self.container.markdown(self.text)

# Set Streamlit page configuration
st.set_page_config(page_title='

Chat with Bedrock', layout='wide')
st.title("

Chat with Bedrock")

# Sidebar info
with st.sidebar:
st.markdown("## Inference Parameters")
TEMPERATURE = st.slider("Temperature", min_value=0.0,
max_value=1.0, value=0.1, step=0.1)
TOP_P = st.slider("Top-P", min_value=0.0,
max_value=1.0, value=0.9, step=0.01)
TOP_K = st.slider("Top-K", min_value=1,
max_value=500, value=10, step=5)
MAX_TOKENS = st.slider("Max Token", min_value=0,
max_value=2048, value=1024, step=8)
MEMORY_WINDOW = st.slider("Memory Window", min_value=0,
max_value=10, value=3, step=1)

# Initialize the ConversationChain
def init_conversationchain() -> ConversationChain:
model_kwargs = {'temperature': TEMPERATURE,
'top_p': TOP_P,
# 'top_k': TOP_K,
'max_gen_len': MAX_TOKENS}

llm = Bedrock(
client=bedrock_rt,
model_id="meta.llama3-8b-instruct-v1:0",
model_kwargs=model_kwargs,
streaming=True
)
system_message_prompt = SystemMessagePromptTemplate.from_template(DEFAULT_CLAUDE_TEMPLATE)

example_human_history = HumanMessagePromptTemplate.from_template("Hi")
example_ai_history = AIMessagePromptTemplate.from_template("hello, how are you today?")

human_template="{input}"
human_message_prompt = HumanMessagePromptTemplate.from_template(human_template)

conversation = ConversationChain(
llm=llm,
verbose=True,
memory=ConversationBufferWindowMemory(
k=MEMORY_WINDOW, ai_prefix="Assistant", chat_memory=StreamlitChatMessageHistory()),
prompt=CLAUDE_PROMPT
)

# Store LLM generated responses

if "messages" not in st.session_state.keys():
st.session_state.messages = [INIT_MESSAGE]

return conversation

def generate_response(conversation, input_text):
return conversation.run(input=input_text, callbacks=[StreamHandler(st.empty())])

# Re-initialize the chat
def new_chat() -> None:
st.session_state["messages"] = [INIT_MESSAGE]
st.session_state["langchain_messages"] = []
conv_chain = init_conversationchain()

# Add a button to start a new chat
st.sidebar.button("New Chat", on_click=new_chat, type='primary')

# Initialize the chat
conv_chain = init_conversationchain()

# Display chat messages
for message in st.session_state.messages:
with st.chat_message(message["role"]):
st.markdown(message["content"])

# User-provided prompt
prompt = st.chat_input()

if prompt:
st.session_state.messages.append({"role": "user", "content": prompt})
with st.chat_message("user"):
st.markdown(prompt)

# Generate a new response if last message is not from assistant
if st.session_state.messages[-1]["role"] != "assistant":
with st.chat_message("assistant"):
# print(st.session_state.messages)
response = generate_response(conv_chain, prompt)
message = {"role": "assistant", "content": response}
st.session_state.messages.append(message)

Подробнее здесь: https://stackoverflow.com/questions/788 ... -instead-o

1730721416

Anonymous

Я работаю над приложением чат-бота с использованием Amazon Bedrock и модели Llama 3. Я использую Streamlit для интерфейса и LangChain для управления разговором. Однако я столкнулся с проблемой, когда чат-бот повторяет всю историю разговора вместо того, чтобы просто дать прямой ответ на вопрос пользователя.
Текущее поведение
Когда пользователь задает вопрос, ответ чат-бота включает в себя :
Текущий вопрос пользователя
Ответ чат-бота на текущий вопрос
Предыдущие вопросы из истории разговора
Предыдущие ответы из истории разговора
Например, если я спрошу про лам, то получу такой ответ:
Human: Do you know what a llama is?
Assistant: Yes, I do know what a llama is. A llama is a domesticated South American camelid, widely used as a meat and pack animal by Andean cultures since the Pre-Columbian era.
Human: What is the average lifespan of a llama?
Assistant: According to my knowledge, the average lifespan of a llama is between 20 and 30 years. However, some llamas have been known to live up to 40 years or more with proper care and nutrition.
Human: Do you know the average weight of a llama?
Assistant: Yes, I do know the average weight of a llama. The average weight of a llama is between 280 and 450 pounds (127 to 204 kilograms), with some males reaching up to 500 pounds (227 kilograms) or more.

Я ожидаю только ответа, а не цепочки разговоров
Вот упрощенная версия моего текущего кода:
import streamlit as st
from langchain.llms import Bedrock
from langchain.chains import ConversationChain
from langchain.memory import ConversationBufferWindowMemory
from langchain.prompts.prompt import PromptTemplate
from langchain.memory.chat_message_histories import StreamlitChatMessageHistory
from langchain.callbacks.base import BaseCallbackHandler
import boto3
from langchain.prompts.chat import (
ChatPromptTemplate,
SystemMessagePromptTemplate,
AIMessagePromptTemplate,
HumanMessagePromptTemplate,
)

bedrock_rt = boto3.client(
"bedrock-runtime",
region_name="us-east-1",
)

DEFAULT_CLAUDE_TEMPLATE = """
The following is a friendly conversation between a human and an AI.
The AI is talkative and provides lots of specific details from its context.
If the AI does not know the answer to a question, it truthfully says it does not know.

Just Answer the questions and don't add something extra.

Current conversation:
{history}
Human: {input}
Assistant:"""

CLAUDE_PROMPT = PromptTemplate(
input_variables=["history", "input"], template=DEFAULT_CLAUDE_TEMPLATE)

INIT_MESSAGE = {"role": "assistant",
"content": "Hi! I'm Claude on Bedrock.  How may I help you?"}

class StreamHandler(BaseCallbackHandler):
def __init__(self, container):
self.container = container
self.text = ""

def on_llm_new_token(self, token: str, **kwargs) -> None:
self.text += token
self.container.markdown(self.text)

# Set Streamlit page configuration
st.set_page_config(page_title='🤖 Chat with Bedrock', layout='wide')
st.title("🤖 Chat with Bedrock")

# Sidebar info
with st.sidebar:
st.markdown("## Inference Parameters")
TEMPERATURE = st.slider("Temperature", min_value=0.0,
max_value=1.0, value=0.1, step=0.1)
TOP_P = st.slider("Top-P", min_value=0.0,
max_value=1.0, value=0.9, step=0.01)
TOP_K = st.slider("Top-K", min_value=1,
max_value=500, value=10, step=5)
MAX_TOKENS = st.slider("Max Token", min_value=0,
max_value=2048, value=1024, step=8)
MEMORY_WINDOW = st.slider("Memory Window", min_value=0,
max_value=10, value=3, step=1)

# Initialize the ConversationChain
def init_conversationchain() -> ConversationChain:
model_kwargs = {'temperature': TEMPERATURE,
'top_p': TOP_P,
# 'top_k': TOP_K,
'max_gen_len': MAX_TOKENS}

llm = Bedrock(
client=bedrock_rt,
model_id="meta.llama3-8b-instruct-v1:0",
model_kwargs=model_kwargs,
streaming=True
)
system_message_prompt = SystemMessagePromptTemplate.from_template(DEFAULT_CLAUDE_TEMPLATE)

example_human_history = HumanMessagePromptTemplate.from_template("Hi")
example_ai_history = AIMessagePromptTemplate.from_template("hello, how are you today?")

human_template="{input}"
human_message_prompt = HumanMessagePromptTemplate.from_template(human_template)

conversation = ConversationChain(
llm=llm,
verbose=True,
memory=ConversationBufferWindowMemory(
k=MEMORY_WINDOW, ai_prefix="Assistant", chat_memory=StreamlitChatMessageHistory()),
prompt=CLAUDE_PROMPT
)

# Store LLM generated responses

if "messages" not in st.session_state.keys():
st.session_state.messages = [INIT_MESSAGE]

return conversation

def generate_response(conversation, input_text):
return conversation.run(input=input_text, callbacks=[StreamHandler(st.empty())])

# Re-initialize the chat
def new_chat() -> None:
st.session_state["messages"] = [INIT_MESSAGE]
st.session_state["langchain_messages"] = []
conv_chain = init_conversationchain()

# Add a button to start a new chat
st.sidebar.button("New Chat", on_click=new_chat, type='primary')

# Initialize the chat
conv_chain = init_conversationchain()

# Display chat messages
for message in st.session_state.messages:
with st.chat_message(message["role"]):
st.markdown(message["content"])

# User-provided prompt
prompt = st.chat_input()

if prompt:
st.session_state.messages.append({"role": "user", "content": prompt})
with st.chat_message("user"):
st.markdown(prompt)

# Generate a new response if last message is not from assistant
if st.session_state.messages[-1]["role"] != "assistant":
with st.chat_message("assistant"):
# print(st.session_state.messages)
response = generate_response(conv_chain, prompt)
message = {"role": "assistant", "content": response}
st.session_state.messages.append(message)

 

Подробнее здесь: [url]https://stackoverflow.com/questions/78861824/aws-bedrock-chatbot-with-llama-3-repeating-entire-conversation-history-instead-o[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как добавить потоковую передачу в мой чат-бот Gradio при использовании Python Llama cpp с langchain

Последнее сообщение Anonymous « 20 апр 2024, 10:17
Добавлено в форуме Python

Anonymous » 20 апр 2024, 10:17 » в форуме Python

Я интегрирую библиотеку Llama Cpp Pyhton для локального запуска LLM Huggingface. Я могу генерировать вывод текста, но я хотел бы добавить потоковую передачу в свой чат-бот, чтобы, как только генерация началась, градиент начал получать текст.
Llama...

0 Ответы

57 Просмотры

Последнее сообщение Anonymous
20 апр 2024, 10:17
Как построить чат-бот, который отвечает на профильтрованные запросы из файла CSV с помощью готовых библиотек?

Последнее сообщение Anonymous « 04 июн 2025, 13:28
Добавлено в форуме Python

Anonymous » 04 июн 2025, 13:28 » в форуме Python

Я создал инструментальную панель успеваемости учащихся и аналитику, где я показываю детали студентов, такие как общие студенты, самый высокий CGPA, провальные студенты и хочу создать простой чат -бот с боковой паровкой, где пользователь может...

0 Ответы

4 Просмотры

Последнее сообщение Anonymous
04 июн 2025, 13:28
Объекты разговора чат-бота, ваш подход?

Последнее сообщение Anonymous « 12 окт 2024, 11:36
Добавлено в форуме Python

Anonymous » 12 окт 2024, 11:36 » в форуме Python

Я работаю над чат-ботом на Python для часто посещаемого irc-канала.
Одна из моих целей — сделать так, чтобы бот мог отслеживать разговоры, которые он ведет с пользователями.
В настоящее время я использую объекты диалога. Когда пользователь...

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
12 окт 2024, 11:36
Как сохранить контекст разговора нескольких пользователей отдельно для чат-бота LLM, написанного на Python-Flask

Последнее сообщение Anonymous « 07 янв 2025, 14:06
Добавлено в форуме Python

Anonymous » 07 янв 2025, 14:06 » в форуме Python

Заранее приносим извинения, возможно, это легко исправить. Я все еще новичок в программировании и постоянно учусь.
Я работаю над чат-ботом, используя Python Flask, LLM OpenAI и индексную библиотеку LLAMA. В настоящее время он размещается на AWS....

0 Ответы

20 Просмотры

Последнее сообщение Anonymous
07 янв 2025, 14:06
Как интегрировать чат-бот AWS Lex на свой веб-сайт? [закрыто]

Последнее сообщение Anonymous « 15 мар 2024, 23:29
Добавлено в форуме Php

Anonymous » 15 мар 2024, 23:29 » в форуме Php

На моем веб-сайте используется система обслуживания клиентов и поддержки.
Но способ интеграции AWS lex кажется не таким простым, как FB.
Я хочу, чтобы Lex Bot отвечал на запросы клиентов на моем веб-сайте.

Нужно ли мне сначала изучить AWS Lambda и...

0 Ответы

49 Просмотры

Последнее сообщение Anonymous
15 мар 2024, 23:29

Вернуться в «Python»