Выполнение вывода LLM локально с помощью Python (LangChain/AutoGen/AutoMemGPT) с использованием модели LLM, размещенной

Выполнение вывода LLM локально с помощью Python (LangChain/AutoGen/AutoMemGPT) с использованием модели LLM, размещенной ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Выполнение вывода LLM локально с помощью Python (LangChain/AutoGen/AutoMemGPT) с использованием модели LLM, размещенной

Цитата

Сообщение Anonymous » 05 дек 2024, 16:56

Я запускаю ehartford_dolphin-2.1-mistral-7b на машине RTX A6000 на RunPod с шаблоном TheBloke LLM Text Generation WebUI.
У меня есть 2 варианта: запуск webui на runpod или запуск шаблона вывода HuggingFace Text Generation на runpod
Вариант 1. RunPod WebUI
Я могу успешно загрузить модель в текстовом редакторе WebUI в RunPod на вкладке «Чат». Теперь я хочу получить к нему доступ через свой код Python и выполнить вывод. Идеальным вариантом было бы, если бы я интегрировал его в LangChain и создал объект LLM LangChain.

Я включил openai и API на RunPod webui на вкладке «Настройки».
Сейчас у меня включены порты 7860, 5001 и 5000.

Использование AutoMemGPT
Я нашел этот код Python, использующий AutoMemGPT для доступа к конечной точке WebUI:

Код: Выделить всё

import os
import autogen
import memgpt.autogen.memgpt_agent as memgpt_autogen
import memgpt.autogen.interface as autogen_interface
import memgpt.agent as agent
import memgpt.system as system
import memgpt.utils as utils
import memgpt.presets as presets
import memgpt.constants as constants
import memgpt.personas.personas as personas
import memgpt.humans.humans as humans
from memgpt.persistence_manager import InMemoryStateManager, InMemoryStateManagerWithPreloadedArchivalMemory, InMemoryStateManagerWithEmbeddings, InMemoryStateManagerWithFaiss
import openai

config_list = [
{
"api_type": "open_ai",
"api_base": "https://0ciol64iqvewdn-5001.proxy.runpod.net/v1",
"api_key": "NULL",
},
]

llm_config = {"config_list": config_list, "seed": 42}

# If USE_MEMGPT is False, then this example will be the same as the official AutoGen repo
# (https://github.com/microsoft/autogen/blob/main/notebook/agentchat_groupchat.ipynb)
# If USE_MEMGPT is True, then we swap out the "coder" agent with a MemGPT agent

USE_MEMGPT = True

## api keys for the memGPT
openai.api_base="https://0ciol64iqvewdn-5001.proxy.runpod.net/v1"
openai.api_key="NULL"

# The user agent
user_proxy = autogen.UserProxyAgent(
name="User_proxy",
system_message="A human admin.",
code_execution_config={"last_n_messages": 2, "work_dir": "groupchat"},
human_input_mode="TERMINATE",  # needed?
default_auto_reply="You are going to figure all out by your own. "
"Work by yourself, the user won't reply until you output `TERMINATE` to end the conversation.",
)

interface = autogen_interface.AutoGenInterface()
persistence_manager=InMemoryStateManager()
persona = "I am a 10x engineer, trained in Python. I was the first engineer at Uber."
human = "Im a team manager at this company"
memgpt_agent=presets.use_preset(presets.DEFAULT_PRESET, model='gpt-4', persona=persona, human=human, interface=interface, persistence_manager=persistence_manager, agent_config=llm_config)

if not USE_MEMGPT:
# In the AutoGen example, we create an AssistantAgent to play the role of the coder
coder = autogen.AssistantAgent(
name="Coder",
llm_config=llm_config,
system_message=f"I am a 10x engineer, trained in Python.  I was the first engineer at Uber",
human_input_mode="TERMINATE",
)

else:
# In our example, we swap this AutoGen agent with a MemGPT agent
# This MemGPT agent will have all the benefits of MemGPT, ie persistent memory, etc.
print("\nMemGPT Agent at work\n")
coder = memgpt_autogen.MemGPTAgent(
name="MemGPT_coder",
agent=memgpt_agent,
)

# Begin the group chat with a message from the user
user_proxy.initiate_chat(
coder,
message="Write a Function to print Numbers 1 to 10"
)

Ошибка

Обратная трассировка ModuleNotFoundError (самая последняя вызов
последний) Ячейка In[2], строка 10
8 импортировать memgpt.presets как предустановки
9 импортировать memgpt.constants как константы
---> 10 импорт memgpt.personas.personas как персоны
11 импортировать memgpt.humans.humans как людей
12 из memgpt.persistence_manager import InMemoryStateManager, InMemoryStateManagerWithPreloadedArchivalMemory,
InMemoryStateManagerWithEmbeddings, InMemoryStateManagerWithFaiss
ModuleNotFoundError: нет модуля с именем «memgpt.personas.personas»

Как я пытался устранить эту ошибку

Код: Выделить всё
```
pip install --upgrade pymemgpt
```
-- ошибка не меняется
Код: Выделить всё
```
pip install pymemgpt==0.1.3
```
-- Я получаю конфликты версий OpenAI
Код: Выделить всё
```
pip install -e .
```
после клонирования репозитория MemGPT – еще одна ошибка

Что мне нужно
< ul>
[*]Я всегда сталкиваюсь с конфликтами версий между openai, llama-index, pymemgpt, pyautogpt, numpy, так что, возможно, подходящая версия для запуска этого кода была бы хороша, в противном случае любой совет?

Вариант 2. Использование интерфейса генерации текста HuggingFace
Так вместо загрузка шаблона TheBloke LLM, который запускает webui на RunPod. Я нашел руководство по использованию шаблона TextGenerationInference
Текущий код

Код: Выделить всё

gpu_count = 1

pod = runpod.create_pod(
name="Llama-7b-chat",
image_name="ghcr.io/huggingface/text-generation-inference:0.9.4",
gpu_type_id="NVIDIA RTX A4500",
data_center_id="EU-RO-1",
cloud_type="SECURE",
docker_args="--model-id TheBloke/Llama-2-7b-chat-fp16",
gpu_count=gpu_count,
volume_in_gb=50,
container_disk_in_gb=5,
ports="80/http,29500/http",
volume_mount_path="/data",
)
pod

from langchain.llms import HuggingFaceTextGenInference

inference_server_url = f'https://{pod["id"]}-80.proxy.runpod.net'
llm = HuggingFaceTextGenInference(
inference_server_url=inference_server_url,
max_new_tokens=1000,
top_k=10,
top_p=0.95,
typical_p=0.95,
temperature=0.1,
repetition_penalty=1.03,
)

Он хорошо работает на Llama 2, но я не могу заставить его работать на других LLM, которым перед запуском требуется тонна настроек в веб-интерфейсе. Например, Falcon или Mixtral, где мне нужно вручную изменить несколько параметров в WebUI.
Что мне нужно

Способ запуска этого кода в любом LLM путем программной установки параметров модели, настроек и т. д. вместо этого через веб-интерфейс RunPod

Подробнее здесь: https://stackoverflow.com/questions/777 ... automemgpt

1733407002

Anonymous

Я запускаю ehartford_dolphin-2.1-mistral-7b на машине RTX A6000 на RunPod с шаблоном TheBloke LLM Text Generation WebUI.
У меня есть 2 варианта: запуск webui на runpod или запуск шаблона вывода HuggingFace Text Generation на runpod
[b]Вариант 1. RunPod WebUI[/b]
Я могу успешно загрузить модель в текстовом редакторе WebUI в RunPod на вкладке «Чат». Теперь я хочу получить к нему доступ через свой код Python и выполнить вывод. Идеальным вариантом было бы, если бы я интегрировал его в LangChain и создал объект LLM LangChain.
[list]
[*]Я включил openai и API на RunPod webui на вкладке «Настройки».
[*]Сейчас у меня включены порты 7860, 5001 и 5000.
[/list]
[b]Использование AutoMemGPT[/b]
Я нашел этот код Python, использующий AutoMemGPT для доступа к конечной точке WebUI:
[code]import os
import autogen
import memgpt.autogen.memgpt_agent as memgpt_autogen
import memgpt.autogen.interface as autogen_interface
import memgpt.agent as agent
import memgpt.system as system
import memgpt.utils as utils
import memgpt.presets as presets
import memgpt.constants as constants
import memgpt.personas.personas as personas
import memgpt.humans.humans as humans
from memgpt.persistence_manager import InMemoryStateManager, InMemoryStateManagerWithPreloadedArchivalMemory, InMemoryStateManagerWithEmbeddings, InMemoryStateManagerWithFaiss
import openai

config_list = [
{
"api_type": "open_ai",
"api_base": "https://0ciol64iqvewdn-5001.proxy.runpod.net/v1",
"api_key": "NULL",
},
]

llm_config = {"config_list": config_list, "seed": 42}

# If USE_MEMGPT is False, then this example will be the same as the official AutoGen repo
# (https://github.com/microsoft/autogen/blob/main/notebook/agentchat_groupchat.ipynb)
# If USE_MEMGPT is True, then we swap out the "coder" agent with a MemGPT agent

USE_MEMGPT = True

## api keys for the memGPT
openai.api_base="https://0ciol64iqvewdn-5001.proxy.runpod.net/v1"
openai.api_key="NULL"

# The user agent
user_proxy = autogen.UserProxyAgent(
name="User_proxy",
system_message="A human admin.",
code_execution_config={"last_n_messages": 2, "work_dir": "groupchat"},
human_input_mode="TERMINATE",  # needed?
default_auto_reply="You are going to figure all out by your own. "
"Work by yourself, the user won't reply until you output `TERMINATE` to end the conversation.",
)

interface = autogen_interface.AutoGenInterface()
persistence_manager=InMemoryStateManager()
persona = "I am a 10x engineer, trained in Python. I was the first engineer at Uber."
human = "Im a team manager at this company"
memgpt_agent=presets.use_preset(presets.DEFAULT_PRESET, model='gpt-4', persona=persona, human=human, interface=interface, persistence_manager=persistence_manager, agent_config=llm_config)

if not USE_MEMGPT:
# In the AutoGen example, we create an AssistantAgent to play the role of the coder
coder = autogen.AssistantAgent(
name="Coder",
llm_config=llm_config,
system_message=f"I am a 10x engineer, trained in Python.  I was the first engineer at Uber",
human_input_mode="TERMINATE",
)

else:
# In our example, we swap this AutoGen agent with a MemGPT agent
# This MemGPT agent will have all the benefits of MemGPT, ie persistent memory, etc.
print("\nMemGPT Agent at work\n")
coder = memgpt_autogen.MemGPTAgent(
name="MemGPT_coder",
agent=memgpt_agent,
)

# Begin the group chat with a message from the user
user_proxy.initiate_chat(
coder,
message="Write a Function to print Numbers 1 to 10"
)
[/code]
Ошибка


Обратная трассировка ModuleNotFoundError (самая последняя вызов
последний) Ячейка In[2], строка 10
8 импортировать memgpt.presets как предустановки
9 импортировать memgpt.constants как константы
---> 10 импорт memgpt.personas.personas как персоны
11 импортировать memgpt.humans.humans как людей
12 из memgpt.persistence_manager import InMemoryStateManager, InMemoryStateManagerWithPreloadedArchivalMemory,
InMemoryStateManagerWithEmbeddings, InMemoryStateManagerWithFaiss
ModuleNotFoundError: нет модуля с именем «memgpt.personas.personas»

Как я пытался устранить эту ошибку 
[list]
[*][code]pip install --upgrade pymemgpt[/code] -- ошибка не меняется
[*][code]pip install pymemgpt==0.1.3[/code] -- Я получаю конфликты версий OpenAI
[*][code]pip install -e .[/code] после клонирования репозитория MemGPT – еще одна ошибка
[/list]
Что мне нужно
< ul>
[*]Я всегда сталкиваюсь с конфликтами версий между openai, llama-index, pymemgpt, pyautogpt, numpy, так что, возможно, подходящая версия для запуска этого кода была бы хороша, в противном случае любой совет?

[b]Вариант 2. Использование интерфейса генерации текста HuggingFace[/b]
Так вместо загрузка шаблона TheBloke LLM, который запускает webui на RunPod. Я нашел руководство по использованию шаблона TextGenerationInference
Текущий код
[code]gpu_count = 1

pod = runpod.create_pod(
name="Llama-7b-chat",
image_name="ghcr.io/huggingface/text-generation-inference:0.9.4",
gpu_type_id="NVIDIA RTX A4500",
data_center_id="EU-RO-1",
cloud_type="SECURE",
docker_args="--model-id TheBloke/Llama-2-7b-chat-fp16",
gpu_count=gpu_count,
volume_in_gb=50,
container_disk_in_gb=5,
ports="80/http,29500/http",
volume_mount_path="/data",
)
pod

from langchain.llms import HuggingFaceTextGenInference

inference_server_url = f'https://{pod["id"]}-80.proxy.runpod.net'
llm = HuggingFaceTextGenInference(
inference_server_url=inference_server_url,
max_new_tokens=1000,
top_k=10,
top_p=0.95,
typical_p=0.95,
temperature=0.1,
repetition_penalty=1.03,
)
[/code]
Он хорошо работает на Llama 2, но я не могу заставить его работать на других LLM, которым перед запуском требуется тонна настроек в веб-интерфейсе. Например, Falcon или Mixtral, где мне нужно вручную изменить несколько параметров в WebUI.
Что мне нужно
[list][*]Способ запуска этого кода в любом LLM путем программной установки параметров модели, настроек и т. д. вместо этого через веб-интерфейс RunPod
[/list] 

Подробнее здесь: [url]https://stackoverflow.com/questions/77714850/performing-llm-inference-locally-with-python-langchain-autogen-automemgpt[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

LangChain + Hugging Face -> Ошибка импорта LangChain LLM

Последнее сообщение Anonymous « 13 окт 2024, 15:11
Добавлено в форуме Python

Anonymous » 13 окт 2024, 15:11 » в форуме Python

Я пытаюсь выполнить следующий простой код:
from transformers import pipeline
import langchain
from langchain.llms import HuggingFacePipeline

model_name = bert-base-uncased
task = question-answering

Я получаю следующую ошибку:

ОШИБКА:...

0 Ответы

26 Просмотры

Последнее сообщение Anonymous
13 окт 2024, 15:11
Ошибка назначения langchain LLM (из руководства по langchain)

Последнее сообщение Anonymous « 19 окт 2024, 12:26
Добавлено в форуме Python

Anonymous » 19 окт 2024, 12:26 » в форуме Python

Я пытаюсь следовать этому учебнику по Python Langchain для подключения к модели LLM vertexai (ссылка здесь), но мой код не работает. Я пишу/запускаю код в блокноте Jupyter.
Прежде чем выполнить код, я зашел в свою учетную запись Google Cloud, создал...

0 Ответы

27 Просмотры

Последнее сообщение Anonymous
19 окт 2024, 12:26
Подключите Langroid к моей собственной LLM, размещенной в облаке

Последнее сообщение Anonymous « 10 июн 2025, 00:14
Добавлено в форуме Python

Anonymous » 10 июн 2025, 00:14 » в форуме Python

Я чувствую, что это должно быть очень распространенным шаблоном, но я пытаюсь использовать Langroid для создания агента ИИ, который подключается к агенту LLM, которого я привожу себя в Azure. Я не могу найти нигде в документах Langroid, в которых...

0 Ответы

4 Просмотры

Последнее сообщение Anonymous
10 июн 2025, 00:14
Подключите Langroid к моей собственной LLM, размещенной в облаке

Последнее сообщение Anonymous « 10 июн 2025, 19:15
Добавлено в форуме Python

Anonymous » 10 июн 2025, 19:15 » в форуме Python

Я чувствую, что это должно быть очень распространенным шаблоном, но я пытаюсь использовать Langroid для создания агента ИИ, который подключается к агенту LLM, которого я привожу себя в Azure. Я не могу найти нигде в документах Langroid, в которых...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
10 июн 2025, 19:15
Я получаю сообщение об ошибке при попытке запустить autogen с помощью локального LLM.

Последнее сообщение Anonymous « 05 дек 2024, 16:55
Добавлено в форуме Python

Anonymous » 05 дек 2024, 16:55 » в форуме Python

Ниже приведен код, который я использую. Обратите внимание, что я использую LM Studio (LLM: Llama 2) и дважды проверил правильность номера сервера.
from autogen import AssistantAgent, UserProxyAgent

config_list =

llm_config = {'config_list':...

0 Ответы

24 Просмотры

Последнее сообщение Anonymous
05 дек 2024, 16:55

Вернуться в «Python»