Конвейер HuggingFace не использует несколько графических процессоров

Конвейер HuggingFace не использует несколько графических процессоров ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Конвейер HuggingFace не использует несколько графических процессоров

Цитата

Сообщение Anonymous » 01 июл 2024, 21:14

Я создал приложение RAG, которое в основном отвечает на вопросы пользователей на основе предоставленных данных. Оно отлично работает как на графическом процессоре, так и на одном графическом процессоре. Я хочу развернуть его на нескольких графических процессорах (4 T4), но в конвейере всегда возникает ошибка CUDA out of Memory.
Я тоже пробовал использовать ключевое слово «auto», но Langchain не позволяет мне использовать это ключевое слово.
Я использовал Langchain в качестве основной платформы, мой код выглядит так:
from langchain_huggingface import ChatHuggingFace, HuggingFacePipeline, HuggingFaceEmbeddings
MODEL_NAME="mistralai/Mistral-7B-Instruct-v0.3"
pipe = HuggingFacePipeline.from_model_id(
model_id=MODEL_NAME,
device=0,
model_kwargs={"torch_dtype":torch.float16},
task="text-generation")
llm = ChatHuggingFace(llm=pipe)

embedding = HuggingFaceEmbeddings(model_name=MODEL_NAME,
model_kwargs={"device":"cuda:1"},
multi_process=True,
)

Подробнее здесь: https://stackoverflow.com/questions/786 ... tiple-gpus

1719857695

Anonymous

Я создал приложение RAG, которое в основном отвечает на вопросы пользователей на основе предоставленных данных. Оно отлично работает как на графическом процессоре, так и на одном графическом процессоре. Я хочу развернуть его на нескольких графических процессорах (4 T4), но в конвейере всегда возникает ошибка CUDA out of Memory.
Я тоже пробовал использовать ключевое слово «auto», но Langchain не позволяет мне использовать это ключевое слово.
Я использовал Langchain в качестве основной платформы, мой код выглядит так:
from langchain_huggingface import ChatHuggingFace, HuggingFacePipeline, HuggingFaceEmbeddings
MODEL_NAME="mistralai/Mistral-7B-Instruct-v0.3"
pipe = HuggingFacePipeline.from_model_id(
model_id=MODEL_NAME,
device=0,
model_kwargs={"torch_dtype":torch.float16},
task="text-generation")
llm = ChatHuggingFace(llm=pipe)

embedding = HuggingFaceEmbeddings(model_name=MODEL_NAME,
model_kwargs={"device":"cuda:1"},
multi_process=True,
)
 

Подробнее здесь: [url]https://stackoverflow.com/questions/78693678/huggingface-pipeline-doesnt-use-multiple-gpus[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Точная настройка Huggingface Trainer при использовании нескольких графических процессоров получает предупреждения о поте

Последнее сообщение Anonymous « 11 апр 2024, 07:39
Добавлено в форуме Linux

Anonymous » 11 апр 2024, 07:39 » в форуме Linux

Я следую этому сценарию и пытаюсь адаптироваться, установив device_map = auto для использования нескольких графических процессоров в контейнере Docker. Ниже приведены настройки сервера:
DITRIB_ID=Ubuntu
DISPRIB_RELEASE=22.04
ubuntu@ubuntu:~$...

0 Ответы

49 Просмотры

Последнее сообщение Anonymous
11 апр 2024, 07:39
Как уменьшить использование памяти графических процессоров при запуске стабильной диффузии с диффузорами HuggingFace?

Последнее сообщение Anonymous « 07 июн 2025, 19:34
Добавлено в форуме Python

Anonymous » 07 июн 2025, 19:34 » в форуме Python

Я пытаюсь запустить стабильную диффузию, используя библиотеку Diffusers Huggingface , но я продолжаю получать CUDA из ошибок в памяти на моем RTX 3060 (12 ГБ VRAM). Я использую Standard StablediffusionPipeline из «Compvis/Stable-Diffusion-V1-4»...

0 Ответы

6 Просмотры

Последнее сообщение Anonymous
07 июн 2025, 19:34
Как я могу использовать несколько графических процессоров в Arch?

Последнее сообщение Anonymous « 10 ноя 2024, 22:15
Добавлено в форуме Linux

Anonymous » 10 ноя 2024, 22:15 » в форуме Linux

У меня есть GTX 1650 и GT710, сначала была только 1650, и этого было достаточно, пока монитор, подключенный к порту DVI, не перестал работать, и это было из-за драйвера nvidia, как я переустановил систему и все работало, пока я не установил nvidia,...

0 Ответы

25 Просмотры

Последнее сообщение Anonymous
10 ноя 2024, 22:15
Как использовать несколько графических процессоров в Pytorch?

Последнее сообщение Anonymous « 02 апр 2025, 19:47
Добавлено в форуме Python

Anonymous » 02 апр 2025, 19:47 » в форуме Python

Я использую эту команду для использования графического процессора.device = torch.device( cuda:0 if torch.cuda.is_available() else cpu )

Но я хочу использовать два графических процессора в jupyter , например:
device = torch.device( cuda:0,1 if...

0 Ответы

12 Просмотры

Последнее сообщение Anonymous
02 апр 2025, 19:47
Идентификация графических процессоров AMD

Последнее сообщение Гость « 20 сен 2023, 18:28
Добавлено в форуме C++

Гость » 20 сен 2023, 18:28 » в форуме C++

Мне сложно отличить разные графические процессоры. Это мой код, и, насколько я понимаю, он должен возвращать разные номера шин/устройств/функций, однако я получаю одинаковые номера для всех графических процессоров. Любая помощь будет оценена по...

0 Ответы

51 Просмотры

Последнее сообщение Гость
20 сен 2023, 18:28

Вернуться в «Python»