Ошибка CUDA из-за нехватки памяти в приложении Python Mistral

Ошибка CUDA из-за нехватки памяти в приложении Python Mistral ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Ошибка CUDA из-за нехватки памяти в приложении Python Mistral

Цитата

Сообщение Anonymous » 18 мар 2024, 06:41

У меня есть приложение вопросов и ответов Mistral и ChromaDB, размещенное в экземпляре AWS EC2 g5.2xlarge. Раньше я закрывал приложение Python, не удаляя переменную llm, чтобы освободить память CUDA. Даже когда я перезагружаю свой экземпляр EC2, я сталкиваюсь с этой проблемой. Я пробовал
torch.cuda.empty_cache()
gc.collect()
, но не помогло. Когда я пытаюсь выполнить полную перезагрузку в терминале с помощью
nvidia-smi --gpu-reset
, появляется ошибка «Недостаточно разрешений». Следующий код показывает, как я создаю экземпляр своего LLM

Код: Выделить всё

            hf_pipeline = pipeline(
task="text-generation",
model = "mistralai/Mistral-7B-Instruct-v0.1",
tokenizer = tokenizer,
trust_remote_code = True,
max_new_tokens=1000,
model_kwargs={
"device_map": "auto",
"load_in_4bit": True,
"max_length": 512,
"temperature": 0.01,
"do_sample": True,
"torch_dtype":torch.bfloat16,
}
)

Каково решение проблемы нехватки памяти CUDA?

Подробнее здесь: https://stackoverflow.com/questions/781 ... pplication

1710733300

Anonymous

У меня есть приложение вопросов и ответов Mistral и ChromaDB, размещенное в экземпляре AWS EC2 g5.2xlarge. Раньше я закрывал приложение Python, не удаляя переменную llm, чтобы освободить память CUDA. Даже когда я перезагружаю свой экземпляр EC2, я сталкиваюсь с этой проблемой. Я пробовал
torch.cuda.empty_cache()
gc.collect()
, но не помогло. Когда я пытаюсь выполнить полную перезагрузку в терминале с помощью
nvidia-smi --gpu-reset
, появляется ошибка «Недостаточно разрешений». Следующий код показывает, как я создаю экземпляр своего LLM
[code]            hf_pipeline = pipeline(
task="text-generation",
model = "mistralai/Mistral-7B-Instruct-v0.1",
tokenizer = tokenizer,
trust_remote_code = True,
max_new_tokens=1000,
model_kwargs={
"device_map": "auto",
"load_in_4bit": True,
"max_length": 512,
"temperature": 0.01,
"do_sample": True,
"torch_dtype":torch.bfloat16,
}
)
[/code]
Каково решение проблемы нехватки памяти CUDA? 

Подробнее здесь: [url]https://stackoverflow.com/questions/78172079/cuda-ran-out-of-memory-error-in-python-mistral-application[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как избежать «CUDA нехватки памяти» в PyTorch

Последнее сообщение Anonymous « 29 фев 2024, 19:50
Добавлено в форуме Python

Anonymous » 29 фев 2024, 19:50 » в форуме Python

Я думаю, это довольно распространенное сообщение для пользователей PyTorch с нехваткой памяти графического процессора:

RuntimeError: CUDA не хватает памяти. Попытка выделить X MiB (GPU X; общая емкость X GiB; X GiB уже выделено; X MiB свободно; X...

0 Ответы

53 Просмотры

Последнее сообщение Anonymous
29 фев 2024, 19:50
Cuda странным образом выбрасывает ошибку нехватки памяти

Последнее сообщение Anonymous « 03 окт 2024, 22:05
Добавлено в форуме Python

Anonymous » 03 окт 2024, 22:05 » в форуме Python

Я пытаюсь запустить модель 770M на RTX 4070 (8G) с 64 ГБ оперативной памяти, и у меня возникает такая ошибка:
OutOfMemoryError: CUDA out of memory. Tried to allocate 146.00 MiB. GPU 0 has a total capacity of 8.00 GiB of which 0 bytes is free. Of...

0 Ответы

43 Просмотры

Последнее сообщение Anonymous
03 окт 2024, 22:05
RuntimeError: ошибка времени выполнения cuda (35): версия драйвера CUDA недостаточна для версии среды выполнения CUDA в

Последнее сообщение Anonymous « 03 ноя 2024, 19:04
Добавлено в форуме Python

Anonymous » 03 ноя 2024, 19:04 » в форуме Python

Когда я пытаюсь загрузить контрольную точку pytorch:

checkpoint = torch.load(pathname)

Я вижу:

RuntimeError: ошибка выполнения cuda (35): CUDA версия драйвера недостаточна для версии среды выполнения CUDA по адресу...

0 Ответы

79 Просмотры

Последнее сообщение Anonymous
03 ноя 2024, 19:04
Понимание распределения памяти JVM и нехватки памяти в Java: пространство кучи

Последнее сообщение Anonymous « 08 янв 2025, 02:47
Добавлено в форуме JAVA

Anonymous » 08 янв 2025, 02:47 » в форуме JAVA

Я пытаюсь понять, как работает распределение памяти в JVM.
Я пишу приложение, в котором получаю исключения «Недостаточно памяти: пространство кучи».

Я понимаю, что могу передать аргументы виртуальной машины, такие как Xms и Xmx, для увеличения...

0 Ответы

26 Просмотры

Последнее сообщение Anonymous
08 янв 2025, 02:47
CUDA ON DEBIAN TRIXIE: версия драйвера CUDA недостаточно для версии времени выполнения CUDA

Последнее сообщение Anonymous « 20 авг 2025, 18:06
Добавлено в форуме Linux

Anonymous » 20 авг 2025, 18:06 » в форуме Linux

У меня есть nvidia-driver-580 и cuda-tools-13 , установленные на Debian Trixie (оба являются самой новой версией, которую я мог найти): $ a p t l i s t - - i n s t a l l e d | a g n v i d i a f i r m w a r e - n v i d i a - g s p / u n k n o w n , n...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
20 авг 2025, 18:06

Вернуться в «Python»