Llama-cpp-python не использует NVIDIA GPU CUDA

Llama-cpp-python не использует NVIDIA GPU CUDA ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Llama-cpp-python не использует NVIDIA GPU CUDA

Цитата

Сообщение Anonymous » 23 окт 2024, 22:43

Я несколько недель без проблем играл с oobabooga text-generation-webui на своей Ubuntu 20.04 с NVIDIA GTX 1060 6 ГБ. Я использовал модели llama2-chat, разделяющие память между моей оперативной памятью и NVIDIA VRAM. Я установил без особых проблем, следуя инструкциям в его репозитории.
Итак, теперь я хочу использовать загрузчик модели llama-cpp с его пакетом llama-cpp-python< /code> привязки, чтобы поиграть с ними самому. Итак, используя ту же среду miniconda3, которую использует oobabooga text-generation-webui, я запустил блокнот Jupyter и смог сделать выводы, и все работает хорошо НО ТОЛЬКО для ЦП.
Рабочий пример ниже

Код: Выделить всё

from llama_cpp import Llama

llm = Llama(model_path="/mnt/LxData/llama.cpp/models/meta-llama2/llama-2-7b-chat/ggml-model-q4_0.bin",
n_gpu_layers=32, n_threads=6, n_ctx=3584, n_batch=521, verbose=True),

prompt = """[INST] 
Name the planets in the solar system?

[/INST]
"""
output = llm(prompt, max_tokens=350, echo=True)
print(output['choices'][0]['text'].split('[/INST]')[-1])

Конечно! Вот восемь планет нашей Солнечной системы, перечисленные в порядке от ближайшей к Солнцу:

Меркурий
Венера
Земля
Марс
Юпитер
Сатурн
Уран
Нептун

Обратите внимание, что Плутон ранее считался планетой, но теперь классифицируется как карликовая планета из-за его небольшого размера и уникальной орбиты.

Я также хочу сделать вывод с использованием графического процессора. Что не так?
Почему я не могу выполнить разгрузку на графический процессор, как указано в параметре n_gpu_layers=32, а также, как oobabooga text-generation-webui уже делает это без каких-либо проблем в той же среде miniconda ?

Подробнее здесь: https://stackoverflow.com/questions/769 ... a-gpu-cuda

1729712620

Anonymous

Я несколько недель без проблем играл с oobabooga text-generation-webui на своей Ubuntu 20.04 с NVIDIA GTX 1060 6 ГБ. Я использовал модели llama2-chat, разделяющие память между моей оперативной памятью и NVIDIA VRAM. Я установил без особых проблем, следуя инструкциям в его репозитории.
Итак, теперь я хочу использовать загрузчик модели llama-cpp с его пакетом llama-cpp-python< /code> привязки, чтобы поиграть с ними самому. Итак, используя ту же среду miniconda3, которую использует oobabooga text-generation-webui, я запустил блокнот Jupyter и смог сделать выводы, и все работает хорошо НО ТОЛЬКО для ЦП.
Рабочий пример ниже
[code]from llama_cpp import Llama

llm = Llama(model_path="/mnt/LxData/llama.cpp/models/meta-llama2/llama-2-7b-chat/ggml-model-q4_0.bin",
n_gpu_layers=32, n_threads=6, n_ctx=3584, n_batch=521, verbose=True),

prompt = """[INST] 
Name the planets in the solar system?

[/INST]
"""
output = llm(prompt, max_tokens=350, echo=True)
print(output['choices'][0]['text'].split('[/INST]')[-1])
[/code]

Конечно! Вот восемь планет нашей Солнечной системы, перечисленные в порядке от ближайшей к Солнцу:
[list]
[*]Меркурий
[*]Венера
[*]Земля
[*]Марс
[*]Юпитер
[*]Сатурн
[*]Уран
[*]Нептун
[/list]


Обратите внимание, что Плутон ранее считался планетой, но теперь классифицируется как карликовая планета из-за его небольшого размера и уникальной орбиты.

Я также хочу сделать вывод с использованием графического процессора. Что не так?
Почему я не могу выполнить разгрузку на графический процессор, как указано в параметре n_gpu_layers=32, а также, как oobabooga text-generation-webui уже делает это без каких-либо проблем в той же среде miniconda ? 

Подробнее здесь: [url]https://stackoverflow.com/questions/76963311/llama-cpp-python-not-using-nvidia-gpu-cuda[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Llama-cpp-python не использует NVIDIA GPU CUDA

Последнее сообщение Anonymous « 30 окт 2024, 04:12
Добавлено в форуме Python

Anonymous » 30 окт 2024, 04:12 » в форуме Python

Я несколько недель без проблем играл с oobabooga text-generation-webui на своей Ubuntu 20.04 с NVIDIA GTX 1060 6 ГБ. Я использовал модели llama2-chat, разделяющие память между моей оперативной памятью и NVIDIA VRAM. Я установил без особых проблем,...

0 Ответы

55 Просмотры

Последнее сообщение Anonymous
30 окт 2024, 04:12
Llama-cpp-python не использует nvidia gpu cuda

Последнее сообщение Anonymous « 02 фев 2025, 12:37
Добавлено в форуме Python

Anonymous » 02 фев 2025, 12:37 » в форуме Python

Я играл с oobabooga text-webui на моем Ubuntu 20.04 с моей Nvidia GTX 1060 6 ГБ в течение нескольких недель без проблем. Я использовал модели Llama2-Chat, разделяющие память между моей Ram и Nvidia Vram. Я установил без особых проблем после...

0 Ответы

39 Просмотры

Последнее сообщение Anonymous
02 фев 2025, 12:37
Llama-cpp-python не использует nvidia gpu cuda

Последнее сообщение Anonymous « 18 май 2025, 05:38
Добавлено в форуме Python

Anonymous » 18 май 2025, 05:38 » в форуме Python

Я играл с oobabooga text-webui на моем Ubuntu 20.04 с моей Nvidia GTX 1060 6 ГБ в течение нескольких недель без проблем. Я использовал модели Llama2-Chat, разделяющие память между моей Ram и Nvidia Vram. Я установил без особых проблем после...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
18 май 2025, 05:38
Llama-cpp-python не использует nvidia gpu cuda

Последнее сообщение Anonymous « 18 май 2025, 12:46
Добавлено в форуме Python

Anonymous » 18 май 2025, 12:46 » в форуме Python

Я играл с oobabooga text-webui на моем Ubuntu 20.04 с моей Nvidia GTX 1060 6 ГБ в течение нескольких недель без проблем. Я использовал модели Llama2-Chat, разделяющие память между моей Ram и Nvidia Vram. Я установил без особых проблем после...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
18 май 2025, 12:46
Llama-cpp-python не использует nvidia gpu cuda

Последнее сообщение Anonymous « 31 июл 2025, 13:08
Добавлено в форуме Python

Anonymous » 31 июл 2025, 13:08 » в форуме Python

Я играл с oobabooga text-webui на моем Ubuntu 20.04 с моей Nvidia GTX 1060 6 ГБ в течение нескольких недель без проблем. Я использовал модели Llama2-Chat, разделяющие память между моей Ram и Nvidia Vram. Я установил без особых проблем после...

0 Ответы

2 Просмотры

Последнее сообщение Anonymous
31 июл 2025, 13:08

Вернуться в «Python»