Llama-cpp-python не использует nvidia gpu cuda

Llama-cpp-python не использует nvidia gpu cuda ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Llama-cpp-python не использует nvidia gpu cuda

Цитата

Сообщение Anonymous » 02 фев 2025, 12:37

Я играл с oobabooga text-webui на моем Ubuntu 20.04 с моей Nvidia GTX 1060 6 ГБ в течение нескольких недель без проблем. Я использовал модели Llama2-Chat, разделяющие память между моей Ram и Nvidia Vram. Я установил без особых проблем после инструкций в его репозитории. /code> привязки, чтобы поиграть с ним сами. Таким образом, используя ту же среду Miniconda3, которую использует oobabooga text-generation-webui, я запустил ноутбук Юпитера, и я мог сделать выводы, и все работает хорошо , но только для ЦП .
 Рабочий пример Bellow, 
from llama_cpp import Llama

llm = Llama(model_path="/mnt/LxData/llama.cpp/models/meta-llama2/llama-2-7b-chat/ggml-model-q4_0.bin",
n_gpu_layers=32, n_threads=6, n_ctx=3584, n_batch=521, verbose=True),

prompt = """[INST]
Name the planets in the solar system?

[/INST]
"""
output = llm(prompt, max_tokens=350, echo=True)
print(output['choices'][0]['text'].split('[/INST]')[-1])
< /code>

Конечно! Вот восемь планет в нашей солнечной системе, перечисленные по порядку от ближайшего до самого дальнего от солнца: 

Меркурий < /li>
Венера < /li>
Земля < /li>
Марс < /li>
jupiter < /li>
Сатурн < /li>
uranus < /li>
neptune < /li>
< /ol>
< /blockquote>

Обратите внимание, что Плутон ранее считался планетой, но теперь классифицируется как карликовая планета из -за ее небольшого размера и уникальной орбиты. 
< /blockquote>
 Я также хочу сделать вывод с помощью графического процессора. Что не так? ?

Подробнее здесь: https://stackoverflow.com/questions/769 ... a-gpu-cuda

1738489071

Anonymous

 Я играл с oobabooga text-webui на моем Ubuntu 20.04 с моей Nvidia GTX 1060 6 ГБ в течение нескольких недель без проблем. Я использовал модели Llama2-Chat, разделяющие память между моей Ram и Nvidia Vram. Я установил без особых проблем после инструкций в его репозитории. /code> привязки, чтобы поиграть с ним сами. Таким образом, используя ту же среду Miniconda3, которую использует oobabooga text-generation-webui, я запустил ноутбук Юпитера, и я мог сделать выводы, и все работает хорошо , но только для ЦП . 
< P> Рабочий пример Bellow, < /p>
from llama_cpp import Llama

llm = Llama(model_path="/mnt/LxData/llama.cpp/models/meta-llama2/llama-2-7b-chat/ggml-model-q4_0.bin",
n_gpu_layers=32, n_threads=6, n_ctx=3584, n_batch=521, verbose=True),

prompt = """[INST] 
Name the planets in the solar system?

[/INST]
"""
output = llm(prompt, max_tokens=350, echo=True)
print(output['choices'][0]['text'].split('[/INST]')[-1])
< /code>

Конечно! Вот восемь планет в нашей солнечной системе, перечисленные по порядку от ближайшего до самого дальнего от солнца: < /p>

 Меркурий < /li>
 Венера < /li>
 Земля < /li>
 Марс < /li>
 jupiter < /li>
 Сатурн < /li>
 uranus < /li>
 neptune < /li>
< /ol>
< /blockquote>

Обратите внимание, что Плутон ранее считался планетой, но теперь классифицируется как карликовая планета из -за ее небольшого размера и уникальной орбиты. < /p>
< /blockquote>
< P> Я также хочу сделать вывод с помощью графического процессора. Что не так? ?  

Подробнее здесь: [url]https://stackoverflow.com/questions/76963311/llama-cpp-python-not-using-nvidia-gpu-cuda[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Llama-cpp-python не использует NVIDIA GPU CUDA

Последнее сообщение Anonymous « 23 окт 2024, 22:43
Добавлено в форуме Python

Anonymous » 23 окт 2024, 22:43 » в форуме Python

Я несколько недель без проблем играл с oobabooga text-generation-webui на своей Ubuntu 20.04 с NVIDIA GTX 1060 6 ГБ. Я использовал модели llama2-chat, разделяющие память между моей оперативной памятью и NVIDIA VRAM. Я установил без особых проблем,...

0 Ответы

61 Просмотры

Последнее сообщение Anonymous
23 окт 2024, 22:43
Llama-cpp-python не использует NVIDIA GPU CUDA

Последнее сообщение Anonymous « 30 окт 2024, 04:12
Добавлено в форуме Python

Anonymous » 30 окт 2024, 04:12 » в форуме Python

Я несколько недель без проблем играл с oobabooga text-generation-webui на своей Ubuntu 20.04 с NVIDIA GTX 1060 6 ГБ. Я использовал модели llama2-chat, разделяющие память между моей оперативной памятью и NVIDIA VRAM. Я установил без особых проблем,...

0 Ответы

55 Просмотры

Последнее сообщение Anonymous
30 окт 2024, 04:12
Llama-cpp-python не использует nvidia gpu cuda

Последнее сообщение Anonymous « 18 май 2025, 05:38
Добавлено в форуме Python

Anonymous » 18 май 2025, 05:38 » в форуме Python

Я играл с oobabooga text-webui на моем Ubuntu 20.04 с моей Nvidia GTX 1060 6 ГБ в течение нескольких недель без проблем. Я использовал модели Llama2-Chat, разделяющие память между моей Ram и Nvidia Vram. Я установил без особых проблем после...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
18 май 2025, 05:38
Llama-cpp-python не использует nvidia gpu cuda

Последнее сообщение Anonymous « 18 май 2025, 12:46
Добавлено в форуме Python

Anonymous » 18 май 2025, 12:46 » в форуме Python

Я играл с oobabooga text-webui на моем Ubuntu 20.04 с моей Nvidia GTX 1060 6 ГБ в течение нескольких недель без проблем. Я использовал модели Llama2-Chat, разделяющие память между моей Ram и Nvidia Vram. Я установил без особых проблем после...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
18 май 2025, 12:46
Llama-cpp-python не использует nvidia gpu cuda

Последнее сообщение Anonymous « 31 июл 2025, 13:08
Добавлено в форуме Python

Anonymous » 31 июл 2025, 13:08 » в форуме Python

Я играл с oobabooga text-webui на моем Ubuntu 20.04 с моей Nvidia GTX 1060 6 ГБ в течение нескольких недель без проблем. Я использовал модели Llama2-Chat, разделяющие память между моей Ram и Nvidia Vram. Я установил без особых проблем после...

0 Ответы

2 Просмотры

Последнее сообщение Anonymous
31 июл 2025, 13:08

Вернуться в «Python»