Загрузка версии llama3 int8 из llama.cpp

Загрузка версии llama3 int8 из llama.cpp ⇐ Linux

1 сообщение • Страница 1 из 1

Anonymous

Загрузка версии llama3 int8 из llama.cpp

Цитата

Сообщение Anonymous » 27 июн 2024, 12:04

Я пытаюсь загрузить 8-битную квантованную версию llama3 на свой локальный ноутбук (Linux) из llama.cpp, но процесс прерывается из-за превышения памяти.
Есть ли способ обойти это?
Я уже работал с 4-битной версией, и она работает без проблем

Подробнее здесь: https://stackoverflow.com/questions/786 ... -llama-cpp

1719479075

Anonymous

Я пытаюсь загрузить 8-битную квантованную версию llama3 на свой локальный ноутбук (Linux) из llama.cpp, но процесс прерывается из-за превышения памяти.
Есть ли способ обойти это?
Я уже работал с 4-битной версией, и она работает без проблем 

Подробнее здесь: [url]https://stackoverflow.com/questions/78676598/loading-int8-version-of-llama3-from-llama-cpp[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Не удалось загрузить модель ламы по пути: ./Models/llama-7b.ggmlv3.q2_K.bin. Получена ошибка. Llama.__init__() получила

Последнее сообщение Anonymous « 23 сен 2023, 06:26
Добавлено в форуме Python

Anonymous » 23 сен 2023, 06:26 » в форуме Python

из langchain.llms импортировать LlamaCpp из импорта langchain PromptTemplate, LLMChain из langchain.callbacks.manager импортировать CallbackManager из langchain.callbacks.streaming_stdout импортировать StreamingStdOutCallbackHandler шаблон = Вопрос:...

0 Ответы

56 Просмотры

Последнее сообщение Anonymous
23 сен 2023, 06:26
Llama 3: получение неизвестной ошибки CUDA при точной настройке Llama 3 в викитексте

Последнее сообщение Anonymous « 19 янв 2025, 15:40
Добавлено в форуме Python

Anonymous » 19 янв 2025, 15:40 » в форуме Python

Я новичок в больших языковых моделях и API Hugging Face. В качестве практики я пытался настроить модель Llama 3.1 8b на наборе данных викитекста.
Когда я пытаюсь запустить следующий скрипт, я получаю неизвестную ошибку CUDA. CUDA error: unknown...

0 Ответы

18 Просмотры

Последнее сообщение Anonymous
19 янв 2025, 15:40
Llama 3: получение неизвестной ошибки CUDA при точной настройке Llama 3 в викитексте

Последнее сообщение Anonymous « 19 янв 2025, 16:46
Добавлено в форуме Python

Anonymous » 19 янв 2025, 16:46 » в форуме Python

Я новичок в больших языковых моделях и API Hugging Face. В качестве практики я пытался настроить модель Llama 3.1 8b на наборе данных викитекста.
Когда я пытаюсь запустить следующий скрипт, я получаю неизвестную ошибку CUDA. CUDA error: unknown...

0 Ответы

27 Просмотры

Последнее сообщение Anonymous
19 янв 2025, 16:46
CMAKE в файле require.txt: установите llama-cpp-python для Mac.

Последнее сообщение Anonymous « 04 янв 2024, 18:49
Добавлено в форуме Python

Anonymous » 04 янв 2024, 18:49 » в форуме Python

Я поместил свое приложение в Docker и поэтому создал файл require.txt. Теперь мне нужно установить llama-cpp-python для Mac, так как я загружаю свой LLM с помощью langchain.llms import LlamaCpp.

Моя команда установки специально для Mac:...

0 Ответы

20 Просмотры

Последнее сообщение Anonymous
04 янв 2024, 18:49
Ошибка при установке зависимости llama-cpp [дубликат]

Последнее сообщение Гость « 19 мар 2024, 12:39
Добавлено в форуме Python

Гость » 19 мар 2024, 12:39 » в форуме Python

Я пытаюсь запустить этот проект. Однако pip install -r require.txt завершается с ошибкой, указанной ниже
Using cached cffi-1.16.0-cp312-cp312-win_amd64.whl (181 kB)
Using cached pycparser-2.21-py2.py3-none-any.whl (118 kB)
Building wheels for...

0 Ответы

42 Просмотры

Последнее сообщение Гость
19 мар 2024, 12:39

Вернуться в «Linux»