Точная настройка модели Gemma, скачанной с сайта ollama.

Точная настройка модели Gemma, скачанной с сайта ollama. ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Точная настройка модели Gemma, скачанной с сайта ollama.

Цитата

Сообщение Anonymous » 27 ноя 2024, 13:29

Я новичок в локальном запуске моделей. Я был очень рад, что смог локально запустить модель gemma2b, которую я вытащил с помощью ollama. Я использую (или загружаю?) эту локальную модель в своем приложении Python, используя ChatOllama, как показано ниже

Код: Выделить всё

llm = ChatOllama(model="gemma2")

Но теперь я подошел к этапу, когда хочу точно настроить эту локально работающую модель. Я вижу, что модель сохранена в ~/.ollama/models/blobs как sha256.
Но из различных сообщений Reddit, чата и обычного просмотра веб-страниц я понял, что не могу точно настроить модель с помощью ollama, но мне нужно как-то точно настроить ее за пределами ollama, а затем импортировать обратно в ollama, чтобы использовать вывод с точно настроенной моделью. правильно ли это понимание?
Если да, то как мне на самом деле вытащить модель из олламы для обучения и вернуть ее обратно? Я понимаю, что GGUF — это модельный формат, который я могу обучить. но как получить GGUF для Gemma2, который хранится локально (в моем случае)
Я планирую использовать LoRA для обучения, так как из некоторых статей понял, что он эффективен и использует меньше ресурсов .

Подробнее здесь: https://stackoverflow.com/questions/792 ... rom-ollama

1732703377

Anonymous

Я новичок в локальном запуске моделей. Я был очень рад, что смог локально запустить модель gemma2b, которую я вытащил с помощью ollama. Я использую (или загружаю?) эту локальную модель в своем приложении Python, используя ChatOllama, как показано ниже
[code]llm = ChatOllama(model="gemma2")
[/code]
Но теперь я подошел к этапу, когда хочу точно настроить эту локально работающую модель. Я вижу, что модель сохранена в ~/.ollama/models/blobs как sha256.
Но из различных сообщений Reddit, чата и обычного просмотра веб-страниц я понял, что не могу точно настроить модель с помощью ollama, но мне нужно как-то точно настроить ее за пределами ollama, а затем импортировать обратно в ollama, чтобы использовать вывод с точно настроенной моделью. правильно ли это понимание?
Если да, то как мне на самом деле вытащить модель из олламы для обучения и вернуть ее обратно? Я понимаю, что GGUF — это модельный формат, который я могу обучить. но как получить GGUF для Gemma2, который хранится локально (в моем случае)
Я планирую использовать LoRA для обучения, так как из некоторых статей понял, что он эффективен и использует меньше ресурсов . 

Подробнее здесь: [url]https://stackoverflow.com/questions/79229490/fine-tuning-gemma-model-that-was-downloaded-from-ollama[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Точная настройка модели Gemma, скачанной с сайта ollama.

Последнее сообщение Anonymous « 27 ноя 2024, 11:43
Добавлено в форуме Python

Anonymous » 27 ноя 2024, 11:43 » в форуме Python

Я новичок в локальном запуске моделей. Я был очень рад, что смог локально запустить модель gemma2b, которую я вытащил с помощью ollama. Я использую (или загружаю?) эту локальную модель в своем приложении Python, используя ChatOllama, как показано...

0 Ответы

24 Просмотры

Последнее сообщение Anonymous
27 ноя 2024, 11:43
Точная настройка модели Gemma, скачанной с сайта ollama.

Последнее сообщение Anonymous « 27 ноя 2024, 18:50
Добавлено в форуме Python

Anonymous » 27 ноя 2024, 18:50 » в форуме Python

Я новичок в локальном запуске моделей. Я был очень рад, что смог локально запустить модель gemma2b, которую я вытащил с помощью ollama. Я использую (или загружаю?) эту локальную модель в своем приложении Python, используя ChatOllama, как показано...

0 Ответы

6 Просмотры

Последнее сообщение Anonymous
27 ноя 2024, 18:50
Точная настройка модели трансформатора не улучшает производительность

Последнее сообщение Anonymous « 10 окт 2024, 12:15
Добавлено в форуме Python

Anonymous » 10 окт 2024, 12:15 » в форуме Python

Я работал над тонкой настройкой модели декодера Transformer в TensorFlow для генерации текста. Хотя первоначальная модель работает нормально, выдавая согласованные выходные данные на основе обучающих данных, проблема возникает в процессе тонкой...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
10 окт 2024, 12:15
Точная настройка сегмента любой модели [закрыто]

Последнее сообщение Anonymous « 17 окт 2024, 11:17
Добавлено в форуме Python

Anonymous » 17 окт 2024, 11:17 » в форуме Python

Я пытался точно настроить модель SAM, но большинство найденных мной учебных пособий требуют от нас предоставления подсказок даже после точной настройки. Нельзя ли точно настроить модель, чтобы она могла работать с этим конкретным набором данных без...

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
17 окт 2024, 11:17
Точная настройка сегмента любой модели [закрыто]

Последнее сообщение Anonymous « 17 окт 2024, 15:58
Добавлено в форуме Python

Anonymous » 17 окт 2024, 15:58 » в форуме Python

Я пытался точно настроить модель SAM в Python, но большинство найденных мной руководств требуют от нас предоставления подсказок даже после точной настройки. Нельзя ли точно настроить модель, чтобы она могла работать с этим конкретным набором данных...

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
17 окт 2024, 15:58

Вернуться в «Python»