Несоответствие поведения до и после преобразования модели, сгенерированной MLX, в GGUF (доступ через ollama)

Несоответствие поведения до и после преобразования модели, сгенерированной MLX, в GGUF (доступ через ollama) ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Несоответствие поведения до и после преобразования модели, сгенерированной MLX, в GGUF (доступ через ollama)

Цитата

Сообщение Anonymous » 01 авг 2024, 05:56

Редактирование 1:

Позвольте мне задать вопрос более конкретно. Модель, которую мы точно настроили, представляет собой модель генерации кода и выдает выходные данные в виде стиля завершения кода (стиль генерации текста).
Пример ввода: system.out
Пример вывода: system.out. println(xxx)
После преобразования в формат, распознаваемый Ollama, и запуска Ollama стиль изменился на sth, например:
Пример ввода: system.out
Пример вывода: похоже, вы пытаетесь блаблабла и, похоже, также потеряли некоторые знания, связанные с кодом, полученные в результате нашей тонкой настройки.
Исходная версия:

Мы точно настроили модель с помощью MLX и успешно сохранили ее. Подробную информацию можно найти по этой ссылке.
Сгенерированная модель работает. пока все хорошо с такой командой, как mlx_lm.generate --model new_model --prompt "расскажи мне что-нибудь о sql" --temp 0.01 --ignore-chat-template.
Однако после преобразования его в формат gguf и доступа через Ollama результат просто меняется и не соответствует ожиданиям.
Процедура преобразования его в формат gguf выглядит следующим образом:

Код: Выделить всё

python llama.cpp/convert_hf_to_gguf.py path/new_model --outfile path/new_model.gguf

Создайте файл модели с содержимым типа:

Код: Выделить всё

FROM ./new_model.gguf
# sets the temperature to 1 [higher is more creative, lower is more coherent]
PARAMETER temperature 0.01

Используйте Олламу, чтобы создать окончательный артефакт:

Код: Выделить всё

ollama create new_model -f modelfile

Запустите ollama с помощью ollama run new_model и оцените ее.

Подробнее здесь: https://stackoverflow.com/questions/788 ... el-to-gguf

1722480967

Anonymous

[b]Редактирование 1:[/b]

Позвольте мне задать вопрос более конкретно. Модель, которую мы точно настроили, представляет собой модель генерации кода и выдает выходные данные в виде стиля завершения кода (стиль генерации текста).
Пример ввода: system.out
Пример вывода: system.out. println(xxx)
После преобразования в формат, распознаваемый Ollama, и запуска Ollama стиль изменился на sth, например:
Пример ввода: system.out
Пример вывода: похоже, вы пытаетесь блаблабла и, похоже, также потеряли некоторые знания, связанные с кодом, полученные в результате нашей тонкой настройки.
[b] Исходная версия:[/b]

Мы точно настроили модель с помощью MLX и успешно сохранили ее. Подробную информацию можно найти по этой ссылке.
Сгенерированная модель работает. пока все хорошо с такой командой, как mlx_lm.generate --model new_model --prompt "расскажи мне что-нибудь о sql" --temp 0.01 --ignore-chat-template.
Однако после преобразования его в формат gguf и доступа через Ollama результат просто меняется и не соответствует ожиданиям.
Процедура преобразования его в формат gguf выглядит следующим образом:
[code]python llama.cpp/convert_hf_to_gguf.py path/new_model --outfile path/new_model.gguf

[/code]
Создайте файл модели с содержимым типа:
[code]FROM ./new_model.gguf
# sets the temperature to 1 [higher is more creative, lower is more coherent]
PARAMETER temperature 0.01
[/code]
Используйте Олламу, чтобы создать окончательный артефакт:
[code]ollama create new_model -f modelfile
[/code]
Запустите ollama с помощью ollama run new_model и оцените ее. 

Подробнее здесь: [url]https://stackoverflow.com/questions/78817275/the-behavior-missmatch-before-and-after-converting-a-mlx-generated-model-to-gguf[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Ollama.Generate Повышает модель, не найденную ошибку: "hf.co/mradermacher/llama-3.2-3b-instruct-Uncensored-gguf"

Последнее сообщение Anonymous « 04 май 2025, 14:32
Добавлено в форуме Python

Anonymous » 04 май 2025, 14:32 » в форуме Python

Я пытаюсь запустить сценарий Python, который использует библиотеку Ollama для генерации ответов из пользовательской модели LLM. Мой код пытается позвонить в ollama.generate (), используя следующее имя модели:
chosen_model =...

0 Ответы

6 Просмотры

Последнее сообщение Anonymous
04 май 2025, 14:32
Ollama.Generate Повышает модель, не найденную ошибку: "hf.co/mradermacher/llama-3.2-3b-instruct-Uncensored-gguf"

Последнее сообщение Anonymous « 07 май 2025, 06:05
Добавлено в форуме Python

Anonymous » 07 май 2025, 06:05 » в форуме Python

Я пытаюсь запустить сценарий Python, который использует библиотеку Ollama для генерации ответов из пользовательской модели LLM. Мой код пытается позвонить в ollama.generate (), используя следующее имя модели:
chosen_model =...

0 Ответы

8 Просмотры

Последнее сообщение Anonymous
07 май 2025, 06:05
Ollama.Generate Повышает модель, не найденную ошибку: "hf.co/mradermacher/llama-3.2-3b-instruct-Uncensored-gguf"

Последнее сообщение Anonymous « 22 июн 2025, 20:50
Добавлено в форуме Python

Anonymous » 22 июн 2025, 20:50 » в форуме Python

Я пытаюсь запустить сценарий Python, который использует библиотеку Ollama для генерации ответов из пользовательской модели LLM. Мой код пытается позвонить в ollama.generate (), используя следующее имя модели:
chosen_model =...

0 Ответы

7 Просмотры

Последнее сообщение Anonymous
22 июн 2025, 20:50
Есть ли способ полностью загрузить модели GGUF на графический процессор?

Последнее сообщение Anonymous « 16 апр 2024, 10:25
Добавлено в форуме Python

Anonymous » 16 апр 2024, 10:25 » в форуме Python

Я использую LlamaCPP для загрузки своих моделей llm, библиотека llama-index предоставляет методы для выгрузки некоторых слоев на графический процессор. Почему он не предоставляет никаких методов для полной загрузки модели на графический процессор....

0 Ответы

51 Просмотры

Последнее сообщение Anonymous
16 апр 2024, 10:25
Использование Haystack и Ollama. ModuleNotFoundError: нет модуля с именем «ollama».

Последнее сообщение Anonymous « 01 окт 2024, 17:35
Добавлено в форуме Python

Anonymous » 01 окт 2024, 17:35 » в форуме Python

Здесь я использую пример с веб-сайта haystack
Я использовал поэзию, чтобы добавить ollama-haystack
Я запускаю следующее код с использованием Python 3.12.3 в WSL2 Ubuntu 24.04
from haystack_integrations.components.embedders.ollama import...

0 Ответы

33 Просмотры

Последнее сообщение Anonymous
01 окт 2024, 17:35

Вернуться в «Python»