Как загрузить 4-битную квантованную модель VLM из «Обнимающего лица с трансформаторами»? - Цифровое Кемерово

Как загрузить 4-битную квантованную модель VLM из «Обнимающего лица с трансформаторами»? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Как загрузить 4-битную квантованную модель VLM из «Обнимающего лица с трансформаторами»?

Цитата

Сообщение Anonymous » 28 окт 2024, 12:45

Я новичок в квантовании и работе с моделями визуального языка (VLM). Я пытаюсь загрузить 4-битную квантованную версию модели Ovis1.6-Gemma из Hugging Face, используя библиотеку преобразователей. Я скачал модель по этой ссылке: https://huggingface.co/ThetaCursed/Ovis ... B-bnb-4bit.
Вот код, который я использую для загрузки модель:

Код: Выделить всё

from transformers import AutoModelForCausalLM, BitsAndBytesConfig

# Define the quantization configuration
kwargs = {
"quantization_config": BitsAndBytesConfig(
load_in_4bit=True,
load_in_8bit=False,
bnb_4bit_compute_dtype="float32",
bnb_4bit_quant_storage="uint8",
bnb_4bit_quant_type="fp4",
bnb_4bit_use_double_quant=False,
llm_int8_enable_fp32_cpu_offload=False,
llm_int8_has_fp16_weight=False,
llm_int8_skip_modules=None,
llm_int8_threshold=6.0
)
}

model = AutoModelForCausalLM.from_pretrained(
"ThetaCursed/Ovis1.6-Gemma2-9B-bnb-4bit",
trust_remote_code=True,
**kwargs
).cuda()

Однако я сталкиваюсь со следующими предупреждениями:

Код: Выделить всё

warnings.warn(_BETA_TRANSFORMS_WARNING)
Unused kwargs: ['_load_in_4bit', '_load_in_8bit', 'quant_method'].
Loading checkpoint shards: 100%|██████████| 2/2 [00:06

Подробнее здесь: [url]https://stackoverflow.com/questions/79130264/how-to-load-a-4-bit-quantized-vlm-model-from-hugging-face-with-transformers[/url]

Реклама

1730108724

Anonymous

Я новичок в квантовании и работе с моделями визуального языка (VLM). Я пытаюсь загрузить 4-битную квантованную версию модели Ovis1.6-Gemma из Hugging Face, используя библиотеку преобразователей. Я скачал модель по этой ссылке: https://huggingface.co/ThetaCursed/Ovis1.6-Gemma2-9B-bnb-4bit.
Вот код, который я использую для загрузки модель:
[code]from transformers import AutoModelForCausalLM, BitsAndBytesConfig

# Define the quantization configuration
kwargs = {
"quantization_config": BitsAndBytesConfig(
load_in_4bit=True,
load_in_8bit=False,
bnb_4bit_compute_dtype="float32",
bnb_4bit_quant_storage="uint8",
bnb_4bit_quant_type="fp4",
bnb_4bit_use_double_quant=False,
llm_int8_enable_fp32_cpu_offload=False,
llm_int8_has_fp16_weight=False,
llm_int8_skip_modules=None,
llm_int8_threshold=6.0
)
}

model = AutoModelForCausalLM.from_pretrained(
"ThetaCursed/Ovis1.6-Gemma2-9B-bnb-4bit",
trust_remote_code=True,
**kwargs
).cuda()
[/code]
Однако я сталкиваюсь со следующими предупреждениями:
[code]warnings.warn(_BETA_TRANSFORMS_WARNING)
Unused kwargs: ['_load_in_4bit', '_load_in_8bit', 'quant_method'].
Loading checkpoint shards: 100%|██████████| 2/2 [00:06

Подробнее здесь: [url]https://stackoverflow.com/questions/79130264/how-to-load-a-4-bit-quantized-vlm-model-from-hugging-face-with-transformers[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как загрузить 4-битную квантованную модель VLM от обнимающего лица с трансформаторами?

Последнее сообщение Anonymous « 10 мар 2025, 16:43
Добавлено в форуме Python

Anonymous » 10 мар 2025, 16:43 » в форуме Python

Я новичок в квантовании и работаю с моделями визуального языка (VLM). Я пытаюсь загрузить 4-битную квантовую версию модели OVIS1.6-Gemma, обнимающую лицо с использованием библиотеки трансформаторов. Я скачал модель по этой ссылке: transformers...

0 Ответы

3 Просмотры

Последнее сообщение Anonymous
10 мар 2025, 16:43
Невозможно загрузить и сохранить модель обнимающего лица - jinaai/jina-reranker-v2-base-multilingual.

Последнее сообщение Anonymous « 17 окт 2024, 12:14
Добавлено в форуме Python

Anonymous » 17 окт 2024, 12:14 » в форуме Python

Я пытаюсь загрузить и сохранить следующую модель с сайта HuggingFace для дальнейшего использования. Вот фрагмент.
from transformers import AutoModelForSequenceClassification,
AutoTokenizer,AutoModelForCausalLM...

0 Ответы

18 Просмотры

Последнее сообщение Anonymous
17 окт 2024, 12:14
Невозможно загрузить и сохранить модель обнимающего лица - jinaai/jina-reranker-v2-base-multilingual.

Последнее сообщение Anonymous « 20 окт 2024, 22:35
Добавлено в форуме Python

Anonymous » 20 окт 2024, 22:35 » в форуме Python

Я пытаюсь загрузить и сохранить следующую модель с сайта HuggingFace для дальнейшего использования. Вот фрагмент.
from transformers import AutoModelForSequenceClassification,
AutoTokenizer,AutoModelForCausalLM...

0 Ответы

24 Просмотры

Последнее сообщение Anonymous
20 окт 2024, 22:35
Как создать проксированную DLL для wintrust.dll с помощью g++ и обеспечить 32-битную/64-битную совместимость?

Последнее сообщение Anonymous « 22 окт 2024, 07:48
Добавлено в форуме C++

Anonymous » 22 окт 2024, 07:48 » в форуме C++

Я пытаюсь создать прокси-библиотеку DLL для wintrust.dll, используя g++ из набора инструментов ucrt64. Моя цель состоит в том, чтобы DLL имитировала исходный файл wintrust.dll, за исключением того, что функция WinVerifyTrust всегда будет возвращать...

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
22 окт 2024, 07:48
Как загрузить набор данных обнимающего лица по локальному пути?

Последнее сообщение Anonymous « 03 июл 2024, 09:53
Добавлено в форуме Python

Anonymous » 03 июл 2024, 09:53 » в форуме Python

Возьмем простой пример на этом веб-сайте
если я хочу загрузить этот набор данных онлайн, я просто использовать,
from datasets import load_dataset
dataset = load_dataset( Dahoas/rm-static )

Что делать, если я хочу загрузить набор данных по...

0 Ответы

24 Просмотры

Последнее сообщение Anonymous
03 июл 2024, 09:53

Вернуться в «Python»

Programmiererforum