torch.cuda.empty_cache()
gc.collect()
, но не помогло. Когда я пытаюсь выполнить полную перезагрузку в терминале с помощью
nvidia-smi --gpu-reset
, появляется ошибка «Недостаточно разрешений». Следующий код показывает, как я создаю экземпляр своего LLM
Код: Выделить всё
hf_pipeline = pipeline(
task="text-generation",
model = "mistralai/Mistral-7B-Instruct-v0.1",
tokenizer = tokenizer,
trust_remote_code = True,
max_new_tokens=1000,
model_kwargs={
"device_map": "auto",
"load_in_4bit": True,
"max_length": 512,
"temperature": 0.01,
"do_sample": True,
"torch_dtype":torch.bfloat16,
}
)
Подробнее здесь: https://stackoverflow.com/questions/781 ... pplication