Ядро Jupyter Lab умирает до запуска Train.train()

Ядро Jupyter Lab умирает до запуска Train.train() ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Ядро Jupyter Lab умирает до запуска Train.train()

Цитата

Сообщение Anonymous » 16 сен 2024, 23:29

Работаю над тонкой настройкой phi-3.5-mini, и при попытке запустить Trainer.train() я получаю следующую ошибку:

Код: Выделить всё

***** Running training *****
Num examples = 647
Num Epochs = 3
Instantaneous batch size per device = 8
Total train batch size (w. parallel, distributed & accumulation) = 32
Gradient Accumulation steps = 4
Total optimization steps = 60
Number of trainable parameters = 25,165,824

`use_cache=True` is incompatible with gradient checkpointing. Setting `use_cache=False`...
/opt/conda/lib/python3.11/site-packages/torch/_dynamo/eval_frame.py:600: UserWarning: torch.utils.checkpoint: the use_reentrant parameter should be passed explicitly. In version 2.4 we will raise an exception if use_reentrant is not passed. use_reentrant=False is recommended, but if you need to preserve the current default behavior, you can pass use_reentrant=True. Refer to docs for more details on the differences between the two variants.
return fn(*args, **kwargs)

You are not running the flash-attention implementation, expect numerical differences.
/opt/conda/lib/python3.11/site-packages/torch/utils/checkpoint.py:295: FutureWarning: `torch.cpu.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cpu', args...)` instead.
with torch.enable_grad(), device_autocast_ctx, torch.cpu.amp.autocast(**ctx.cpu_autocast_kwargs):  # type: ignore[attr-defined]
**Error operation not supported at line 383 in file /src/csrc/pythonInterface.cpp**

в основном эта часть «Ошибка операции не поддерживается в строке 383 в файле /src/csrc/pythonInterface.cpp»
затем ядро умирает, ниже версию пакетов, которую я использую

Код: Выделить всё

transformers                      4.44.2
torch                             2.4.1
torchaudio                        2.4.1
torchvision                       0.19.1
accelerate                        0.34.2
peft                              0.12.0

и версия conda – 24.3.0
при попытке в Google Colab работает тот же код, но в лаборатории Jupyter это не так работаю

Подробнее здесь: https://stackoverflow.com/questions/789 ... iner-train

1726518579

Anonymous

Работаю над тонкой настройкой phi-3.5-mini, и при попытке запустить Trainer.train() я получаю следующую ошибку:
[code]***** Running training *****
Num examples = 647
Num Epochs = 3
Instantaneous batch size per device = 8
Total train batch size (w. parallel, distributed & accumulation) = 32
Gradient Accumulation steps = 4
Total optimization steps = 60
Number of trainable parameters = 25,165,824

`use_cache=True` is incompatible with gradient checkpointing. Setting `use_cache=False`...
/opt/conda/lib/python3.11/site-packages/torch/_dynamo/eval_frame.py:600: UserWarning: torch.utils.checkpoint: the use_reentrant parameter should be passed explicitly. In version 2.4 we will raise an exception if use_reentrant is not passed. use_reentrant=False is recommended, but if you need to preserve the current default behavior, you can pass use_reentrant=True. Refer to docs for more details on the differences between the two variants.
return fn(*args, **kwargs)

You are not running the flash-attention implementation, expect numerical differences.
/opt/conda/lib/python3.11/site-packages/torch/utils/checkpoint.py:295: FutureWarning: `torch.cpu.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cpu', args...)` instead.
with torch.enable_grad(), device_autocast_ctx, torch.cpu.amp.autocast(**ctx.cpu_autocast_kwargs):  # type: ignore[attr-defined]
**Error operation not supported at line 383 in file /src/csrc/pythonInterface.cpp**
[/code]
в основном эта часть «Ошибка операции не поддерживается в строке 383 в файле /src/csrc/pythonInterface.cpp»
затем ядро умирает, ниже версию пакетов, которую я использую
[code]transformers                      4.44.2
torch                             2.4.1
torchaudio                        2.4.1
torchvision                       0.19.1
accelerate                        0.34.2
peft                              0.12.0
[/code]
и версия conda – 24.3.0
при попытке в Google Colab работает тот же код, но в лаборатории Jupyter это не так работаю 

Подробнее здесь: [url]https://stackoverflow.com/questions/78991212/jupyter-lab-kernel-dies-before-starting-the-trainer-train[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Ядро Jupyter Lab умирает до запуска Train.train()

Последнее сообщение Anonymous « 16 сен 2024, 20:38
Добавлено в форуме Python

Anonymous » 16 сен 2024, 20:38 » в форуме Python

Работаю над тонкой настройкой phi-3.5-mini, и при попытке запустить Trainer.train() я получаю следующую ошибку:
***** Running training *****
Num examples = 647
Num Epochs = 3
Instantaneous batch size per device = 8
Total train batch size (w....

0 Ответы

51 Просмотры

Последнее сообщение Anonymous
16 сен 2024, 20:38
Ядро Jupyter Notebook постоянно умирает

Последнее сообщение Anonymous « 23 сен 2024, 22:50
Добавлено в форуме Python

Anonymous » 23 сен 2024, 22:50 » в форуме Python

Я писал код в Jupyter Notebook целый день, но ядро продолжает умирать снова и снова. В основном это произошло из-за библиотеки Openml, когда я выполнил этот код.
credit_data = openml.datasets.get_dataset(31)
X, y, _, _ =credit_data.get_data(target...

0 Ответы

21 Просмотры

Последнее сообщение Anonymous
23 сен 2024, 22:50
Ядро Jupyter Notebook постоянно умирает

Последнее сообщение Anonymous « 24 сен 2024, 04:22
Добавлено в форуме Python

Anonymous » 24 сен 2024, 04:22 » в форуме Python

Я писал код в Jupyter Notebook целый день, но ядро продолжает умирать снова и снова. В основном это произошло из-за библиотеки Openml, когда я выполнял этот код
credit_data = openml.datasets.get_dataset(31)
X, y, _, _ =...

0 Ответы

53 Просмотры

Последнее сообщение Anonymous
24 сен 2024, 04:22
Ядро Jupyter Notebook умирает после попытки загрузить библиотеки

Последнее сообщение Anonymous « 21 янв 2025, 13:34
Добавлено в форуме Python

Anonymous » 21 янв 2025, 13:34 » в форуме Python

У меня Macbook с чипом M2. У меня на ноутбуке свободно более 700 ГБ.
Я хочу загрузить в свой скрипт несколько моделей обнимающихся лиц.
Когда я это делаю (это единственные строки кода ):
from transformers import pipeline

Ядро умирает:
.png

Что...

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
21 янв 2025, 13:34
Seq2Seq train.train() продолжает выдавать ошибку индексации

Последнее сообщение Anonymous « 20 сен 2024, 11:45
Добавлено в форуме Python

Anonymous » 20 сен 2024, 11:45 » в форуме Python

Я пытаюсь выполнить машинный перевод с хинди на санскрит, используя модель NLLB. Но я продолжаю получать сообщение об ошибке:

IndexError: Неверный ключ: 39463 выходит за пределы размера 0.

Ошибка возникает при обучении предварительно обученной...

0 Ответы

47 Просмотры

Последнее сообщение Anonymous
20 сен 2024, 11:45

Вернуться в «Python»