Однако в В разгар тренировочного процесса тренировка внезапно прекращается. Когда я печатаю пакет, в котором он сейчас находится, и эпохи, в конечном итоге он просто случайно останавливается/зависает. Поэтому я нажимаю CTRL+C, чтобы остановить процесс, и получаю эту ошибку.
Код: Выделить всё
The X11 connection broke: No error (code 0)
XIO: fatal IO error 0 (Success) on X server ":0"
after 1040 requests (1040 known processed) with 0 events remaining.
Я не заметил никаких других аномалий графического процессора, кроме этой ошибки. Я проверил «watch nvidia-smi» и оперативную память, и ни одна из них не была перегружена. Похоже, что графический процессор также используется только на 70-75%.
Я установил PyTorch через «conda install pytorch torchvision torchaudio pytorch-cuda=12.4 -c pytorch -c nvidia». Я заметил, что моя версия cuda — 12.6, это проблема? Версия драйвера — 560.35.03.
Я использую Fedora 39.
Подробнее здесь: https://stackoverflow.com/questions/791 ... ke-pytorch
Мобильная версия