На Tensorboard ничего не вижу - Цифровое Кемерово

На Tensorboard ничего не вижу ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Цитата

Сообщение Anonymous » 29 дек 2024, 01:33

Я только что закончил обучение модели (2000 эпох) с помощью PyTorch Lightning. Я думал, что в PL есть автоматическое ведение журнала тензорной доски, но я не уверен. Вот результат моего тренировочного шага:

Код: Выделить всё

log = {
"total_reward": torch.tensor(self.total_reward).to(device),
"reward": torch.tensor(reward).to(device),
"train_loss": loss,
}
status = {
"steps": torch.tensor(self.global_step).to(device),
"total_reward": torch.tensor(self.total_reward).to(device),
}

return OrderedDict({"loss": loss, "log": log, "progress_bar": status})

Вот структура моей папки Lightning_logs:

Код: Выделить всё

.
├── version_0
│   ├── checkpoints
│   │   └── epoch=2-step=191.ckpt
│   └── hparams.yaml
├── version_1
│   ├── checkpoints
│   │   └── epoch=2-step=191.ckpt
│   └── hparams.yaml
└── version_2
├── checkpoints
│   └── epoch=2-step=191.ckpt
└── hparams.yaml

6 directories, 6 files

И работа тензорной доски:

Код: Выделить всё

tensorboard --logdir=lightning_logs
2022-02-21 19:41:13.915945: W tensorflow/stream_executor/platform/default/dso_loader.cc:64] Could not load dynamic library 'libcudart.so.11.0'; dlerror: libcudart.so.11.0: cannot open shared object file: No such file or directory
2022-02-21 19:41:13.915968: I tensorflow/stream_executor/cuda/cudart_stub.cc:29] Ignore above cudart dlerror if you do not have a GPU set up on your machine.
2022-02-21 19:41:15.602607: W tensorflow/stream_executor/platform/default/dso_loader.cc:64] Could not load dynamic library 'libcuda.so.1'; dlerror: libcuda.so.1: cannot open shared object file: No such file or directory
2022-02-21 19:41:15.602639: W tensorflow/stream_executor/cuda/cuda_driver.cc:269] failed call to cuInit: UNKNOWN ERROR (303)
2022-02-21 19:41:15.602653: I tensorflow/stream_executor/cuda/cuda_diagnostics.cc:156] kernel driver does not appear to be running on this host (scrungus-pc): /proc/driver/nvidia/version does not exist

Но когда я открываю тензорную доску, я получаю:

Код: Выделить всё

No dashboards are active for the current data set.

Что я делаю не так?

Подробнее здесь: https://stackoverflow.com/questions/712 ... ensorboard

1735425202

Anonymous

Я только что закончил обучение модели (2000 эпох) с помощью PyTorch Lightning. Я думал, что в PL есть автоматическое ведение журнала тензорной доски, но я не уверен. Вот результат моего тренировочного шага:
[code]log = {
"total_reward": torch.tensor(self.total_reward).to(device),
"reward": torch.tensor(reward).to(device),
"train_loss": loss,
}
status = {
"steps": torch.tensor(self.global_step).to(device),
"total_reward": torch.tensor(self.total_reward).to(device),
}

return OrderedDict({"loss": loss, "log": log, "progress_bar": status})
[/code]
Вот структура моей папки Lightning_logs:
[code].
├── version_0
│   ├── checkpoints
│   │   └── epoch=2-step=191.ckpt
│   └── hparams.yaml
├── version_1
│   ├── checkpoints
│   │   └── epoch=2-step=191.ckpt
│   └── hparams.yaml
└── version_2
├── checkpoints
│   └── epoch=2-step=191.ckpt
└── hparams.yaml

6 directories, 6 files
[/code]
И работа тензорной доски:
[code]tensorboard --logdir=lightning_logs
2022-02-21 19:41:13.915945: W tensorflow/stream_executor/platform/default/dso_loader.cc:64] Could not load dynamic library 'libcudart.so.11.0'; dlerror: libcudart.so.11.0: cannot open shared object file: No such file or directory
2022-02-21 19:41:13.915968: I tensorflow/stream_executor/cuda/cudart_stub.cc:29] Ignore above cudart dlerror if you do not have a GPU set up on your machine.
2022-02-21 19:41:15.602607: W tensorflow/stream_executor/platform/default/dso_loader.cc:64] Could not load dynamic library 'libcuda.so.1'; dlerror: libcuda.so.1: cannot open shared object file: No such file or directory
2022-02-21 19:41:15.602639: W tensorflow/stream_executor/cuda/cuda_driver.cc:269] failed call to cuInit: UNKNOWN ERROR (303)
2022-02-21 19:41:15.602653: I tensorflow/stream_executor/cuda/cuda_diagnostics.cc:156] kernel driver does not appear to be running on this host (scrungus-pc): /proc/driver/nvidia/version does not exist
[/code]
Но когда я открываю тензорную доску, я получаю:
[code]No dashboards are active for the current data set. [/code]
Что я делаю не так? 

Подробнее здесь: [url]https://stackoverflow.com/questions/71212394/cant-see-anything-on-tensorboard[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Почему я вижу, что все еще вижу предупреждение о недостании импорта?

Последнее сообщение Anonymous « 02 апр 2025, 11:41
Добавлено в форуме Python

Anonymous » 02 апр 2025, 11:41 » в форуме Python

Я все еще сталкиваюсь с ошибкой «отсутствующий импорт», хотя я установил пакет в своей виртуальной среде, активировал ее и проверил его присутствие в списке PIP . Что может вызвать эту проблему? pip install -q huggingface_hub

Это модуль, который...

0 Ответы

24 Просмотры

Последнее сообщение Anonymous
02 апр 2025, 11:41
`return Type - это неполная ошибка для класса, несмотря на то, что я вижу, насколько я вижу. C ++

Последнее сообщение Anonymous « 05 май 2025, 06:12
Добавлено в форуме C++

Anonymous » 05 май 2025, 06:12 » в форуме C++

У меня есть класс uvector4 , как определено ниже, но всякий раз, когда я называю методы в другом классе, который имеет возврат в качестве UVector4 , я получаю ошибку, что UVector4 является неполным типом. #define MPHY_INLINE __inline__...

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
05 май 2025, 06:12
Импорт torch.utils.tensorboard вызывает предупреждения тензорного потока

Последнее сообщение Anonymous « 28 мар 2024, 14:26
Добавлено в форуме Python

Anonymous » 28 мар 2024, 14:26 » в форуме Python

Как указано здесь, тензорная доска является частью тензорного потока, но не зависит от него. Его можно использовать в pytorch, например
from torch.utils.tensorboard import SummaryWriter

Однако раздражает то, что этот импорт вызывает длинный след...

0 Ответы

66 Просмотры

Последнее сообщение Anonymous
28 мар 2024, 14:26
PyTorch TensorBoard SummaryWriter, дающий пустые метрики

Последнее сообщение Anonymous « 16 окт 2024, 09:29
Добавлено в форуме Python

Anonymous » 16 окт 2024, 09:29 » в форуме Python

Я настраивал тензорную доску с помощью PyTorch. Первоначально я использовал Lightning и столкнулся с проблемой, когда я записывал свой гиперпараметр, но метрики на вкладке HPARAMS были пустыми. Итак, чтобы точно определить проблему, я перешел к...

0 Ответы

27 Просмотры

Последнее сообщение Anonymous
16 окт 2024, 09:29
Как сбросить матрицу путаницы с помощью регистратора TensorBoard в pytorch-lightning?

Последнее сообщение Anonymous « 21 окт 2024, 22:39
Добавлено в форуме Python

Anonymous » 21 окт 2024, 22:39 » в форуме Python

В официальном документе только указано
>>> from pytorch_lightning.metrics import ConfusionMatrix
>>> target = torch.tensor( )
>>> preds = torch.tensor( )
>>> confmat = ConfusionMatrix(num_classes=2)
>>> confmat(preds, target)

Это не показывает,...

0 Ответы

22 Просмотры

Последнее сообщение Anonymous
21 окт 2024, 22:39

Вернуться в «Python»