Я получаю сообщение об ошибке при загрузке тензорной панели в Google ColabPython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Я получаю сообщение об ошибке при загрузке тензорной панели в Google Colab

Сообщение Anonymous »

Я пытаюсь научиться отслеживать тензорные доски и использую его впервые. Однако даже после использования всего правильного кода он по-прежнему не открывается.
Вот сообщение об ошибке:
Расширение тензорной доски уже загружено. Чтобы перезагрузить его, используйте:
%reload_ext tensorboard
ОШИБКА: Не удалось запустить TensorBoard (выход с кодом 2).
Содержимое stderr:
2024-05-04 05:30: 38.549269: E external/local_xla/xla/stream_executor/cuda/cuda_dnn.cc:9261] Невозможно зарегистрировать фабрику cuDNN: попытка зарегистрировать фабрику для плагина cuDNN, когда она уже зарегистрирована
2024-05-04 05:30 :38.549336: E external/local_xla/xla/stream_executor/cuda/cuda_fft.cc:607] Невозможно зарегистрировать фабрику cuFFT: попытка зарегистрировать фабрику для плагина cuFFT, когда она уже зарегистрирована
2024-05-04 05: 30:38.550587: E external/local_xla/xla/stream_executor/cuda/cuda_blas.cc:1515] Невозможно зарегистрировать фабрику cuBLAS: попытка зарегистрировать фабрику для плагина cuBLAS, когда она уже зарегистрирована
2024-05-04 05 :30:39.592717: W tensorflow/compiler/tf2tensorrt/utils/py_utils.cc:38] TF-TRT Предупреждение: не удалось найти TensorRT
использование: tensorboard [-h] [--helpfull] [--logdir PATH ] [--logdir_spec PATH_SPEC] [--host ADDR]
[--bind_all] [--port PORT] [--reuse_port BOOL] [--load_fast {false,auto,true}]
[--extra_data_server_flags EXTRA_DATA_SERVER_FLAGS]
[--grpc_creds_type {local,ssl,ssl_dev}] [--grpc_data_provider PORT]
[--purge_orphaned_data BOOL] [--db URI] [--db_import] [ --inspect]
[--version_tb] [--tag TAG] [--event_file ПУТЬ] [--path_prefix ПУТЬ]
[--window_title ТЕКСТ] [--max_reload_threads COUNT] [-- reload_interval SECONDS]
[--reload_task TYPE] [--reload_multifile BOOL]
[--reload_multifile_inactive_secs SECONDS] [--generic_data TYPE]
[--samples_per_plugin SAMPLES_PER_PLUGIN] [--detect_file_replacement BOOL ]
{serve,dev} ...
тензорная доска: ошибка: аргумент {serve,dev}: неверный выбор: «/content/runs» (выберите «serve», «dev»)
Вот мой код:

Код: Выделить всё

from typing import Dict, List
from tqdm.auto import tqdm

from going_modular.going_modular.engine import train_step, test_step

# Import train() function from:
# https://github.com/mrdbourke/pytorch-deep-learning/blob/main/going_modular/going_modular/engine.py
def train(model: torch.nn.Module,
train_dataloader: torch.utils.data.DataLoader,
test_dataloader: torch.utils.data.DataLoader,
optimizer: torch.optim.Optimizer,
loss_fn: torch.nn.Module,
epochs: int,
device: torch.device) -> Dict[str, List]:
"""Trains and tests a PyTorch model.

Passes a target PyTorch models through train_step() and test_step()
functions for a number of epochs, training and testing the model
in the same epoch loop.

Calculates, prints and stores evaluation metrics throughout.

Args:
model: A PyTorch model to be trained and tested.
train_dataloader: A DataLoader instance for the model to be trained on.
test_dataloader: A DataLoader instance for the model to be tested on.
optimizer: A PyTorch optimizer to help minimize the loss function.
loss_fn: A PyTorch loss function to calculate loss on both datasets.
epochs: An integer indicating how many epochs to train for.
device: A target device to compute on (e.g. "cuda" or "cpu").

Returns:
A dictionary of training and testing loss as well as training and
testing accuracy metrics.  Each metric has a value in a list for
each epoch.
In the form: {train_loss: [...],
train_acc: [...],
test_loss: [...],
test_acc: [...]}
For example if training for epochs=2:
{train_loss: [2.0616, 1.0537],
train_acc: [0.3945, 0.3945],
test_loss: [1.2641, 1.5706],
test_acc: [0.3400, 0.2973]}
"""
# Create empty results dictionary
results = {"train_loss": [],
"train_acc": [],
"test_loss": [],
"test_acc": []
}

# Loop through training and testing steps for a number of epochs
for epoch in tqdm(range(epochs)):
train_loss, train_acc = train_step(model=model,
dataloader=train_dataloader,
loss_fn=loss_fn,
optimizer=optimizer,
device=device)
test_loss, test_acc = test_step(model=model,
dataloader=test_dataloader,
loss_fn=loss_fn,
device=device)

# Print out what's happening
print(
f"Epoch: {epoch+1} | "
f"train_loss: {train_loss:.4f} | "
f"train_acc: {train_acc:.4f} | "
f"test_loss: {test_loss:.4f} | "
f"test_acc: {test_acc:.4f}"
)

# Update results dictionary
results["train_loss"].append(train_loss)
results["train_acc"].append(train_acc)
results["test_loss"].append(test_loss)
results["test_acc"].append(test_acc)

### New: Experiment tracking ###
# Add loss results to SummaryWriter
writer.add_scalars(main_tag = 'Loss',
tag_scalar_dict={"train_loss": train_loss,
"test_loss": test_loss},
global_step = epoch)
writer.add_scalars(main_tag = 'Accuracy',
tag_scalar_dict = {'train_acc': train_acc,
'test_acc': test_acc},
global_step = epoch
)
writer.close()
return results

set_seeds()
results = train(model,
train_dataloader,
test_dataloader,
optimizer,
loss_function,
epochs = 5, device = device)

%load_ext tensorboard
%tensorboard --logsdir /content/runs
Я попробовал переустановить тензорную панель, но, похоже, это не помогло

Подробнее здесь: https://stackoverflow.com/questions/784 ... ogle-colab
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»