Я получаю сообщение об ошибке при загрузке тензорной панели в Google Colab

Я получаю сообщение об ошибке при загрузке тензорной панели в Google Colab ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Я получаю сообщение об ошибке при загрузке тензорной панели в Google Colab

Цитата

Сообщение Anonymous » 04 май 2024, 08:36

Я пытаюсь научиться отслеживать тензорные доски и использую его впервые. Однако даже после использования всего правильного кода он по-прежнему не открывается.
Вот сообщение об ошибке:
Расширение тензорной доски уже загружено. Чтобы перезагрузить его, используйте:
%reload_ext tensorboard
ОШИБКА: Не удалось запустить TensorBoard (выход с кодом 2).
Содержимое stderr:
2024-05-04 05:30: 38.549269: E external/local_xla/xla/stream_executor/cuda/cuda_dnn.cc:9261] Невозможно зарегистрировать фабрику cuDNN: попытка зарегистрировать фабрику для плагина cuDNN, когда она уже зарегистрирована
2024-05-04 05:30 :38.549336: E external/local_xla/xla/stream_executor/cuda/cuda_fft.cc:607] Невозможно зарегистрировать фабрику cuFFT: попытка зарегистрировать фабрику для плагина cuFFT, когда она уже зарегистрирована
2024-05-04 05: 30:38.550587: E external/local_xla/xla/stream_executor/cuda/cuda_blas.cc:1515] Невозможно зарегистрировать фабрику cuBLAS: попытка зарегистрировать фабрику для плагина cuBLAS, когда она уже зарегистрирована
2024-05-04 05 :30:39.592717: W tensorflow/compiler/tf2tensorrt/utils/py_utils.cc:38] TF-TRT Предупреждение: не удалось найти TensorRT
использование: tensorboard [-h] [--helpfull] [--logdir PATH ] [--logdir_spec PATH_SPEC] [--host ADDR]
[--bind_all] [--port PORT] [--reuse_port BOOL] [--load_fast {false,auto,true}]
[--extra_data_server_flags EXTRA_DATA_SERVER_FLAGS]
[--grpc_creds_type {local,ssl,ssl_dev}] [--grpc_data_provider PORT]
[--purge_orphaned_data BOOL] [--db URI] [--db_import] [ --inspect]
[--version_tb] [--tag TAG] [--event_file ПУТЬ] [--path_prefix ПУТЬ]
[--window_title ТЕКСТ] [--max_reload_threads COUNT] [-- reload_interval SECONDS]
[--reload_task TYPE] [--reload_multifile BOOL]
[--reload_multifile_inactive_secs SECONDS] [--generic_data TYPE]
[--samples_per_plugin SAMPLES_PER_PLUGIN] [--detect_file_replacement BOOL ]
{serve,dev} ...
тензорная доска: ошибка: аргумент {serve,dev}: неверный выбор: «/content/runs» (выберите «serve», «dev»)
Вот мой код:

Код: Выделить всё

from typing import Dict, List
from tqdm.auto import tqdm

from going_modular.going_modular.engine import train_step, test_step

# Import train() function from:
# https://github.com/mrdbourke/pytorch-deep-learning/blob/main/going_modular/going_modular/engine.py
def train(model: torch.nn.Module,
train_dataloader: torch.utils.data.DataLoader,
test_dataloader: torch.utils.data.DataLoader,
optimizer: torch.optim.Optimizer,
loss_fn: torch.nn.Module,
epochs: int,
device: torch.device) -> Dict[str, List]:
"""Trains and tests a PyTorch model.

Passes a target PyTorch models through train_step() and test_step()
functions for a number of epochs, training and testing the model
in the same epoch loop.

Calculates, prints and stores evaluation metrics throughout.

Args:
model: A PyTorch model to be trained and tested.
train_dataloader: A DataLoader instance for the model to be trained on.
test_dataloader: A DataLoader instance for the model to be tested on.
optimizer: A PyTorch optimizer to help minimize the loss function.
loss_fn: A PyTorch loss function to calculate loss on both datasets.
epochs: An integer indicating how many epochs to train for.
device: A target device to compute on (e.g. "cuda" or "cpu").

Returns:
A dictionary of training and testing loss as well as training and
testing accuracy metrics.  Each metric has a value in a list for
each epoch.
In the form: {train_loss: [...],
train_acc: [...],
test_loss: [...],
test_acc: [...]}
For example if training for epochs=2:
{train_loss: [2.0616, 1.0537],
train_acc: [0.3945, 0.3945],
test_loss: [1.2641, 1.5706],
test_acc: [0.3400, 0.2973]}
"""
# Create empty results dictionary
results = {"train_loss": [],
"train_acc": [],
"test_loss": [],
"test_acc": []
}

# Loop through training and testing steps for a number of epochs
for epoch in tqdm(range(epochs)):
train_loss, train_acc = train_step(model=model,
dataloader=train_dataloader,
loss_fn=loss_fn,
optimizer=optimizer,
device=device)
test_loss, test_acc = test_step(model=model,
dataloader=test_dataloader,
loss_fn=loss_fn,
device=device)

# Print out what's happening
print(
f"Epoch: {epoch+1} | "
f"train_loss: {train_loss:.4f} | "
f"train_acc: {train_acc:.4f} | "
f"test_loss: {test_loss:.4f} | "
f"test_acc: {test_acc:.4f}"
)

# Update results dictionary
results["train_loss"].append(train_loss)
results["train_acc"].append(train_acc)
results["test_loss"].append(test_loss)
results["test_acc"].append(test_acc)

### New: Experiment tracking ###
# Add loss results to SummaryWriter
writer.add_scalars(main_tag = 'Loss',
tag_scalar_dict={"train_loss": train_loss,
"test_loss": test_loss},
global_step = epoch)
writer.add_scalars(main_tag = 'Accuracy',
tag_scalar_dict = {'train_acc': train_acc,
'test_acc': test_acc},
global_step = epoch
)
writer.close()
return results

set_seeds()
results = train(model,
train_dataloader,
test_dataloader,
optimizer,
loss_function,
epochs = 5, device = device)

%load_ext tensorboard
%tensorboard --logsdir /content/runs

Я попробовал переустановить тензорную панель, но, похоже, это не помогло

Подробнее здесь: https://stackoverflow.com/questions/784 ... ogle-colab

1714800961

Anonymous

Я пытаюсь научиться отслеживать тензорные доски и использую его впервые. Однако даже после использования всего правильного кода он по-прежнему не открывается.
Вот сообщение об ошибке:
Расширение тензорной доски уже загружено. Чтобы перезагрузить его, используйте:
%reload_ext tensorboard
ОШИБКА: Не удалось запустить TensorBoard (выход с кодом 2).
Содержимое stderr:
2024-05-04 05:30: 38.549269: E external/local_xla/xla/stream_executor/cuda/cuda_dnn.cc:9261] Невозможно зарегистрировать фабрику cuDNN: попытка зарегистрировать фабрику для плагина cuDNN, когда она уже зарегистрирована
2024-05-04 05:30 :38.549336: E external/local_xla/xla/stream_executor/cuda/cuda_fft.cc:607] Невозможно зарегистрировать фабрику cuFFT: попытка зарегистрировать фабрику для плагина cuFFT, когда она уже зарегистрирована
2024-05-04 05: 30:38.550587: E external/local_xla/xla/stream_executor/cuda/cuda_blas.cc:1515] Невозможно зарегистрировать фабрику cuBLAS: попытка зарегистрировать фабрику для плагина cuBLAS, когда она уже зарегистрирована
2024-05-04 05 :30:39.592717: W tensorflow/compiler/tf2tensorrt/utils/py_utils.cc:38] TF-TRT Предупреждение: не удалось найти TensorRT
использование: tensorboard [-h] [--helpfull] [--logdir PATH ] [--logdir_spec PATH_SPEC] [--host ADDR]
[--bind_all] [--port PORT] [--reuse_port BOOL] [--load_fast {false,auto,true}]
[--extra_data_server_flags EXTRA_DATA_SERVER_FLAGS]
[--grpc_creds_type {local,ssl,ssl_dev}] [--grpc_data_provider PORT]
[--purge_orphaned_data BOOL] [--db URI] [--db_import] [ --inspect]
[--version_tb] [--tag TAG] [--event_file ПУТЬ] [--path_prefix ПУТЬ]
[--window_title ТЕКСТ] [--max_reload_threads COUNT] [-- reload_interval SECONDS]
[--reload_task TYPE] [--reload_multifile BOOL]
[--reload_multifile_inactive_secs SECONDS] [--generic_data TYPE]
[--samples_per_plugin SAMPLES_PER_PLUGIN] [--detect_file_replacement BOOL ]
{serve,dev} ...
тензорная доска: ошибка: аргумент {serve,dev}: неверный выбор: «/content/runs» (выберите «serve», «dev»)
Вот мой код:
[code]from typing import Dict, List
from tqdm.auto import tqdm

from going_modular.going_modular.engine import train_step, test_step

# Import train() function from:
# https://github.com/mrdbourke/pytorch-deep-learning/blob/main/going_modular/going_modular/engine.py
def train(model: torch.nn.Module,
train_dataloader: torch.utils.data.DataLoader,
test_dataloader: torch.utils.data.DataLoader,
optimizer: torch.optim.Optimizer,
loss_fn: torch.nn.Module,
epochs: int,
device: torch.device) -> Dict[str, List]:
"""Trains and tests a PyTorch model.

Passes a target PyTorch models through train_step() and test_step()
functions for a number of epochs, training and testing the model
in the same epoch loop.

Calculates, prints and stores evaluation metrics throughout.

Args:
model: A PyTorch model to be trained and tested.
train_dataloader: A DataLoader instance for the model to be trained on.
test_dataloader: A DataLoader instance for the model to be tested on.
optimizer: A PyTorch optimizer to help minimize the loss function.
loss_fn: A PyTorch loss function to calculate loss on both datasets.
epochs: An integer indicating how many epochs to train for.
device: A target device to compute on (e.g. "cuda" or "cpu").

Returns:
A dictionary of training and testing loss as well as training and
testing accuracy metrics.  Each metric has a value in a list for
each epoch.
In the form: {train_loss: [...],
train_acc: [...],
test_loss: [...],
test_acc: [...]}
For example if training for epochs=2:
{train_loss: [2.0616, 1.0537],
train_acc: [0.3945, 0.3945],
test_loss: [1.2641, 1.5706],
test_acc: [0.3400, 0.2973]}
"""
# Create empty results dictionary
results = {"train_loss": [],
"train_acc": [],
"test_loss": [],
"test_acc": []
}

# Loop through training and testing steps for a number of epochs
for epoch in tqdm(range(epochs)):
train_loss, train_acc = train_step(model=model,
dataloader=train_dataloader,
loss_fn=loss_fn,
optimizer=optimizer,
device=device)
test_loss, test_acc = test_step(model=model,
dataloader=test_dataloader,
loss_fn=loss_fn,
device=device)

# Print out what's happening
print(
f"Epoch: {epoch+1} | "
f"train_loss: {train_loss:.4f} | "
f"train_acc: {train_acc:.4f} | "
f"test_loss: {test_loss:.4f} | "
f"test_acc: {test_acc:.4f}"
)

# Update results dictionary
results["train_loss"].append(train_loss)
results["train_acc"].append(train_acc)
results["test_loss"].append(test_loss)
results["test_acc"].append(test_acc)

### New: Experiment tracking ###
# Add loss results to SummaryWriter
writer.add_scalars(main_tag = 'Loss',
tag_scalar_dict={"train_loss": train_loss,
"test_loss": test_loss},
global_step = epoch)
writer.add_scalars(main_tag = 'Accuracy',
tag_scalar_dict = {'train_acc': train_acc,
'test_acc': test_acc},
global_step = epoch
)
writer.close()
return results

set_seeds()
results = train(model,
train_dataloader,
test_dataloader,
optimizer,
loss_function,
epochs = 5, device = device)

%load_ext tensorboard
%tensorboard --logsdir /content/runs
[/code]
Я попробовал переустановить тензорную панель, но, похоже, это не помогло 

Подробнее здесь: [url]https://stackoverflow.com/questions/78427888/i-am-getting-error-while-loading-tensorboard-in-google-colab[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Использование Google Colab с/Google Cloud с/python для создания изображений, и я получаю сообщение об ошибке, когда пыта

Последнее сообщение Anonymous « 26 май 2024, 01:39
Добавлено в форуме Python

Anonymous » 26 май 2024, 01:39 » в форуме Python

Я учусь использовать искусственный интеллект и использую Colab, Python и Google Cloud. Я могу успешно генерировать изображения с помощью следующего кода:
Настройка:
!pip install --quiet --upgrade --user google-cloud-aiplatform

импортировать...

0 Ответы

73 Просмотры

Последнее сообщение Anonymous
26 май 2024, 01:39
Почему я получаю сообщение об ошибке при загрузке определенного модуля (факела)?

Последнее сообщение Anonymous « 25 июл 2024, 20:49
Добавлено в форуме Python

Anonymous » 25 июл 2024, 20:49 » в форуме Python

Traceback (most recent call last):
File c:\Users\Admin\OneDrive\Desktop\Python\OpenCV\t.py , line 2, in
import torch
File C:\Users\Admin\AppData\Local\Programs\Python\Python312\Lib\site-packages\torch\__init__.py , line 141, in
raise err
OSError:...

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
25 июл 2024, 20:49
Я получаю сообщение об ошибке PING FAILED при загрузке на мой сервер

Последнее сообщение Anonymous « 13 окт 2024, 01:13
Добавлено в форуме Php

Anonymous » 13 окт 2024, 01:13 » в форуме Php

При загрузке видео на AWS на локальном хосте я могу загрузить независимо от размера и не выдает ошибки.
Но когда я переношу эти коды на сервер AWS и пытаюсь загружаете файл размером более 100 МБ, выдает такую ошибку...

0 Ответы

25 Просмотры

Последнее сообщение Anonymous
13 окт 2024, 01:13
Почему при многочастной загрузке S3 я получаю сообщение об ошибке «Номер детали должен быть целым числом от 1 до 10 000»

Последнее сообщение Anonymous « 16 дек 2024, 06:01
Добавлено в форуме Python

Anonymous » 16 дек 2024, 06:01 » в форуме Python

Я работаю над загрузкой большого дампа базы данных (около 85 ГБ) в корзину Amazon S3 с помощью многочастной загрузки через boto3. Однако я продолжаю сталкиваться с этой ошибкой:
botocore.exceptions.ClientError: An error occurred (InvalidArgument)...

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
16 дек 2024, 06:01
Почему при многочастной загрузке S3 я получаю сообщение об ошибке «Номер детали должен быть целым числом от 1 до 10 000»

Последнее сообщение Anonymous « 16 дек 2024, 06:38
Добавлено в форуме Python

Anonymous » 16 дек 2024, 06:38 » в форуме Python

Я работаю над загрузкой большого дампа базы данных (около 85 ГБ) в корзину Amazon S3 с помощью многочастной загрузки через boto3. Однако я продолжаю сталкиваться с этой ошибкой:
botocore.exceptions.ClientError: An error occurred (InvalidArgument)...

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
16 дек 2024, 06:38

Вернуться в «Python»