Индекс класса Pytorch SSDLite выходит за пределы диапазона и ошибка functionnal.cross_entropy torch.nn

Индекс класса Pytorch SSDLite выходит за пределы диапазона и ошибка functionnal.cross_entropy torch.nn ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Индекс класса Pytorch SSDLite выходит за пределы диапазона и ошибка functionnal.cross_entropy torch.nn

Цитата

Сообщение Anonymous » 13 ноя 2024, 23:48

Я пытаюсь точно настроить модель SSDLite320_Mobilenet_V3_Large на пользовательском наборе данных с тремя классами, используя код pytorch для моделей видения/обнаружения. Однако я подозреваю, что существует проблема при создании цели внутри библиотеки torch или в коде, указанном в субгиде (ссылка выше).
Действительно, при достижении функции cross_entropy из файл function.py из torch.nn, я получаю

ошибку CUDA: утверждение на стороне устройства вызвало ошибки ядра CUDA .

Как упоминалось ptrblck на форуме Pytorch по этой проблеме и в документации pytorch, функция принимает цели в диапазоне [0,C), где C — количество классов.
Поэтому я попробовал две вещи:

Я установил ignore_index на 3, чтобы гарантировать что не будет значения, выходящего за пределы индекса передано. Код выполнился без ошибок. Однако, посмотрев на предсказанные метки и матрицу путаницы (см. ниже, не беспокойтесь о точности модели, это всего лишь набор отладочных данных с 50 эпохами) после обучения я увидел, что модель не смогла предсказать класс номер 3. Установка ignore_index на 3 не кажется решением, если это приводит к тому, что в прогнозах модели отсутствует класс.

Я проверил минимальное и максимальное значения мои цели непосредственно в функции cross_entropy прямо перед тем, как они были переданы для возврата torch._C._nn.cross_entropy_loss(input, target, Weight, _Reduction.get_enum(reduction), ignore_index, label_smoothing). Я получил 0 как минимальное и 3 как максимальное значения на всех проходах. Идентификаторы моих классов: [1,2,3]. Я подозреваю, что проблема связана с этим увеличением диапазона. Однако, не будучи знаком с внутренней работой библиотеки torch, я, кажется, не понимаю, откуда взялся этот 0 (или почему 3 не уменьшаются в 2, если сокращение есть) или как target< Создается объект /strong>.

Поскольку эта проблема может возникнуть из-за создания объектов, передаваемых функциям библиотеки Torch, вот некоторый контекст их творение.
Мое модель выглядит следующим образом:
model = torchvision.models.detection.ssdlite320_mobilenet_v3_large(num_classes=num_classes, pretrained_backbone=True, trainable_backbone_layers=0)

И часть моего кода, посвященная созданию загрузчиков данных, выглядит следующим образом:
# Data loading code
print("Loading data")

dataset, num_classes = get_dataset(is_train=True, args=args)
dataset_test, _ = get_dataset(is_train=False, args=args)
dataset_val, _ = get_dataset(is_train=False, args=args)

print("Creating data loaders")
if args.distributed:
train_sampler = torch.utils.data.distributed.DistributedSampler(dataset)
test_sampler = torch.utils.data.distributed.DistributedSampler(dataset_test, shuffle=False)
val_sampler = torch.utils.data.distributed.DistributedSampler(dataset_val, shuffle=False)
else:
train_sampler = torch.utils.data.RandomSampler(dataset)
test_sampler = torch.utils.data.SequentialSampler(dataset_test)
test_val = torch.utils.data.SequentialSampler(dataset_val)

if args.aspect_ratio_group_factor >= 0:
group_ids = create_aspect_ratio_groups(dataset, k=args.aspect_ratio_group_factor)
train_batch_sampler = GroupedBatchSampler(train_sampler, group_ids, args.batch_size)
else:
train_batch_sampler = torch.utils.data.BatchSampler(train_sampler, args.batch_size, drop_last=True)

train_collate_fn = utils.collate_fn
if args.use_copypaste:
if args.data_augmentation != "lsj":
raise RuntimeError("SimpleCopyPaste algorithm currently only supports the 'lsj' data augmentation policies")

train_collate_fn = copypaste_collate_fn

data_loader = torch.utils.data.DataLoader(
dataset, batch_sampler=train_batch_sampler, num_workers=args.workers, collate_fn=train_collate_fn
)

data_loader_test = torch.utils.data.DataLoader(
dataset_test, batch_size=1, sampler=test_sampler, num_workers=args.workers, collate_fn=utils.collate_fn
)

data_loader_val = torch.utils.data.DataLoader(
dataset_val, batch_size=1, sampler=val_sampler, num_workers=args.workers, collate_fn=utils.collate_fn
)

Подробнее здесь: https://stackoverflow.com/questions/782 ... ionnal-cro

1731530911

Anonymous

Я пытаюсь точно настроить модель SSDLite320_Mobilenet_V3_Large на пользовательском наборе данных с тремя классами, используя код pytorch для моделей видения/обнаружения. Однако я подозреваю, что существует проблема при создании цели внутри библиотеки torch или в коде, указанном в субгиде (ссылка выше).
Действительно, при достижении функции cross_entropy из файл function.py из torch.nn, я получаю

ошибку CUDA: утверждение на стороне устройства вызвало ошибки ядра CUDA .

Как упоминалось [b]ptrblck[/b] на форуме Pytorch по этой проблеме и в документации pytorch, функция принимает цели в диапазоне [0,C), где C — количество классов.
Поэтому я попробовал две вещи:
[list]
[*]Я установил ignore_index на 3, чтобы гарантировать что не будет значения, выходящего за пределы индекса передано. Код выполнился без ошибок. Однако, посмотрев на предсказанные метки и матрицу путаницы (см. ниже, не беспокойтесь о точности модели, это всего лишь набор отладочных данных с 50 эпохами) после обучения я увидел, что модель не смогла предсказать класс номер 3. Установка ignore_index на 3 не кажется решением, если это приводит к тому, что в прогнозах модели отсутствует класс.
[/list]
[img]https://i.sstatic.net/YmQEm.png[/img]

[list]
[*]Я проверил минимальное и максимальное значения мои цели непосредственно в функции cross_entropy прямо перед тем, как они были переданы для возврата torch._C._nn.cross_entropy_loss(input, target, Weight, _Reduction.get_enum(reduction), ignore_index, label_smoothing). Я получил 0 как минимальное и 3 как максимальное значения на всех проходах. Идентификаторы моих классов: [b][1,2,3][/b]. Я подозреваю, что проблема связана с этим увеличением диапазона. Однако, не будучи знаком с внутренней работой библиотеки torch, я, кажется, не понимаю, откуда взялся этот 0 (или почему 3 не уменьшаются в 2, если сокращение есть) или как target< Создается объект /strong>.
[/list]
Поскольку эта проблема может возникнуть из-за создания объектов, передаваемых функциям библиотеки Torch, вот некоторый контекст их творение.
Мое модель выглядит следующим образом:
model = torchvision.models.detection.ssdlite320_mobilenet_v3_large(num_classes=num_classes, pretrained_backbone=True, trainable_backbone_layers=0)

И часть моего кода, посвященная созданию загрузчиков данных, выглядит следующим образом:
# Data loading code
print("Loading data")

dataset, num_classes = get_dataset(is_train=True, args=args)
dataset_test, _ = get_dataset(is_train=False, args=args)
dataset_val, _ = get_dataset(is_train=False, args=args)

print("Creating data loaders")
if args.distributed:
train_sampler = torch.utils.data.distributed.DistributedSampler(dataset)
test_sampler = torch.utils.data.distributed.DistributedSampler(dataset_test, shuffle=False)
val_sampler = torch.utils.data.distributed.DistributedSampler(dataset_val, shuffle=False)
else:
train_sampler = torch.utils.data.RandomSampler(dataset)
test_sampler = torch.utils.data.SequentialSampler(dataset_test)
test_val = torch.utils.data.SequentialSampler(dataset_val)

if args.aspect_ratio_group_factor >= 0:
group_ids = create_aspect_ratio_groups(dataset, k=args.aspect_ratio_group_factor)
train_batch_sampler = GroupedBatchSampler(train_sampler, group_ids, args.batch_size)
else:
train_batch_sampler = torch.utils.data.BatchSampler(train_sampler, args.batch_size, drop_last=True)

train_collate_fn = utils.collate_fn
if args.use_copypaste:
if args.data_augmentation != "lsj":
raise RuntimeError("SimpleCopyPaste algorithm currently only supports the 'lsj' data augmentation policies")

train_collate_fn = copypaste_collate_fn

data_loader = torch.utils.data.DataLoader(
dataset, batch_sampler=train_batch_sampler, num_workers=args.workers, collate_fn=train_collate_fn
)

data_loader_test = torch.utils.data.DataLoader(
dataset_test, batch_size=1, sampler=test_sampler, num_workers=args.workers, collate_fn=utils.collate_fn
)

data_loader_val = torch.utils.data.DataLoader(
dataset_val, batch_size=1, sampler=val_sampler, num_workers=args.workers, collate_fn=utils.collate_fn
)
 

Подробнее здесь: [url]https://stackoverflow.com/questions/78275145/pytorch-ssdlite-targets-class-index-out-of-range-and-torch-nns-functionnal-cro[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Исключение «Индекс Unity3D вне диапазона»: индекс массива выходит за пределы диапазона (попытка изменить спрайт при нажа

Последнее сообщение Anonymous « 13 ноя 2024, 19:02
Добавлено в форуме C#

Anonymous » 13 ноя 2024, 19:02 » в форуме C#

Доброе утро, разработчики. Я знаю, что этот вопрос задавался раньше, но я не нашел решения своей проблемы в этих ответах. Сначала я хотел бы сказать вам, что я всего лишь новичок в Unity :p, ну, вот моя проблема: я создаю игру с разбиванием...

0 Ответы

42 Просмотры

Последнее сообщение Anonymous
13 ноя 2024, 19:02
Неустранимая ошибка: индекс выходит за пределы диапазона при добавлении и удалении из массива с помощью MVVM.

Последнее сообщение Anonymous « 29 дек 2024, 20:04
Добавлено в форуме IOS

Anonymous » 29 дек 2024, 20:04 » в форуме IOS

Я пытаюсь отобразить массив структур Word в дочерних TextFields, используя архитектуру MVVM, передав привязку к структуре Word дочернему элементу. Существует кнопка для вставки нового пустого слова Word в массив в позиции 0, который заполняется...

0 Ответы

25 Просмотры

Последнее сообщение Anonymous
29 дек 2024, 20:04
Индекс вектора C++ выходит за пределы диапазона при определенных условиях [закрыто]

Последнее сообщение Anonymous « 29 сен 2023, 04:09
Добавлено в форуме C++

Anonymous » 29 сен 2023, 04:09 » в форуме C++

Я учусь в школе на уроке C++, и этот код предназначен для поиска минимума в наборе чисел. Требуется первоначальный ввод, чтобы определить, сколько чисел будет в наборе, а затем вводимые данные для каждого из значений. Однако всякий раз, когда...

0 Ответы

70 Просмотры

Последнее сообщение Anonymous
29 сен 2023, 04:09
IndexError: индекс списка выходит за пределы диапазона в FAISS.from_documents

Последнее сообщение Anonymous « 06 мар 2024, 09:52
Добавлено в форуме Python

Anonymous » 06 мар 2024, 09:52 » в форуме Python

I'm encountering an error when using LangChain's FAISS module to build a vector index from a list of documents. Specifically, I'm getting an IndexError: list index out of range on the line where I call FAISS.from_documents(docs, embeddings).

My...

0 Ответы

72 Просмотры

Последнее сообщение Anonymous
06 мар 2024, 09:52
IndexError: индекс списка выходит за пределы диапазона в FAISS.from_documents

Последнее сообщение Anonymous « 06 мар 2024, 15:43
Добавлено в форуме Python

Anonymous » 06 мар 2024, 15:43 » в форуме Python

I'm encountering an error when using LangChain's FAISS module to build a vector index from a list of documents. Specifically, I'm getting an IndexError: list index out of range on the line where I call FAISS.from_documents(docs, embeddings).

My...

0 Ответы

44 Просмотры

Последнее сообщение Anonymous
06 мар 2024, 15:43

Вернуться в «Python»