Почему моя CNN для задачи двоичной классификации имеет постоянную точность 50% с BCELoss против 80%+ с перекрестной энтр

Почему моя CNN для задачи двоичной классификации имеет постоянную точность 50% с BCELoss против 80%+ с перекрестной энтр ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Почему моя CNN для задачи двоичной классификации имеет постоянную точность 50% с BCELoss против 80%+ с перекрестной энтр

Цитата

Сообщение Anonymous » 04 май 2024, 19:36

Я создаю CNN с нуля с помощью Pytorch. У меня есть сбалансированный набор данных изображений, разделенный пополам для обоих классов. Я пытаюсь использовать функцию BCEwithLogitsLoss из torch.nn, поскольку я читал, что она обычно лучше всего подходит для таких случаев, как мой. Однако по какой-то причине кажется, что моя сеть вообще ничего не изучает, когда я использую эту функцию потерь! Он остается с неизменной точностью ~ 50%, при этом он всегда угадывает только один класс. Когда я вместо этого использую обычную функцию CrossEntropyLoss и расширяю выходные узлы моего последнего слоя до 2, моя сеть фактически начинает обучение! В то время как с «правильной» функцией потерь моя сеть никогда не достигает точности даже 1% для целевого класса, используя перекрестную энтропийную потерю я могу достичь даже 90%+ через несколько эпох.
Насколько я понимаю, потеря перекрестной энтропии лучше подходит для задач многоклассовой классификации, тогда как двоичная перекрестная энтропия лучше подходит для задач двоичной классификации, как указано в названии, поэтому я не понимаю, как это может быть так.
Изначально я начал с более простой CNN, поскольку создавал ее впервые. Таким образом, после некоторых дополнительных исследований я пришел к выводу, что отчасти это может быть связано с отсутствием слоев и сложности. Поэтому я добавил больше слоев и в итоге получил вот такой план:

Код: Выделить всё

import torch.nn as nn
import torch.nn.functional as F

class ConvolutionalNN(nn.Module):
def __init__(self):
super(ConvolutionalNN, self).__init__()

self.conv1 = nn.Conv2d(3, 9, 5)
self.conv2 = nn.Conv2d(9, 27, 5)
self.conv3 = nn.Conv2d(27, 54, 5)
self.conv4 = nn.Conv2d(54, 108, 5)
self.conv5 = nn.Conv2d(108, 216, 5)
self.conv6 = nn.Conv2d(216, 432, 5)

self.pool = nn.MaxPool2d(3, 3)

self.fc1 = nn.Linear(432*4*4, 256)
self.fc2 = nn.Linear(256, 64)
self.fc3 = nn.Linear(64, 2)

def forward(self, x):
x = (F.relu(self.conv1(x))) #First convolutional layer, then activation function
x = self.pool(F.relu(self.conv2(x))) #Second layer, activation function, then pooling layer
x = (F.relu(self.conv3(x)))
x = self.pool(F.relu(self.conv4(x)))
x = (F.relu(self.conv5(x)))
x = self.pool(F.relu(self.conv6(x)))
x = x.reshape(-1, 432*4*4) #Flattens the tensor
x = F.relu(self.fc1(x))
x = F.relu(self.fc2(x))
x = self.fc3(x)

return x

Отчасти меня вдохновили двойные сверточные слои, используемые в VGGNET. Кроме того, у меня нет опыта в этом, поэтому, если у кого-то есть какие-либо предложения, я буду более чем рад их принять.
Я использовал скорость обучения 0,001 и 0,0001. Я использую оптимизатор Адама. Более того, мои метки не имеют горячего кодирования. В приведенном выше случае я использовал 2 выходных узла для взаимодействия с CrossEntropyLoss, однако ранее я использовал 1 выходной узел для BCE.
Я с нетерпением жду любой помощи! Спасибо вам огромное!

Подробнее здесь: https://stackoverflow.com/questions/784 ... 0-accuracy

1714840585

Anonymous

Я создаю CNN с нуля с помощью Pytorch. У меня есть сбалансированный набор данных изображений, разделенный пополам для обоих классов. Я пытаюсь использовать функцию BCEwithLogitsLoss из torch.nn, поскольку я читал, что она обычно лучше всего подходит для таких случаев, как мой. Однако по какой-то причине кажется, что моя сеть вообще ничего не изучает, когда я использую эту функцию потерь! Он остается с неизменной точностью ~ 50%, при этом он всегда угадывает только один класс. Когда я вместо этого использую обычную функцию CrossEntropyLoss и расширяю выходные узлы моего последнего слоя до 2, моя сеть фактически начинает обучение! В то время как с «правильной» функцией потерь моя сеть никогда не достигает точности даже 1% для целевого класса, используя перекрестную энтропийную потерю я могу достичь даже 90%+ через несколько эпох.
Насколько я понимаю, потеря перекрестной энтропии лучше подходит для задач многоклассовой классификации, тогда как двоичная перекрестная энтропия лучше подходит для задач двоичной классификации, как указано в названии, поэтому я не понимаю, как это может быть так.
Изначально я начал с более простой CNN, поскольку создавал ее впервые. Таким образом, после некоторых дополнительных исследований я пришел к выводу, что отчасти это может быть связано с отсутствием слоев и сложности. Поэтому я добавил больше слоев и в итоге получил вот такой план:
[code]import torch.nn as nn
import torch.nn.functional as F

class ConvolutionalNN(nn.Module):
def __init__(self):
super(ConvolutionalNN, self).__init__()

self.conv1 = nn.Conv2d(3, 9, 5)
self.conv2 = nn.Conv2d(9, 27, 5)
self.conv3 = nn.Conv2d(27, 54, 5)
self.conv4 = nn.Conv2d(54, 108, 5)
self.conv5 = nn.Conv2d(108, 216, 5)
self.conv6 = nn.Conv2d(216, 432, 5)

self.pool = nn.MaxPool2d(3, 3)

self.fc1 = nn.Linear(432*4*4, 256)
self.fc2 = nn.Linear(256, 64)
self.fc3 = nn.Linear(64, 2)

def forward(self, x):
x = (F.relu(self.conv1(x))) #First convolutional layer, then activation function
x = self.pool(F.relu(self.conv2(x))) #Second layer, activation function, then pooling layer
x = (F.relu(self.conv3(x)))
x = self.pool(F.relu(self.conv4(x)))
x = (F.relu(self.conv5(x)))
x = self.pool(F.relu(self.conv6(x)))
x = x.reshape(-1, 432*4*4) #Flattens the tensor
x = F.relu(self.fc1(x))
x = F.relu(self.fc2(x))
x = self.fc3(x)

return x
[/code]
Отчасти меня вдохновили двойные сверточные слои, используемые в VGGNET. Кроме того, у меня нет опыта в этом, поэтому, если у кого-то есть какие-либо предложения, я буду более чем рад их принять.
Я использовал скорость обучения 0,001 и 0,0001. Я использую оптимизатор Адама. Более того, мои метки не имеют горячего кодирования. В приведенном выше случае я использовал 2 выходных узла для взаимодействия с CrossEntropyLoss, однако ранее я использовал 1 выходной узел для BCE.
Я с нетерпением жду любой помощи! Спасибо вам огромное! 

Подробнее здесь: [url]https://stackoverflow.com/questions/78429681/why-does-my-cnn-for-a-binary-classification-problem-have-a-constant-50-accuracy[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Функция st_makeenvelope (двойная точность, двойная точность, двойная точность, двойная точность, целое число) не существ

Последнее сообщение Anonymous « 07 авг 2025, 10:55
Добавлено в форуме JAVA

Anonymous » 07 авг 2025, 10:55 » в форуме JAVA

function st_makeenvelope (двойная точность, двойная точность, двойная точность, двойная точность, целое число) не существует
Подсказка: Никакая функция не соответствует данным имени и типам аргументов. Вам может потребоваться добавить явные типы....

0 Ответы

7 Просмотры

Последнее сообщение Anonymous
07 авг 2025, 10:55
Разница между входной формой для 1D CNN, 2D CNN и 3D CNN

Последнее сообщение Anonymous « 21 июл 2025, 09:35
Добавлено в форуме Python

Anonymous » 21 июл 2025, 09:35 » в форуме Python

Я впервые создаю модель CNN для классификации изображений, и я немного запутался в том, что будет формой ввода для каждого типа (1D CNN, 2D CNN, 3D CNN) и как исправить количество фильтров в слое свертки. Мои данные - 100x100x30, где 30 являются...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
21 июл 2025, 09:35
Как понять значение Шепли для задачи двоичной классификации?

Последнее сообщение Anonymous « 15 янв 2025, 17:35
Добавлено в форуме Python

Anonymous » 15 янв 2025, 17:35 » в форуме Python

Я новичок в пакете python shap. И мне интересно, как мне интерпретировать значение Шепли для задачи двоичной классификации? Вот что я сделал на данный момент.
Во-первых, я использовал модель LightGBM, соответствующую моим данным. Что-то вроде
import...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
15 янв 2025, 17:35
Рассчитайте точность, полноту, точность и сбалансированную точность из матрицы путаницы.

Последнее сообщение Anonymous « 28 окт 2024, 21:33
Добавлено в форуме Python

Anonymous » 28 окт 2024, 21:33 » в форуме Python

Матрица путаницы показывает, как реальные метки сравниваются с прогнозируемыми метками для задачи двоичной классификации.
Используя матрицу путаницы, вычислите следующее:
Точность: какая часть прогнозов оказалась верной?
Точность: какая доля...

0 Ответы

40 Просмотры

Последнее сообщение Anonymous
28 окт 2024, 21:33
Рассчитать кривую ROC, отчет о классификации и матрицу путаницы для задачи классификации по нескольким меткам.

Последнее сообщение Anonymous « 02 дек 2024, 15:40
Добавлено в форуме Python

Anonymous » 02 дек 2024, 15:40 » в форуме Python

Я пытаюсь понять, как создать матрицу путаницы и кривую ROC для моей задачи классификации по нескольким меткам. Я строю нейронную сеть.
Вот мои занятия:
mlb = MultiLabelBinarizer()
ohe = mlb.fit_transform(as_list)
# loop over each of the possible...

0 Ответы

42 Просмотры

Последнее сообщение Anonymous
02 дек 2024, 15:40

Вернуться в «Python»