Функция потерь не уменьшается в модели CNN? - Цифровое Кемерово

Функция потерь не уменьшается в модели CNN? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Функция потерь не уменьшается в модели CNN?

Цитата

Сообщение Anonymous » 06 июл 2024, 13:41

Я создаю модель CNN для обнаружения эмоций (я новичок в создании нейронных сетей). Используемый мной набор данных имел следующую структуру:
DatasetName ->
train ->
0
1
2
34
5
6
7
где каждое число представляло собой папку данных для отдельной эмоции. Каждое изображение раскрашено в разные размеры (все размеры изменены до 48x48). Всего в нем 37553 изображения.
Это код:

Код: Выделить всё

# Imports
import torch
import torch.nn as nn
import torch.optim as optim
import torchvision.transforms as transforms
import torchvision
import torch.nn.functional as F
import os
from skimage import io
from torch.utils.data import Dataset, DataLoader
from torch.autograd import Variable

# Custom dataset
class EmotionDataset(Dataset):
def __init__(self, root_dir, transform, train):
self.root_dir = root_dir
self.transform = transform
self.train = train

self.zero = sorted(os.listdir(os.path.join(self.root_dir, str(0))))
self.one = sorted(os.listdir(os.path.join(self.root_dir, str(1))))
self.two = sorted(os.listdir(os.path.join(self.root_dir, str(2))))
self.three = sorted(os.listdir(os.path.join(self.root_dir, str(3))))
self.four = sorted(os.listdir(os.path.join(self.root_dir, str(4))))
self.five = sorted(os.listdir(os.path.join(self.root_dir, str(5))))
self.six = sorted(os.listdir(os.path.join(self.root_dir, str(6))))
self.seven = sorted(os.listdir(os.path.join(self.root_dir, str(7))))

self.zerol = len(self.zero)
self.onel = len(self.one)
self.twol = len(self.two)
self.threel = len(self.three)
self.fourl = len(self.four)
self.fivel = len(self.five)
self.sixl = len(self.six)
self.sevenl = len(self.seven)

self.data = [self.zero, self.one, self.two, self.three, self.four, self.five, self.six, self.seven]
self.length = self.zerol + self.onel + self.twol + self.threel + self.fourl + self.fivel + self.sixl + self.sevenl

def __len__(self):
return self.length

def sub_folder(self, index):
if index < self.zerol:
return 0, index
elif index >= self.zerol and index < self.zerol + self.onel:
return 1, index - self.zerol
elif index >= self.zerol + self.onel and index < self.zerol + self.onel + self.twol:
return 2, index - (self.zerol + self.onel)
elif index >= self.zerol + self.onel + self.twol and index < self.zerol + self.onel + self.twol + self.threel:
return 3, index - (self.zerol + self.onel + self.twol)
elif index >= self.zerol + self.onel + self.twol + self.threel and index < self.zerol + self.onel + self.twol + self.threel + self.fourl:
return 4, index - (self.zerol + self.onel + self.twol + self.threel)
elif index >= self.zerol + self.onel + self.twol + self.threel + self.fourl and index < self.zerol + self.onel + self.twol + self.threel + self.fourl + self.fivel:
return 5, index - (self.zerol + self.onel + self.twol + self.threel + self.fourl)
elif index >= self.zerol + self.onel + self.twol + self.threel + self.fourl + self.fivel and index < self.zerol + self.onel + self.twol + self.threel + self.fourl + self.fivel + self.sixl:
return 6, index - (self.zerol + self.onel + self.twol + self.threel + self.fourl + self.fivel)
else:
return 7, index - (self.zerol + self.onel + self.twol + self.threel + self.fourl + self.fivel + self.sixl)

def __getitem__(self, index):
subfolder, mod_index = self.sub_folder(index)
img_path = os.path.join(self.root_dir, str(subfolder), self.data[subfolder][mod_index])
image = io.imread(img_path)

target = torch.tensor(int(subfolder))

if self.transform:
image = self.transform(image)

t = torchvision.transforms.Resize((48, 48))
image = t(image)
#image = image.expand(3, -1, -1)

return image, target

# Set device
device = torch.device("cuda"  if torch.cuda.is_available() else "cpu")

# Convolutional Neural Network
class ConvolutionalNeuralNetwork(nn.Module):
def __init__(self, in_channels, num_classes):
super(ConvolutionalNeuralNetwork, self).__init__()
self.conv1 = nn.Conv2d(in_channels=in_channels, out_channels=8, kernel_size=(3,3), stride=(1,1), padding=(1,1)) #keeps size
self.pool = nn.MaxPool2d(kernel_size=(2,2), stride =(2,2)) #cuts size in half
self.conv2 = nn.Conv2d(in_channels=8, out_channels=16, kernel_size=(3,3), stride=(1,1), padding=(1,1)) #keeps size
self.conv3 = nn.Conv2d(in_channels=16, out_channels=32, kernel_size=(3,3), stride=(1,1), padding=(1,1)) #keeps size
self.conv4 = nn.Conv2d(in_channels=32, out_channels=64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))  # keeps size
self.fc1 = nn.Linear(64*6*6, num_classes)

def forward(self, x):
x = F.relu((self.conv1(x)))
x = self.pool(x)
x = F.relu(self.conv2(x))
x = F.relu(self.conv3(x))
x = self.pool(x)
x = F.relu(self.conv4(x))
x = self.pool(x)
x = x.reshape(x.shape[0], -1)
x = self.fc1(x)
return x

# Saving model
def save_model(state, filename = "saved_model1.pth.tar"):
print("Saving model")
torch.save(state, filename)

# Hyperparameters
in_channels = 3
num_classes = 8
learning_rate = 0.01
batch_size = 64
num_epochs = 11

# Load Data
train_set = EmotionDataset(root_dir = os.path.join("DatasetName", "train"), transform = transforms.ToTensor(), train=True)
test_set = EmotionDataset(root_dir = os.path.join("DatasetName", "test"), transform = transforms.ToTensor(), train=False)
train_loader = DataLoader(dataset=train_set, batch_size=batch_size, shuffle=True)
test_loader = DataLoader(dataset=test_set, batch_size=batch_size, shuffle=False)

# Init network
model = ConvolutionalNeuralNetwork(in_channels=in_channels, num_classes=num_classes).to(device)

# Loss - cost function
criterion = nn.CrossEntropyLoss()

# Learning algorithm
optimizer = optim.Adam(model.parameters(), lr = learning_rate)

# Training
def train_model():
print("Training Model")
for epoch in range(num_epochs):
losses = []
for batch_idx, (data, targets) in enumerate(train_loader):
# get data in cpu
data = data.to(device=device)
targets = targets.to(device=device)

# forward
scores = model(data)
loss = criterion(scores, targets)

losses.append(loss.item())

# backward
optimizer.zero_grad()
loss.backward()

# gradient descent or adam step
optimizer.step()

print(f"Cost at epoch {epoch} is {sum(losses) / len(losses)}")

# Testing
def check_accuracy(loader, model):
num_correct = 0
num_samples = 0
model.eval()

with torch.no_grad():
if loader.dataset.train:
print("Checking accuracy on training data")
else:
print("Checking accuracy on test data")
for x, y in loader:
x = x.to(device = device)
y = y.to(device=device)

scores = model(x)
_, predictions = scores.max(1)
num_correct += (predictions == y).sum()
num_samples += predictions.size(0)

print(f'Got {num_correct} / {num_samples} with accuracy {float(num_correct)/float(num_samples)*100:.2f}')

model.train()

if __name__ == "__main__":

# train and save model
train_model()

saved_model = {'state_dict': model.state_dict(), 'optimizer': optimizer.state_dict()}
save_model(saved_model)

check_accuracy(train_loader, model)
check_accuracy(test_loader, model)

Я пробовал регулировать скорость обучения, пакетный_размер, число_епох, но когда я начинаю процесс обучения, модель имеет первоначальные потери, а затем каждая последующая эпоха имеет очень похожее значение потерь (не вообще уменьшается).
Я пробовал использовать другие наборы данных, и с ними функция потерь уменьшается, но модель очень неточна. Как я могу отредактировать эту сеть, чтобы уменьшить потери?

Подробнее здесь: https://stackoverflow.com/questions/787 ... -cnn-model

Реклама

1720262501

Anonymous

Я создаю модель CNN для обнаружения эмоций (я новичок в создании нейронных сетей). Используемый мной набор данных имел следующую структуру:
DatasetName ->
train ->
0
1
2
34
5
6
7
где каждое число представляло собой папку данных для отдельной эмоции. Каждое изображение раскрашено в разные размеры (все размеры изменены до 48x48).  Всего в нем 37553 изображения.
Это код:
[code]# Imports
import torch
import torch.nn as nn
import torch.optim as optim
import torchvision.transforms as transforms
import torchvision
import torch.nn.functional as F
import os
from skimage import io
from torch.utils.data import Dataset, DataLoader
from torch.autograd import Variable

# Custom dataset
class EmotionDataset(Dataset):
def __init__(self, root_dir, transform, train):
self.root_dir = root_dir
self.transform = transform
self.train = train

self.zero = sorted(os.listdir(os.path.join(self.root_dir, str(0))))
self.one = sorted(os.listdir(os.path.join(self.root_dir, str(1))))
self.two = sorted(os.listdir(os.path.join(self.root_dir, str(2))))
self.three = sorted(os.listdir(os.path.join(self.root_dir, str(3))))
self.four = sorted(os.listdir(os.path.join(self.root_dir, str(4))))
self.five = sorted(os.listdir(os.path.join(self.root_dir, str(5))))
self.six = sorted(os.listdir(os.path.join(self.root_dir, str(6))))
self.seven = sorted(os.listdir(os.path.join(self.root_dir, str(7))))

self.zerol = len(self.zero)
self.onel = len(self.one)
self.twol = len(self.two)
self.threel = len(self.three)
self.fourl = len(self.four)
self.fivel = len(self.five)
self.sixl = len(self.six)
self.sevenl = len(self.seven)

self.data = [self.zero, self.one, self.two, self.three, self.four, self.five, self.six, self.seven]
self.length = self.zerol + self.onel + self.twol + self.threel + self.fourl + self.fivel + self.sixl + self.sevenl

def __len__(self):
return self.length

def sub_folder(self, index):
if index < self.zerol:
return 0, index
elif index >= self.zerol and index < self.zerol + self.onel:
return 1, index - self.zerol
elif index >= self.zerol + self.onel and index < self.zerol + self.onel + self.twol:
return 2, index - (self.zerol + self.onel)
elif index >= self.zerol + self.onel + self.twol and index < self.zerol + self.onel + self.twol + self.threel:
return 3, index - (self.zerol + self.onel + self.twol)
elif index >= self.zerol + self.onel + self.twol + self.threel and index < self.zerol + self.onel + self.twol + self.threel + self.fourl:
return 4, index - (self.zerol + self.onel + self.twol + self.threel)
elif index >= self.zerol + self.onel + self.twol + self.threel + self.fourl and index < self.zerol + self.onel + self.twol + self.threel + self.fourl + self.fivel:
return 5, index - (self.zerol + self.onel + self.twol + self.threel + self.fourl)
elif index >= self.zerol + self.onel + self.twol + self.threel + self.fourl + self.fivel and index < self.zerol + self.onel + self.twol + self.threel + self.fourl + self.fivel + self.sixl:
return 6, index - (self.zerol + self.onel + self.twol + self.threel + self.fourl + self.fivel)
else:
return 7, index - (self.zerol + self.onel + self.twol + self.threel + self.fourl + self.fivel + self.sixl)

def __getitem__(self, index):
subfolder, mod_index = self.sub_folder(index)
img_path = os.path.join(self.root_dir, str(subfolder), self.data[subfolder][mod_index])
image = io.imread(img_path)

target = torch.tensor(int(subfolder))

if self.transform:
image = self.transform(image)

t = torchvision.transforms.Resize((48, 48))
image = t(image)
#image = image.expand(3, -1, -1)

return image, target

# Set device
device = torch.device("cuda"  if torch.cuda.is_available() else "cpu")

# Convolutional Neural Network
class ConvolutionalNeuralNetwork(nn.Module):
def __init__(self, in_channels, num_classes):
super(ConvolutionalNeuralNetwork, self).__init__()
self.conv1 = nn.Conv2d(in_channels=in_channels, out_channels=8, kernel_size=(3,3), stride=(1,1), padding=(1,1)) #keeps size
self.pool = nn.MaxPool2d(kernel_size=(2,2), stride =(2,2)) #cuts size in half
self.conv2 = nn.Conv2d(in_channels=8, out_channels=16, kernel_size=(3,3), stride=(1,1), padding=(1,1)) #keeps size
self.conv3 = nn.Conv2d(in_channels=16, out_channels=32, kernel_size=(3,3), stride=(1,1), padding=(1,1)) #keeps size
self.conv4 = nn.Conv2d(in_channels=32, out_channels=64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))  # keeps size
self.fc1 = nn.Linear(64*6*6, num_classes)

def forward(self, x):
x = F.relu((self.conv1(x)))
x = self.pool(x)
x = F.relu(self.conv2(x))
x = F.relu(self.conv3(x))
x = self.pool(x)
x = F.relu(self.conv4(x))
x = self.pool(x)
x = x.reshape(x.shape[0], -1)
x = self.fc1(x)
return x

# Saving model
def save_model(state, filename = "saved_model1.pth.tar"):
print("Saving model")
torch.save(state, filename)

# Hyperparameters
in_channels = 3
num_classes = 8
learning_rate = 0.01
batch_size = 64
num_epochs = 11

# Load Data
train_set = EmotionDataset(root_dir = os.path.join("DatasetName", "train"), transform = transforms.ToTensor(), train=True)
test_set = EmotionDataset(root_dir = os.path.join("DatasetName", "test"), transform = transforms.ToTensor(), train=False)
train_loader = DataLoader(dataset=train_set, batch_size=batch_size, shuffle=True)
test_loader = DataLoader(dataset=test_set, batch_size=batch_size, shuffle=False)

# Init network
model = ConvolutionalNeuralNetwork(in_channels=in_channels, num_classes=num_classes).to(device)

# Loss - cost function
criterion = nn.CrossEntropyLoss()

# Learning algorithm
optimizer = optim.Adam(model.parameters(), lr = learning_rate)

# Training
def train_model():
print("Training Model")
for epoch in range(num_epochs):
losses = []
for batch_idx, (data, targets) in enumerate(train_loader):
# get data in cpu
data = data.to(device=device)
targets = targets.to(device=device)

# forward
scores = model(data)
loss = criterion(scores, targets)

losses.append(loss.item())

# backward
optimizer.zero_grad()
loss.backward()

# gradient descent or adam step
optimizer.step()

print(f"Cost at epoch {epoch} is {sum(losses) / len(losses)}")

# Testing
def check_accuracy(loader, model):
num_correct = 0
num_samples = 0
model.eval()

with torch.no_grad():
if loader.dataset.train:
print("Checking accuracy on training data")
else:
print("Checking accuracy on test data")
for x, y in loader:
x = x.to(device = device)
y = y.to(device=device)

scores = model(x)
_, predictions = scores.max(1)
num_correct += (predictions == y).sum()
num_samples += predictions.size(0)

print(f'Got {num_correct} / {num_samples} with accuracy {float(num_correct)/float(num_samples)*100:.2f}')

model.train()

if __name__ == "__main__":

# train and save model
train_model()

saved_model = {'state_dict': model.state_dict(), 'optimizer': optimizer.state_dict()}
save_model(saved_model)

check_accuracy(train_loader, model)
check_accuracy(test_loader, model)

[/code]
Я пробовал регулировать скорость обучения, пакетный_размер, число_епох, но когда я начинаю процесс обучения, модель имеет первоначальные потери, а затем каждая последующая эпоха имеет очень похожее значение потерь (не вообще уменьшается).
Я пробовал использовать другие наборы данных, и с ними функция потерь уменьшается, но модель очень неточна. Как я могу отредактировать эту сеть, чтобы уменьшить потери? 

Подробнее здесь: [url]https://stackoverflow.com/questions/78712668/loss-function-not-decreasing-on-a-cnn-model[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Разница между входной формой для 1D CNN, 2D CNN и 3D CNN

Последнее сообщение Anonymous « 21 июл 2025, 09:35
Добавлено в форуме Python

Anonymous » 21 июл 2025, 09:35 » в форуме Python

Я впервые создаю модель CNN для классификации изображений, и я немного запутался в том, что будет формой ввода для каждого типа (1D CNN, 2D CNN, 3D CNN) и как исправить количество фильтров в слое свертки. Мои данные - 100x100x30, где 30 являются...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
21 июл 2025, 09:35
Объединение пользовательской функции потерь с предопределенной функцией потерь (Dice и Focal) для обучения DeeplabV3Plus

Последнее сообщение Anonymous « 19 окт 2023, 10:37
Добавлено в форуме Python

Anonymous » 19 окт 2023, 10:37 » в форуме Python

Я обучаю DeeplabV3+ семантической сегментации изображений дистанционного зондирования. Я создаю модель после урока по keras ( ), и она отлично работает, когда я использую для обучения фокусную потерю (предустановленную в Keras/tf). Маски имеют...

0 Ответы

51 Просмотры

Последнее сообщение Anonymous
19 окт 2023, 10:37
Индексирование выходной сетки CNN в функции потерь

Последнее сообщение Anonymous « 26 дек 2024, 10:42
Добавлено в форуме Python

Anonymous » 26 дек 2024, 10:42 » в форуме Python

У меня есть модель CNN, построенная в тензорном потоке, которая выводит сетку с формой (batch_size,H,W,1).
Я выполняю сигмовидную функцию активации для каждой ячейки в сетке.
мой y_true является тензором с , что означает, что для каждого экземпляра...

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
26 дек 2024, 10:42
Индексирование выходной сетки CNN в функции потерь

Последнее сообщение Anonymous « 27 дек 2024, 08:22
Добавлено в форуме Python

Anonymous » 27 дек 2024, 08:22 » в форуме Python

У меня есть модель CNN, построенная в тензорном потоке, которая выводит сетку с формой (batch_size,H,W,1).
Я выполняю функцию активации сигмовидной формы для каждой ячейки в Grid.
мой y_true является тензорным с , что означает, что для каждого...

0 Ответы

13 Просмотры

Последнее сообщение Anonymous
27 дек 2024, 08:22
Объединение 1D-CNN и 2D-CNN

Последнее сообщение Anonymous « 29 окт 2024, 03:07
Добавлено в форуме Python

Anonymous » 29 окт 2024, 03:07 » в форуме Python

Я хочу построить объединенную модель CNN, используя 1D и 2D CNN, но я пробовал много способов ее создания, но этот сработал, но я не знаю, почему я получаю эту ошибку при использовании model_combined.summary().
Я приложил два изображения, которые...

0 Ответы

37 Просмотры

Последнее сообщение Anonymous
29 окт 2024, 03:07

Вернуться в «Python»

Programmiererforum