Почему моя модель Pytorch быстро достигает 100% точности, в то время как версия Keras тренируется гораздо более постепен

Почему моя модель Pytorch быстро достигает 100% точности, в то время как версия Keras тренируется гораздо более постепен ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Почему моя модель Pytorch быстро достигает 100% точности, в то время как версия Keras тренируется гораздо более постепен

Цитата

Сообщение Anonymous » 29 июл 2025, 13:57

Я внедряю ту же архитектуру CNN для бинарной классификации на фильтрованной версии набора данных FashionMnist (COAT VS Pullover) с использованием:

[*] pytorch

pytor Иметь ту же структуру: < /p>

2x сверточные слои < /li>
Список элемента < /li>
Нормализация пакетов < /li>
< /li>
hoome hoome ater>
< /li> < /li> < /li> < /li> < /li> < /li> < /li> < /li> < /li> < /li> < /li> < /li> < /li> < /li> < /li> < /li> < /li> < /li> < /li> < /li> < /li> < /li> < /> С 32 единицами
Окончательный вывод сигмоида

Используя кера , я получаю этот результат обучения:

Код: Выделить всё

Epoch 1/5
270/270 - 5s - 18ms/step - accuracy: 0.6794 - loss: 1.1801 - val_accuracy: 0.5042 - val_loss: 1.1561

Epoch 2/5
270/270 - 2s - 6ms/step - accuracy: 0.7513 - loss: 0.8556 - val_accuracy: 0.7010 - val_loss: 0.7886

Epoch 3/5
270/270 - 2s - 6ms/step - accuracy: 0.7752 - loss: 0.6989 - val_accuracy: 0.7927 - val_loss: 0.6180

Epoch 4/5
270/270 - 2s - 6ms/step - accuracy: 0.7971 - loss: 0.5981 - val_accuracy: 0.8344 - val_loss: 0.5222

Epoch 5/5
270/270 - 2s - 6ms/step - accuracy: 0.8065 - loss: 0.5404 - val_accuracy: 0.8021 - val_loss: 0.5670

Но с помощью pytorch модель достигает ~ 100% точности в течение всего 2–3 эпох:

Код: Выделить всё

Epoch 1/5 - Train Loss: 0.4841 - Train Acc: 0.7904 - Val Loss: 0.1818 - Val Acc: 1.0000

Epoch 2/5 - Train Loss: 0.0785 - Train Acc: 0.9972 - Val Loss: 0.0257 - Val Acc: 1.0000

Epoch 3/5 - Train Loss: 0.0226 - Train Acc: 1.0000 - Val Loss: 0.0131 - Val Acc: 1.0000

Epoch 4/5 - Train Loss: 0.0141 - Train Acc: 1.0000 - Val Loss: 0.0099 - Val Acc: 1.0000

Epoch 5/5 - Train Loss: 0.0122 - Train Acc: 1.0000 - Val Loss: 0.0092 - Val Acc: 1.0000
< /code>
Я запутался, потому что модели архитектурно идентичны. Тем не менее, Pytorch, кажется, чрезвычайно быстро приполняет. Pytorch

[*] использовал bceloss () с pytorch и binary_crossentropy с керасом

[*] Соответствующий выпадающий. ADAM )

Реализация модели керас:

Код: Выделить всё

import tensorflow as tf
from tensorflow.keras import layers, regularizers

def simple_cnn_model():
model = tf.keras.Sequential([
layers.GaussianNoise(0.1),  #  Adds slight noise to improve robustness

layers.Conv2D(8, (3,3), activation='relu', input_shape=(28,28,1),
kernel_regularizer=regularizers.l2(0.01)),
layers.BatchNormalization(),
layers.MaxPooling2D((2,2)),
layers.Dropout(0.5),  #  Reduced dropout (0.6 → 0.5)

layers.Conv2D(16, (3,3), activation='relu',
kernel_regularizer=regularizers.l2(0.01)),
layers.BatchNormalization(),
layers.MaxPooling2D((2,2)),
layers.Dropout(0.5),  #  Reduced dropout (0.7 → 0.6)

layers.Flatten(),
layers.Dense(32, activation='relu', kernel_regularizer=regularizers.l2(0.01)),
layers.BatchNormalization(),
layers.Dropout(0.4),  #  Less dropout in Dense layer (0.7 → 0.5)

layers.Dense(1, activation='sigmoid')  # 1 neuron for binary classification
])

model.compile(optimizer='adam',
loss='binary_crossentropy',
metrics=['accuracy'])
return model

#  Create and compile model
model = simple_cnn_model()

model=simple_cnn_model()

history = model.fit(
x_train, y_train,
validation_split=0.1,
epochs=5,
batch_size=32,
shuffle=True,
verbose=2
)

Реализация модели Pytorch:

Код: Выделить всё

import torch.nn as nn
import torch.nn.functional as F

from sklearn.model_selection import train_test_split

x_train_final, x_val, y_train_final, y_val = train_test_split(
x_train, y_train, test_size=0.1, stratify=y_train, random_state=42
)

train_dataset = torch.utils.data.TensorDataset(torch.tensor(x_train_final), torch.tensor(y_train_final).float())
val_dataset = torch.utils.data.TensorDataset(torch.tensor(x_val), torch.tensor(y_val).float())

train_loader = DataLoader(train_dataset, batch_size=32, shuffle=True)
val_loader = DataLoader(val_dataset, batch_size=32, shuffle=False)

class SimpleCNN(nn.Module):
def __init__(self):
super(SimpleCNN, self).__init__()
self.noise_std = 0.1

self.conv1 = nn.Conv2d(1, 8, kernel_size=3, padding=0)
self.bn1 = nn.BatchNorm2d(8)
self.dropout1 = nn.Dropout(0.5)

self.conv2 = nn.Conv2d(8, 16, kernel_size=3, padding=0)
self.bn2 = nn.BatchNorm2d(16)
self.dropout2 = nn.Dropout(0.5)

self.fc1 = nn.Linear(16 * 5 * 5, 32)  # 28x28 → 26x26 → 13x13 → 11x11 → 5x5
self.bn3 = nn.BatchNorm1d(32)
self.dropout3 = nn.Dropout(0.4)

self.fc2 = nn.Linear(32, 1)

def forward(self, x):
# Add Gaussian Noise manually
if self.training:
noise = torch.randn_like(x) * self.noise_std
x = x + noise

x = self.conv1(x)
x = F.relu(x)
x = self.bn1(x)
x = F.max_pool2d(x, 2)
x = self.dropout1(x)

x = self.conv2(x)
x = F.relu(x)
x = self.bn2(x)
x = F.max_pool2d(x, 2)
x = self.dropout2(x)

x = torch.flatten(x, 1)
x = self.fc1(x)
x = F.relu(x)
x = self.bn3(x)
x = self.dropout3(x)

x = self.fc2(x)
return torch.sigmoid(x)

# Convert numpy arrays to PyTorch tensors
train_tensor = torch.utils.data.TensorDataset(torch.tensor(x_train), torch.tensor(y_train).float())
train_loader = DataLoader(train_tensor, batch_size=32, shuffle=True)
device = torch.device("cuda"  if torch.cuda.is_available() else "cpu")

model = SimpleCNN().to(device)
optimizer = torch.optim.Adam(model.parameters(), lr=0.001, weight_decay=0.01)  # matches Keras regularization
criterion = nn.BCELoss()

for epoch in range(5):
# ---- Training ----
model.train()
running_loss = 0.0
correct = 0
total = 0

for inputs, labels in train_loader:
inputs, labels = inputs.to(device), labels.to(device).unsqueeze(1)
optimizer.zero_grad()
outputs = model(inputs)
loss = criterion(outputs, labels)
loss.backward()
optimizer.step()

running_loss += loss.item() * inputs.size(0)  # multiply by batch size
predicted = (outputs > 0.5).float()
correct += (predicted == labels).sum().item()
total += labels.size(0)

train_loss = running_loss / total
train_acc = correct / total

# ---- Validation ----
model.eval()
val_loss = 0.0
val_correct = 0
val_total = 0

with torch.no_grad():
for inputs, labels in val_loader:
inputs, labels = inputs.to(device), labels.to(device).unsqueeze(1)
outputs = model(inputs)
loss = criterion(outputs, labels)

val_loss += loss.item() * inputs.size(0)
predicted = (outputs > 0.5).float()
val_correct += (predicted == labels).sum().item()
val_total += labels.size(0)

val_loss /= val_total
val_acc = val_correct / val_total

print(f"Epoch {epoch+1}/5 - Train Loss: {train_loss:.4f} - Train Acc: {train_acc:.4f} - Val Loss: {val_loss:.4f} - Val Acc: {val_acc:.4f}")
< /code>
Есть ли что -то, что мне не хватает с точки зрения того, как обрабатывают платформы: < /p>
[list]
 Потеря потерь < /li>
 Пэттерс и поведение с отсева /> [/list]
Любые советы по созданию обучения pytorch

ведут себя более реалистично, как версия кера ?

Подробнее здесь: https://stackoverflow.com/questions/797 ... version-tr

1753786671

Anonymous

 Я внедряю ту же архитектуру CNN для бинарной классификации  на фильтрованной версии набора данных FashionMnist  (COAT VS Pullover) с использованием: 

[*]  pytorch 

pytor Иметь ту же структуру: < /p>
[list]
 2x сверточные слои < /li>
 Список элемента < /li>
 Нормализация пакетов < /li>
 < /li>
 hoome hoome ater>
< /li> < /li> < /li> < /li> < /li> < /li> < /li> < /li> < /li> < /li> < /li> < /li> < /li> < /li> < /li> < /li> < /li> < /li> < /li> < /li> < /li> < /li> < />  С 32 единицами
[*] Окончательный вывод сигмоида
[/list]
Используя кера , я получаю этот результат обучения: 
[code]Epoch 1/5
270/270 - 5s - 18ms/step - accuracy: 0.6794 - loss: 1.1801 - val_accuracy: 0.5042 - val_loss: 1.1561

Epoch 2/5
270/270 - 2s - 6ms/step - accuracy: 0.7513 - loss: 0.8556 - val_accuracy: 0.7010 - val_loss: 0.7886

Epoch 3/5
270/270 - 2s - 6ms/step - accuracy: 0.7752 - loss: 0.6989 - val_accuracy: 0.7927 - val_loss: 0.6180

Epoch 4/5
270/270 - 2s - 6ms/step - accuracy: 0.7971 - loss: 0.5981 - val_accuracy: 0.8344 - val_loss: 0.5222

Epoch 5/5
270/270 - 2s - 6ms/step - accuracy: 0.8065 - loss: 0.5404 - val_accuracy: 0.8021 - val_loss: 0.5670
[/code]
Но с помощью pytorch  модель достигает ~ 100% точности в течение всего 2–3 эпох:
[code]Epoch 1/5 - Train Loss: 0.4841 - Train Acc: 0.7904 - Val Loss: 0.1818 - Val Acc: 1.0000

Epoch 2/5 - Train Loss: 0.0785 - Train Acc: 0.9972 - Val Loss: 0.0257 - Val Acc: 1.0000

Epoch 3/5 - Train Loss: 0.0226 - Train Acc: 1.0000 - Val Loss: 0.0131 - Val Acc: 1.0000

Epoch 4/5 - Train Loss: 0.0141 - Train Acc: 1.0000 - Val Loss: 0.0099 - Val Acc: 1.0000

Epoch 5/5 - Train Loss: 0.0122 - Train Acc: 1.0000 - Val Loss: 0.0092 - Val Acc: 1.0000
< /code>
Я запутался, потому что модели архитектурно идентичны. Тем не менее, Pytorch, кажется, чрезвычайно быстро приполняет. Pytorch [/code]

[*]  использовал bceloss ()  с pytorch  и binary_crossentropy  с керасом  

[*]  Соответствующий выпадающий.  ADAM ) 


[b] Реализация модели керас: [/b] 
[code]import tensorflow as tf
from tensorflow.keras import layers, regularizers

def simple_cnn_model():
model = tf.keras.Sequential([
layers.GaussianNoise(0.1),  #  Adds slight noise to improve robustness

layers.Conv2D(8, (3,3), activation='relu', input_shape=(28,28,1),
kernel_regularizer=regularizers.l2(0.01)),
layers.BatchNormalization(),
layers.MaxPooling2D((2,2)),
layers.Dropout(0.5),  #  Reduced dropout (0.6 → 0.5)

layers.Conv2D(16, (3,3), activation='relu',
kernel_regularizer=regularizers.l2(0.01)),
layers.BatchNormalization(),
layers.MaxPooling2D((2,2)),
layers.Dropout(0.5),  #  Reduced dropout (0.7 → 0.6)

layers.Flatten(),
layers.Dense(32, activation='relu', kernel_regularizer=regularizers.l2(0.01)),
layers.BatchNormalization(),
layers.Dropout(0.4),  #  Less dropout in Dense layer (0.7 → 0.5)

layers.Dense(1, activation='sigmoid')  # 1 neuron for binary classification
])

model.compile(optimizer='adam',
loss='binary_crossentropy',
metrics=['accuracy'])
return model

#  Create and compile model
model = simple_cnn_model()

model=simple_cnn_model()

history = model.fit(
x_train, y_train,
validation_split=0.1,
epochs=5,
batch_size=32,
shuffle=True,
verbose=2
)
[/code]
[b] Реализация модели Pytorch: [/b]
[code]import torch.nn as nn
import torch.nn.functional as F

from sklearn.model_selection import train_test_split

x_train_final, x_val, y_train_final, y_val = train_test_split(
x_train, y_train, test_size=0.1, stratify=y_train, random_state=42
)

train_dataset = torch.utils.data.TensorDataset(torch.tensor(x_train_final), torch.tensor(y_train_final).float())
val_dataset = torch.utils.data.TensorDataset(torch.tensor(x_val), torch.tensor(y_val).float())

train_loader = DataLoader(train_dataset, batch_size=32, shuffle=True)
val_loader = DataLoader(val_dataset, batch_size=32, shuffle=False)

class SimpleCNN(nn.Module):
def __init__(self):
super(SimpleCNN, self).__init__()
self.noise_std = 0.1

self.conv1 = nn.Conv2d(1, 8, kernel_size=3, padding=0)
self.bn1 = nn.BatchNorm2d(8)
self.dropout1 = nn.Dropout(0.5)

self.conv2 = nn.Conv2d(8, 16, kernel_size=3, padding=0)
self.bn2 = nn.BatchNorm2d(16)
self.dropout2 = nn.Dropout(0.5)

self.fc1 = nn.Linear(16 * 5 * 5, 32)  # 28x28 → 26x26 → 13x13 → 11x11 → 5x5
self.bn3 = nn.BatchNorm1d(32)
self.dropout3 = nn.Dropout(0.4)

self.fc2 = nn.Linear(32, 1)

def forward(self, x):
# Add Gaussian Noise manually
if self.training:
noise = torch.randn_like(x) * self.noise_std
x = x + noise

x = self.conv1(x)
x = F.relu(x)
x = self.bn1(x)
x = F.max_pool2d(x, 2)
x = self.dropout1(x)

x = self.conv2(x)
x = F.relu(x)
x = self.bn2(x)
x = F.max_pool2d(x, 2)
x = self.dropout2(x)

x = torch.flatten(x, 1)
x = self.fc1(x)
x = F.relu(x)
x = self.bn3(x)
x = self.dropout3(x)

x = self.fc2(x)
return torch.sigmoid(x)

# Convert numpy arrays to PyTorch tensors
train_tensor = torch.utils.data.TensorDataset(torch.tensor(x_train), torch.tensor(y_train).float())
train_loader = DataLoader(train_tensor, batch_size=32, shuffle=True)
device = torch.device("cuda"  if torch.cuda.is_available() else "cpu")

model = SimpleCNN().to(device)
optimizer = torch.optim.Adam(model.parameters(), lr=0.001, weight_decay=0.01)  # matches Keras regularization
criterion = nn.BCELoss()

for epoch in range(5):
# ---- Training ----
model.train()
running_loss = 0.0
correct = 0
total = 0

for inputs, labels in train_loader:
inputs, labels = inputs.to(device), labels.to(device).unsqueeze(1)
optimizer.zero_grad()
outputs = model(inputs)
loss = criterion(outputs, labels)
loss.backward()
optimizer.step()

running_loss += loss.item() * inputs.size(0)  # multiply by batch size
predicted = (outputs > 0.5).float()
correct += (predicted == labels).sum().item()
total += labels.size(0)

train_loss = running_loss / total
train_acc = correct / total

# ---- Validation ----
model.eval()
val_loss = 0.0
val_correct = 0
val_total = 0

with torch.no_grad():
for inputs, labels in val_loader:
inputs, labels = inputs.to(device), labels.to(device).unsqueeze(1)
outputs = model(inputs)
loss = criterion(outputs, labels)

val_loss += loss.item() * inputs.size(0)
predicted = (outputs > 0.5).float()
val_correct += (predicted == labels).sum().item()
val_total += labels.size(0)

val_loss /= val_total
val_acc = val_correct / val_total

print(f"Epoch {epoch+1}/5 - Train Loss: {train_loss:.4f} - Train Acc: {train_acc:.4f} - Val Loss: {val_loss:.4f} - Val Acc: {val_acc:.4f}")
< /code>
Есть ли что -то, что мне не хватает с точки зрения того, как обрабатывают платформы: < /p>
[list]
 Потеря потерь < /li>
 Пэттерс и поведение с отсева /> [/list]
Любые советы по созданию обучения pytorch [/code] ведут себя более реалистично, как версия кера ? 
 

Подробнее здесь: [url]https://stackoverflow.com/questions/79714403/why-does-my-pytorch-model-reach-100-accuracy-quickly-while-the-keras-version-tr[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Почему моя модель Pytorch быстро достигает 100% точности, в то время как версия Keras тренируется гораздо более постепен

Последнее сообщение Anonymous « 28 июл 2025, 00:07
Добавлено в форуме Python

Anonymous » 28 июл 2025, 00:07 » в форуме Python

Подробнее здесь:

0 Ответы

7 Просмотры

Последнее сообщение Anonymous
28 июл 2025, 00:07
Модель обучения с подкреплением не тренируется на графическом процессоре Pytorch

Последнее сообщение Anonymous « 10 июл 2024, 18:43
Добавлено в форуме Python

Anonymous » 10 июл 2024, 18:43 » в форуме Python

Я настраивал своего агента RL для обучения на графическом процессоре, а не на процессоре обычным способом...
Но мой GeForce RTX 3060 использует 1%, когда я запускаю 4 экземпляра моего агента. Это игра с картой и игроком, который должен собирать очки...

0 Ответы

21 Просмотры

Последнее сообщение Anonymous
10 июл 2024, 18:43
Модель обучения с подкреплением не тренируется на графическом процессоре Pytorch

Последнее сообщение Anonymous « 10 июл 2024, 20:57
Добавлено в форуме Python

Anonymous » 10 июл 2024, 20:57 » в форуме Python

Я настраивал своего агента RL для обучения на графическом процессоре, а не на процессоре обычным способом...
Но мой GeForce RTX 3060 использует 1%, когда я запускаю 4 экземпляра моего агента. Это игра с картой и игроком, который должен собирать очки...

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
10 июл 2024, 20:57
Почему моя модель классификации видео не тренируется?

Последнее сообщение Гость « 14 окт 2023, 12:39
Добавлено в форуме Python

Гость » 14 окт 2023, 12:39 » в форуме Python

Я создаю модель классификации видео, используя данные изображения, текста и аудио, но после того, как я создал свои данные, я попытался обучить их, но модель Cnn показывает ошибку ниже.

# Извлечение функций из аудио импортировать Moviepy.editor...

0 Ответы

26 Просмотры

Последнее сообщение Гость
14 окт 2023, 12:39
Модель преобразователя зрения не тренируется должным образом

Последнее сообщение Anonymous « 13 ноя 2023, 22:41
Добавлено в форуме Python

Anonymous » 13 ноя 2023, 22:41 » в форуме Python

Вот код преобразователя зрения, который я создал с помощью Pytorch. Модель показывает перекрестную энтропию 2,31 и точность около 10%. Это остается неизменным во все эпохи. Следовательно, модель не может обучаться. Пожалуйста, дайте мне знать, что я...

0 Ответы

41 Просмотры

Последнее сообщение Anonymous
13 ноя 2023, 22:41

Вернуться в «Python»