Почему модель CNN пытается классифицировать цветных MNIST? - Цифровое Кемерово

Почему модель CNN пытается классифицировать цветных MNIST? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Почему модель CNN пытается классифицировать цветных MNIST?

Цитата

Сообщение Anonymous » 03 ноя 2024, 13:10

Я пытаюсь классифицировать цветные цифры MNIST с помощью базовой архитектуры CNN на Keras. Вот фрагмент кода, который окрашивает исходный набор данных в красный, зеленый или синий цвет.

Код: Выделить всё

def load_norm_data():
## load basic mnist
(x_train, y_train), (x_test, y_test) = keras.datasets.mnist.load_data()
train_images = np.zeros((*x_train.shape, 3)) # orig shape: (60 000, 28, 28, 1) -> rgb shape: (60 000, 28, 28, 3)
for num in range(x_train.shape[0]):
rgb = np.random.randint(3)
train_images[num, ..., rgb] = x_train[num]/255
return train_images, y_train

if __name__ == '__main__':
ims, labels = load_norm_data()
for num in range(10):
plt.subplot(2, 5, num+1)
plt.imshow(ims[num])
plt.axis('off')

что дает первые пару цифр:
[img]https://i. sstatic.net/T1gIV.png[/img]

Затем я пытаюсь классифицировать этот цветной набор данных в те же 10-значные классы MNIST, чтобы метки не менялись — и все же точность модели падает с 95% для от нецветного MNIST до 30–70% от цветного MNIST, что сильно зависит от инициализации веса... Ниже вы найдете архитектуру указанной модели:

Код: Выделить всё

model = keras.Sequential()
model.add(keras.layers.Conv2D(64, kernel_size=(3,3), padding='same'))
model.add(keras.layers.MaxPool2D(pool_size=(2,2)))
model.add(keras.layers.Conv2D(64, kernel_size=(3,3), padding='same'))
model.add(keras.layers.MaxPool2D(pool_size=(2,2), padding='same'))
model.add(keras.layers.Flatten())
model.add(keras.layers.Dense(10, activation='relu'))
model.add(keras.layers.Softmax())

input_shape = train_images.shape
model.build(input_shape)

model.compile(optimizer='rmsprop', loss='categorical_crossentropy', metrics=['accuracy'])
model.summary()

model.fit(train_images, train_numbers, batch_size=12, epochs=25)

Изначально я думал, что это падение производительности может быть связано с неравномерностью данных (например, представьте, что много троек в данных оказались зелеными, поэтому модель запоминает зеленый = 3). Итак, я проверил данные, показатели хорошие, а распределение RGB для каждого класса также составляет около 33% для каждого цвета. Я также проверил неправильно классифицированные изображения, чтобы увидеть, много ли там представителей определенного цвета или цифры, но, похоже, это тоже не так. В любом случае, после прочтения документации Keras и из-за того, что Conv2D заставляет вас передавать ему двумерный kernel_size, который, как я полагаю, таким образом работает на всех каналах входного изображения, модель должна здесь при классификации я не учитываю цвет.
Я что-то упускаю?

Подробнее здесь: https://stackoverflow.com/questions/729 ... ored-mnist

Реклама

1730628649

Anonymous

Я пытаюсь классифицировать цветные цифры MNIST с помощью базовой архитектуры CNN на Keras. Вот фрагмент кода, который окрашивает исходный набор данных в красный, зеленый или синий цвет.
[code]def load_norm_data():
## load basic mnist
(x_train, y_train), (x_test, y_test) = keras.datasets.mnist.load_data()
train_images = np.zeros((*x_train.shape, 3)) # orig shape: (60 000, 28, 28, 1) -> rgb shape: (60 000, 28, 28, 3)
for num in range(x_train.shape[0]):
rgb = np.random.randint(3)
train_images[num, ..., rgb] = x_train[num]/255
return train_images, y_train

if __name__ == '__main__':
ims, labels = load_norm_data()
for num in range(10):
plt.subplot(2, 5, num+1)
plt.imshow(ims[num])
plt.axis('off')
[/code]
что дает первые пару цифр:
[img]https://i. sstatic.net/T1gIV.png[/img]

Затем я пытаюсь классифицировать этот цветной набор данных в те же 10-значные классы MNIST, чтобы метки не менялись — и все же точность модели падает с 95% для от нецветного MNIST до 30–70% от цветного MNIST, что сильно зависит от инициализации веса... Ниже вы найдете архитектуру указанной модели:
[code]model = keras.Sequential()
model.add(keras.layers.Conv2D(64, kernel_size=(3,3), padding='same'))
model.add(keras.layers.MaxPool2D(pool_size=(2,2)))
model.add(keras.layers.Conv2D(64, kernel_size=(3,3), padding='same'))
model.add(keras.layers.MaxPool2D(pool_size=(2,2), padding='same'))
model.add(keras.layers.Flatten())
model.add(keras.layers.Dense(10, activation='relu'))
model.add(keras.layers.Softmax())

input_shape = train_images.shape
model.build(input_shape)

model.compile(optimizer='rmsprop', loss='categorical_crossentropy', metrics=['accuracy'])
model.summary()

model.fit(train_images, train_numbers, batch_size=12, epochs=25)
[/code]
Изначально я думал, что это падение производительности может быть связано с неравномерностью данных (например, представьте, что много троек в данных оказались зелеными, поэтому модель запоминает зеленый = 3). Итак, я проверил данные, показатели хорошие, а распределение RGB для каждого класса также составляет около 33% для каждого цвета. Я также проверил неправильно классифицированные изображения, чтобы увидеть, много ли там представителей определенного цвета или цифры, но, похоже, это тоже не так. В любом случае, после прочтения документации Keras и из-за того, что Conv2D заставляет вас передавать ему двумерный kernel_size, который, как я полагаю, таким образом работает на всех каналах входного изображения, модель должна здесь при классификации я не учитываю цвет.
Я что-то упускаю? 

Подробнее здесь: [url]https://stackoverflow.com/questions/72965428/why-is-a-cnn-model-struggling-to-classify-a-colored-mnist[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Разница между входной формой для 1D CNN, 2D CNN и 3D CNN

Последнее сообщение Anonymous « 21 июл 2025, 09:35
Добавлено в форуме Python

Anonymous » 21 июл 2025, 09:35 » в форуме Python

Я впервые создаю модель CNN для классификации изображений, и я немного запутался в том, что будет формой ввода для каждого типа (1D CNN, 2D CNN, 3D CNN) и как исправить количество фильтров в слое свертки. Мои данные - 100x100x30, где 30 являются...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
21 июл 2025, 09:35
Сеть не улучшается с помощью PyTorch CNN для расширенного набора данных MNIST

Последнее сообщение Anonymous « 29 дек 2024, 12:30
Добавлено в форуме Python

Anonymous » 29 дек 2024, 12:30 » в форуме Python

Я весь день искал, почему ситуация не улучшается, потери остаются на уровне 4,1 после первых двух партий. Я новичок в PyTorch. Заранее благодарим за любую помощь!
Вот набор данных

key =...

0 Ответы

28 Просмотры

Последнее сообщение Anonymous
29 дек 2024, 12:30
Сеть не улучшается с помощью PyTorch CNN для расширенного набора данных MNIST [закрыто]

Последнее сообщение Anonymous « 29 дек 2024, 14:18
Добавлено в форуме Python

Anonymous » 29 дек 2024, 14:18 » в форуме Python

Я весь день искал, почему ситуация не улучшается, потери остаются на уровне 4,1 после первых двух партий.
Вот набор данных/
key =...

0 Ответы

23 Просмотры

Последнее сообщение Anonymous
29 дек 2024, 14:18
Объединение 1D-CNN и 2D-CNN

Последнее сообщение Anonymous « 29 окт 2024, 03:07
Добавлено в форуме Python

Anonymous » 29 окт 2024, 03:07 » в форуме Python

Я хочу построить объединенную модель CNN, используя 1D и 2D CNN, но я пробовал много способов ее создания, но этот сработал, но я не знаю, почему я получаю эту ошибку при использовании model_combined.summary().
Я приложил два изображения, которые...

0 Ответы

38 Просмотры

Последнее сообщение Anonymous
29 окт 2024, 03:07
Я использую CNN (последовательную модель) для обнаружения глаз. Могу ли я сохранить обученную модель и переобучить ее, н

Последнее сообщение Гость « 29 окт 2023, 09:57
Добавлено в форуме Python

Гость » 29 окт 2023, 09:57 » в форуме Python

Мой графический процессор — Rtx 3050 4 ГБ. Из-за меньшего количества видеопамяти я уменьшил размер пакета, но это все равно занимало слишком много времени, почти 1 час для каждой эпохи. Могу ли я сохранить обученную модель (.h5) и переобучить ее без...

0 Ответы

116 Просмотры

Последнее сообщение Гость
29 окт 2023, 09:57

Вернуться в «Python»

Programmiererforum