Почему моя модель, обученная MNIST, неправильно классифицирует пользовательское изображение в Python? - Цифровое Кемерово

Почему моя модель, обученная MNIST, неправильно классифицирует пользовательское изображение в Python? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Почему моя модель, обученная MNIST, неправильно классифицирует пользовательское изображение в Python?

Цитата

Сообщение Anonymous » 02 дек 2024, 11:03

Я обучил модель нейронной сети с использованием набора данных MNIST распознаванию рукописных цифр. Модель достигает точности 97 % на тестовом наборе MNIST, но не может правильно предсказать цифры из пользовательского файла изображения. Например, изображение ниже содержит цифру 8, но прогноз модели всегда неверен.
Что я делаю неправильно на этапе предварительной обработки и как мне правильно подготовить пользовательские изображения к соответствовать формату данных MNIST?
import cv2
import numpy as np
import os
from keras.api.datasets import mnist
from keras.api.models import Sequential
from keras.api.layers import Dense, Flatten
from keras.api.utils import to_categorical
from PIL import Image

# Load the MNIST dataset
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()

# Converts mnist data set from uint8 to float32, because most deep learning frameworks expect input data to be in floating-point format.
train_images = train_images.astype('float32') / 255
test_images = test_images.astype('float32') / 255

# Adds a new channel dimension resulting in a shape of (num_samples, 28, 28, 1)
train_images = np.expand_dims(train_images, axis=-1)
test_images = np.expand_dims(test_images, axis=-1)

# One-hot encode the labels
train_labels = to_categorical(train_labels)
test_labels = to_categorical(test_labels)

# Build the model
model = Sequential([
Flatten(input_shape=(28, 28, 1)),
Dense(128, activation='relu'),
Dense(10, activation='softmax')
])

# Compile the model
model.compile(optimizer='adam',
loss='categorical_crossentropy',
metrics=['accuracy'])

# Train the model
print("Training the model...")
model.fit(train_images, train_labels, epochs=5, batch_size=128)

# Evaluate the model
loss, accuracy = model.evaluate(test_images, test_labels, verbose=0)
print(f"Test Accuracy: {accuracy * 100:.2f}%")

# Load an image for prediction
image_path = 'digit.png' # Replace with your image path
print(f"Loading and predicting for {image_path}...")

try:
# Read the image in grayscale
image = cv2.imread(image_path, cv2.IMREAD_GRAYSCALE)

if image is None:
raise IOError(f"Error loading image at {image_path}")

# Resize the image to 28x28
image = cv2.resize(image, (28, 28))

# Invert the colors (if needed)
image = cv2.bitwise_not(image)

# Normalize the image
image_normalized = image.astype('float32') / 255

# Convert to a format that can be saved as PNG (values 0 to 255)
image_for_saving = (image_normalized * 255).astype(np.uint8)

# Define the path for saving the image
preprocessed_image_path = "preprocessed_digit.png"

# Ensure the directory exists (current directory)
output_directory = os.path.dirname(preprocessed_image_path)
if not os.path.exists(output_directory) and output_directory != '':
os.makedirs(output_directory)

# Save the image using PIL
pil_image = Image.fromarray(image_for_saving)
pil_image.save(preprocessed_image_path)
print(f"Saved preprocessed image to {preprocessed_image_path}")

# Predict the digit using your model (assuming model is already loaded)
# Reshape image to model input format if necessary
image_input = np.expand_dims(image_normalized, axis=0)
image_input = np.expand_dims(image_input, axis=-1)
prediction = np.argmax(model.predict(image_input))
print("Predicted Digit:", prediction)

except Exception as e:
print(f"Error processing the image: {e}")

Подробнее здесь: https://stackoverflow.com/questions/792 ... -in-python

Реклама

1733126599

Anonymous

Я обучил модель нейронной сети с использованием набора данных MNIST распознаванию рукописных цифр. Модель достигает точности 97 % на тестовом наборе MNIST, но не может правильно предсказать цифры из пользовательского файла изображения. Например, изображение ниже содержит цифру 8, но прогноз модели всегда неверен.
Что я делаю неправильно на этапе предварительной обработки и как мне правильно подготовить пользовательские изображения к соответствовать формату данных MNIST?
import cv2
import numpy as np
import os
from keras.api.datasets import mnist
from keras.api.models import Sequential
from keras.api.layers import Dense, Flatten
from keras.api.utils import to_categorical
from PIL import Image

# Load the MNIST dataset
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()

# Converts mnist data set from uint8 to float32, because most deep learning frameworks expect input data to be in floating-point format.
train_images = train_images.astype('float32') / 255
test_images = test_images.astype('float32') / 255

# Adds a new channel dimension resulting in a shape of (num_samples, 28, 28, 1)
train_images = np.expand_dims(train_images, axis=-1)
test_images = np.expand_dims(test_images, axis=-1)

# One-hot encode the labels
train_labels = to_categorical(train_labels)
test_labels = to_categorical(test_labels)

# Build the model
model = Sequential([
Flatten(input_shape=(28, 28, 1)),
Dense(128, activation='relu'),
Dense(10, activation='softmax')
])

# Compile the model
model.compile(optimizer='adam',
loss='categorical_crossentropy',
metrics=['accuracy'])

# Train the model
print("Training the model...")
model.fit(train_images, train_labels, epochs=5, batch_size=128)

# Evaluate the model
loss, accuracy = model.evaluate(test_images, test_labels, verbose=0)
print(f"Test Accuracy: {accuracy * 100:.2f}%")

# Load an image for prediction
image_path = 'digit.png'  # Replace with your image path
print(f"Loading and predicting for {image_path}...")

try:
# Read the image in grayscale
image = cv2.imread(image_path, cv2.IMREAD_GRAYSCALE)

if image is None:
raise IOError(f"Error loading image at {image_path}")

# Resize the image to 28x28
image = cv2.resize(image, (28, 28))

# Invert the colors (if needed)
image = cv2.bitwise_not(image)

# Normalize the image
image_normalized = image.astype('float32') / 255

# Convert to a format that can be saved as PNG (values 0 to 255)
image_for_saving = (image_normalized * 255).astype(np.uint8)

# Define the path for saving the image
preprocessed_image_path = "preprocessed_digit.png"

# Ensure the directory exists (current directory)
output_directory = os.path.dirname(preprocessed_image_path)
if not os.path.exists(output_directory) and output_directory != '':
os.makedirs(output_directory)

# Save the image using PIL
pil_image = Image.fromarray(image_for_saving)
pil_image.save(preprocessed_image_path)
print(f"Saved preprocessed image to {preprocessed_image_path}")

# Predict the digit using your model (assuming model is already loaded)
# Reshape image to model input format if necessary
image_input = np.expand_dims(image_normalized, axis=0)
image_input = np.expand_dims(image_input, axis=-1)
prediction = np.argmax(model.predict(image_input))
print("Predicted Digit:", prediction)

except Exception as e:
print(f"Error processing the image: {e}")
 

Подробнее здесь: [url]https://stackoverflow.com/questions/79243340/why-is-my-mnist-trained-model-misclassifying-a-custom-image-in-python[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Почему моя модель, обученная MNIST, неправильно классифицирует пользовательское изображение в Python?

Последнее сообщение Anonymous « 02 дек 2024, 14:37
Добавлено в форуме Python

Anonymous » 02 дек 2024, 14:37 » в форуме Python

Я обучил модель нейронной сети с использованием набора данных MNIST распознаванию рукописных цифр. Модель достигает точности 97 % на тестовом наборе MNIST, но не может правильно предсказать цифры из пользовательского файла изображения. Например,...

0 Ответы

12 Просмотры

Последнее сообщение Anonymous
02 дек 2024, 14:37
Почему моя модель, обученная MNIST, неправильно классифицирует пользовательское изображение?

Последнее сообщение Anonymous « 03 дек 2024, 03:22
Добавлено в форуме Python

Anonymous » 03 дек 2024, 03:22 » в форуме Python

Я обучил модель нейронной сети с использованием набора данных MNIST распознаванию рукописных цифр. Модель достигает точности 97 % на тестовом наборе MNIST, но не может правильно предсказать цифры из пользовательского файла изображения. Например,...

0 Ответы

13 Просмотры

Последнее сообщение Anonymous
03 дек 2024, 03:22
TensorFlow - обученная модель всегда неправильно, на изображении он обучался

Последнее сообщение Anonymous « 25 апр 2025, 15:45
Добавлено в форуме Python

Anonymous » 25 апр 2025, 15:45 » в форуме Python

Я в настоящее время изучаю Tensorflow.
, и лучший способ сделать это - это испачкать руки. ?
root_dir = ./images
read_files = os.path.join(root_dir)
file_names = os.listdir(read_files)
data_pok = {}

def build_image_labels():
data = pd.read_csv(...

0 Ответы

6 Просмотры

Последнее сообщение Anonymous
25 апр 2025, 15:45
Почему клип неправильно классифицирует мой объект, ориентированный на взгляд?

Последнее сообщение Anonymous « 04 сен 2025, 00:11
Добавлено в форуме Python

Anonymous » 04 сен 2025, 00:11 » в форуме Python

проблема клипа
Я готовлю набор данных AR Haze и хочу пометить объект, на который просматривает пользователь. Глобальная метка сцены из клипа является разумной (например, «коридор»), но когда я пытаюсь сделать клип, обратите внимание на точку...

0 Ответы

0 Просмотры

Последнее сообщение Anonymous
04 сен 2025, 00:11
Модель всегда классифицирует изображения как кошек с высокой уверенностью, несмотря на настройку гиперпараметров

Последнее сообщение Anonymous « 10 ноя 2024, 03:01
Добавлено в форуме Python

Anonymous » 10 ноя 2024, 03:01 » в форуме Python

Я пытаюсь обучить модель на изображениях, используя приведенный ниже код. Моя структура каталогов следующая:

Папка PetImages размером примерно 1 ГБ расположена рядом с моим файлом main.py скрипт.
Внутри папки PetImages есть две подпапки: Cats и...

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
10 ноя 2024, 03:01

Вернуться в «Python»

Programmiererforum