Проблемы с созданием пользовательского набора данных TensorFlow с использованием аннотаций и изображений COCO

Проблемы с созданием пользовательского набора данных TensorFlow с использованием аннотаций и изображений COCO ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Проблемы с созданием пользовательского набора данных TensorFlow с использованием аннотаций и изображений COCO

Цитата

Сообщение Anonymous » 21 окт 2024, 09:33

Я загрузил набор данных Coco 2017, и все файлы (аннотации, обучение, проверка и т. д.) доступны. Чтобы создать набор данных для обучения моей модели тензорного потока, я написал класс CocoDataset.

Код: Выделить всё

class CocoDataset:
def __init__(self, annotation_file, image_dir):
self.coco = COCO(annotation_file)
self.image_dir = image_dir
self.img_ids = list(self.coco.imgs.keys())

def load_image_and_annotations(self, image_id):
# Load image metadata
img_data = self.coco.loadImgs(image_id)[0]
img_path = os.path.join(self.image_dir, img_data["file_name"])
#tf.print("Loaded image data:", img_path)

# Read and decode image
img = tf.io.read_file(img_path)
img = tf.image.decode_jpeg(img, channels=3)

# Original image dimensions
original_height = img_data['height']
original_width = img_data['width']

# Resize image to 640x640
img = tf.image.resize(img, [640, 640])

# Calculate resize ratios
x_ratio = 640 / original_width
y_ratio = 640 / original_height

# Get the annotations (e.g., bounding boxes)
annotation_ids = self.coco.getAnnIds(imgIds=image_id)
annotations = self.coco.loadAnns(annotation_ids)

bboxes, masks, categories = [], [], []

for ann in annotations:
# Add bounding boxes
if "bbox" in ann:
xmin, ymin, width, height = ann["bbox"][0]*x_ratio, ann["bbox"][1]*y_ratio, ann["bbox"][2]*x_ratio, ann["bbox"][3]*y_ratio
if width == 0:
width = 1
if height == 0:
height = 1
bbox = [xmin, ymin, xmin + width, ymin + height]
bboxes.append(bbox)

# Add labels (category_id)
categories.append(ann["category_id"])

# Add masks (convert to binary masks using pycocotools)
if "segmentation"  in ann:
mask = self.coco.annToMask(ann)
mask = tf.image.resize(tf.convert_to_tensor(mask, dtype=tf.float32), [640, 640])
masks.append(mask)

# Convert lists to tensors
bboxes = tf.convert_to_tensor(bboxes, dtype=tf.float32)  # Shape: (num_boxes, 4)
masks = tf.convert_to_tensor(masks, dtype=tf.float32) if masks else tf.zeros((0, 640, 640))  # Shape: (num_boxes, 640, 640)
categories = tf.convert_to_tensor(categories, dtype=tf.int32)  # Shape: (num_boxes,)

return img, bboxes, masks, categories

def tf_load_image_and_annotations(self, image_id):
tf.print(image_id) # for debugging
return tf.py_function(self.load_image_and_annotations, [image_id], [tf.float32, tf.float32, tf.float32, tf.int32])

def get_dataset(self, batch_size=4, shuffle_buffer_size=1000):
# Create a tf.data.Dataset
dataset = tf.data.Dataset.from_tensor_slices(self.img_ids)

# Map image IDs to images and annotations
dataset = dataset.map(self.tf_load_image_and_annotations, num_parallel_calls=tf.data.AUTOTUNE)

# Shuffle, batch, and prefetch the data
dataset = dataset.shuffle(shuffle_buffer_size).batch(batch_size).prefetch(tf.data.AUTOTUNE)
return dataset

def get_size(self):
return len(self.img_ids)

Класс вызывается (и создается набор данных) с помощью кода

Код: Выделить всё

coco_dataset = CocoDataset(val_ann_file, val_img_dir)
dataset = coco_dataset.get_dataset()

который загружает аннотации в память и создает индекс.
Когда я хочу просмотреть содержимое первого пакета с помощью следующего кода

Код: Выделить всё

for batch in dataset.take(1):
images, bboxes, masks, categories = batch
print(images.shape)      # Expecting (batch_size, 640, 640, 3)
print(bboxes.shape)      # Expecting (batch_size, num_boxes, 4)
print(masks.shape)       # Expecting (batch_size, num_boxes, 640, 640)
print(categories.shape)   # Expecting (batch_size, num_boxes)

Я вижу результат (идентификатор изображения создан с помощью tf.print(image_id))

Код: Выделить всё

37777
6818
480985
.
.
.
522713
181666
2024-10-20 21:57:00.980492: W tensorflow/core/framework/op_kernel.cc:1827] INVALID_ARGUMENT: TypeError: Cannot iterate over a scalar tensor.
Traceback (most recent call last):

Чего я действительно не понимаю, так это сообщения об ошибке «Невозможно выполнить итерацию по скалярному тензору». У меня такое впечатление, что код в load_image_and_annotations(self, image_id) не выполняется, но, к сожалению, я не могу решить проблему самостоятельно. Буду очень благодарен за любую помощь, предложения и пояснения!

Подробнее здесь: https://stackoverflow.com/questions/791 ... and-images

1729492438

Anonymous

Я загрузил набор данных Coco 2017, и все файлы (аннотации, обучение, проверка и т. д.) доступны.  Чтобы создать набор данных для обучения моей модели тензорного потока, я написал класс CocoDataset.
[code]class CocoDataset:
def __init__(self, annotation_file, image_dir):
self.coco = COCO(annotation_file)
self.image_dir = image_dir
self.img_ids = list(self.coco.imgs.keys())

def load_image_and_annotations(self, image_id):
# Load image metadata
img_data = self.coco.loadImgs(image_id)[0]
img_path = os.path.join(self.image_dir, img_data["file_name"])
#tf.print("Loaded image data:", img_path)

# Read and decode image
img = tf.io.read_file(img_path)
img = tf.image.decode_jpeg(img, channels=3)

# Original image dimensions
original_height = img_data['height']
original_width = img_data['width']

# Resize image to 640x640
img = tf.image.resize(img, [640, 640])

# Calculate resize ratios
x_ratio = 640 / original_width
y_ratio = 640 / original_height

# Get the annotations (e.g., bounding boxes)
annotation_ids = self.coco.getAnnIds(imgIds=image_id)
annotations = self.coco.loadAnns(annotation_ids)

bboxes, masks, categories = [], [], []

for ann in annotations:
# Add bounding boxes
if "bbox" in ann:
xmin, ymin, width, height = ann["bbox"][0]*x_ratio, ann["bbox"][1]*y_ratio, ann["bbox"][2]*x_ratio, ann["bbox"][3]*y_ratio
if width == 0:
width = 1
if height == 0:
height = 1
bbox = [xmin, ymin, xmin + width, ymin + height]
bboxes.append(bbox)

# Add labels (category_id)
categories.append(ann["category_id"])

# Add masks (convert to binary masks using pycocotools)
if "segmentation"  in ann:
mask = self.coco.annToMask(ann)
mask = tf.image.resize(tf.convert_to_tensor(mask, dtype=tf.float32), [640, 640])
masks.append(mask)

# Convert lists to tensors
bboxes = tf.convert_to_tensor(bboxes, dtype=tf.float32)  # Shape: (num_boxes, 4)
masks = tf.convert_to_tensor(masks, dtype=tf.float32) if masks else tf.zeros((0, 640, 640))  # Shape: (num_boxes, 640, 640)
categories = tf.convert_to_tensor(categories, dtype=tf.int32)  # Shape: (num_boxes,)

return img, bboxes, masks, categories

def tf_load_image_and_annotations(self, image_id):
tf.print(image_id) # for debugging
return tf.py_function(self.load_image_and_annotations, [image_id], [tf.float32, tf.float32, tf.float32, tf.int32])

def get_dataset(self, batch_size=4, shuffle_buffer_size=1000):
# Create a tf.data.Dataset
dataset = tf.data.Dataset.from_tensor_slices(self.img_ids)

# Map image IDs to images and annotations
dataset = dataset.map(self.tf_load_image_and_annotations, num_parallel_calls=tf.data.AUTOTUNE)

# Shuffle, batch, and prefetch the data
dataset = dataset.shuffle(shuffle_buffer_size).batch(batch_size).prefetch(tf.data.AUTOTUNE)
return dataset

def get_size(self):
return len(self.img_ids)
[/code]
Класс вызывается (и создается набор данных) с помощью кода
[code]coco_dataset = CocoDataset(val_ann_file, val_img_dir)
dataset = coco_dataset.get_dataset()
[/code]
который загружает аннотации в память и создает индекс.
Когда я хочу просмотреть содержимое первого пакета с помощью следующего кода
[code]for batch in dataset.take(1):
images, bboxes, masks, categories = batch
print(images.shape)      # Expecting (batch_size, 640, 640, 3)
print(bboxes.shape)      # Expecting (batch_size, num_boxes, 4)
print(masks.shape)       # Expecting (batch_size, num_boxes, 640, 640)
print(categories.shape)   # Expecting (batch_size, num_boxes)
[/code]
Я вижу результат (идентификатор изображения создан с помощью tf.print(image_id))
[code]37777
6818
480985
.
.
.
522713
181666
2024-10-20 21:57:00.980492: W tensorflow/core/framework/op_kernel.cc:1827] INVALID_ARGUMENT: TypeError: Cannot iterate over a scalar tensor.
Traceback (most recent call last):
[/code]
Чего я действительно не понимаю, так это сообщения об ошибке «Невозможно выполнить итерацию по скалярному тензору». У меня такое впечатление, что код в load_image_and_annotations(self, image_id) не выполняется, но, к сожалению, я не могу решить проблему самостоятельно. Буду очень благодарен за любую помощь, предложения и пояснения! 

Подробнее здесь: [url]https://stackoverflow.com/questions/79108811/trouble-creating-a-custom-tensorflow-dataset-using-coco-annotations-and-images[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Чтение пользовательского набора данных COCO для точной настройки

Последнее сообщение Гость « 22 сен 2023, 10:55
Добавлено в форуме Python

Гость » 22 сен 2023, 10:55 » в форуме Python

У меня есть задача по обнаружению объектов, для которой я подготовил изображения и аннотации*. Изображения (PNG) хранятся в той же папке, где хранятся аннотации COCO json. В аннотациях json используется формат COCO для обнаружения объектов:

info...

0 Ответы

37 Просмотры

Последнее сообщение Гость
22 сен 2023, 10:55
Загрузка набора данных COCO для конкретной задачи и класса

Последнее сообщение Anonymous « 02 окт 2024, 17:00
Добавлено в форуме Python

Anonymous » 02 окт 2024, 17:00 » в форуме Python

Как загрузить набор данных COCO для определенного класса и задачи? Я также хочу ограничить загрузку определенным количеством изображений. Ранее я пытался сделать это, используя файл аннотаций, представленный в этом репозитории GitHub: но в конечном...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
02 окт 2024, 17:00
Функциональная программа для обнаружения объектов с помощью TensorFlow с использованием пользовательского набора данных.

Последнее сообщение Anonymous « 04 окт 2024, 12:53
Добавлено в форуме Python

Anonymous » 04 окт 2024, 12:53 » в форуме Python

Некоторое время я пытался обучить модель с помощью TF обнаружению объектов.
Я перепробовал все, что мог найти в Интернете, учебные пособия, блоги, видео, ChatGPT, все, но Мне так и не удалось получить эту чертову программу.
Каждый раз проблема...

0 Ответы

29 Просмотры

Последнее сообщение Anonymous
04 окт 2024, 12:53
Попытка использовать более быстрый R-CNN, предварительно проведенный на CoCo на наборе данных Pascal VOC, но проблема с

Последнее сообщение Anonymous « 28 апр 2025, 18:40
Добавлено в форуме Python

Anonymous » 28 апр 2025, 18:40 » в форуме Python

Я хотел бы услышать от вас некоторые советы. Для контекста, я просто студент биологии с некоторыми классами кодирования/ИИ, что означает, что я кодирует путем патч -обработки, управляет контентом, содержащимся на форумах с поддержкой ИИ. Я...

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
28 апр 2025, 18:40
Augly не может увеличить набор данных COCO

Последнее сообщение Anonymous « 01 июл 2025, 01:04
Добавлено в форуме Python

Anonymous » 01 июл 2025, 01:04 » в форуме Python

У меня есть изображение, которое я хочу увеличить. Его разрешение - 8192x4230. Я назвал его этим инструментом и экспортировал аннотации в формате Coco. Теперь мне нужно передать это изображение и аннотации в функции Augly, но когда я это делаю, оно...

0 Ответы

2 Просмотры

Последнее сообщение Anonymous
01 июл 2025, 01:04

Вернуться в «Python»