Загрузчик данных различной последовательности изображений в одной папке

Загрузчик данных различной последовательности изображений в одной папке ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Загрузчик данных различной последовательности изображений в одной папке

Цитата

Сообщение Anonymous » 30 июл 2024, 13:59

Я занимаюсь генерацией кадров. Для каждого изображения в папке Dataset/train/ (например, 1.png) я создал последовательность из 100 изображений и сохранил их все в один Dataset/frames. /train/ как (1_1.png...1_100.png), вот пример моей структуры папок:
Dataset:
train:
1.png
2.png
3.png
.
.
N.png
frames:
train:
1_1.png
1_2.png
.
.
N_100.png

2_1.png
2_2.png
.
.
N_100.png

Я создал свой собственный загрузчик данных, в котором складываю кадры, сгенерированные как каналы, для формирования последовательности, но моя проблема: я не хочу, чтобы кадры из изображения 2 перекрывались с кадрами из 1, когда создать последовательность. Как обеспечить, чтобы разные кадры не перекрывались?
Вот мой собственный загрузчик данных:

class LevelSetDataset(Dataset):
"""
Dataset object for CNN models
Temporal is defined implicitly
as the number of channels
example:
- X dimension
[H, W, C=number_of_timestap(t)]
- Y dimension
[W, W, C =(t+1)]
"""
def __init__(self, input_image_path:str,
target_image_path:str,
threshold:float=0.5,
num_input_steps:int=3,
num_future_steps:int=1,
image_dimension:int=32,
data_transformations=None,
istraining_mode:bool=True
):

self.input_image_path = input_image_path
self.target_image_path = target_image_path
self.threshold = threshold
self.num_input_steps = num_input_steps
self.num_future_steps = num_future_steps
self.image_dimension = image_dimension
self.data_transformations= data_transformations
self.istraining_mode = istraining_mode

# get a list of input filenames as sort them (e.g. 1.png, 2.png,..,N.png)
input_image_fp = sorted(glob(os.path.join(self.input_image_path , "*")),
key=lambda x: int(os.path.basename(x).split('.')[0])
)

# repeat the input image untill it matches the number of segmentation
# step of the target image
self.input_image_fp = [i for i in input_image_fp for _ in range(100)]

# get a list of the target filenames and sort them by the first id and second
# id after the underscore (e.g. 1_1.png, 1_2,..,N_M.png)
self.target_image_fp= sorted(glob(os.path.join(self.target_image_path , "*")),
key=lambda x: (int(os.path.basename(x).split('_')[0]),
int(os.path.basename(x).split('_')[1].split('.')[0]))
)

# check if in training mode
# to apply transformations
if (self.data_transformations is None) and (self.istraining_mode):
self.data_transformations= torchvision.transforms.Compose([
torchvision.transforms.Resize(size=(self.image_dimension,self.image_dimension),
interpolation=Image.BILINEAR),
torchvision.transforms.RandomHorizontalFlip(p=0.5),
torchvision.transforms.RandomVerticalFlip(p=0.5),
torchvision.transforms.ToTensor()
])

if (self.data_transformations is None) and (not self.istraining_mode):
self.data_transformations== torchvision.transforms.Compose([
torchvision.transforms.Resize(size=(self.image_dimension,self.image_dimension),
interpolation=Image.BILINEAR),
torchvision.transforms.ToTensor()
])

self.transforms = self.data_transformations

def _create_binary_mask(self, x):
x[x>=self.threshold] = 1
x[x

Подробнее здесь: https://stackoverflow.com/questions/653 ... gle-folder

1722337171

Anonymous

Я занимаюсь генерацией кадров.  Для каждого изображения в папке [b]Dataset/train/[/b] (например, 1.png) я создал последовательность из 100 изображений и сохранил их все в один [b]Dataset/frames. /train/[/b] как (1_1.png...1_100.png), вот пример моей структуры папок:
Dataset:
train:
1.png
2.png
3.png
.
.
N.png
frames:
train:
1_1.png
1_2.png
.
.
N_100.png

2_1.png
2_2.png
.
.
N_100.png

Я создал свой собственный загрузчик данных, в котором складываю кадры, сгенерированные как каналы, для формирования последовательности, но моя проблема: я не хочу, чтобы кадры из изображения 2 перекрывались с кадрами из 1, когда создать последовательность. Как обеспечить, чтобы разные кадры не перекрывались?
Вот мой собственный загрузчик данных:

class LevelSetDataset(Dataset):
"""
Dataset object for CNN models
Temporal is defined implicitly
as the number of channels
example:
- X dimension
[H, W, C=number_of_timestap(t)]
- Y dimension
[W, W, C =(t+1)]
"""
def __init__(self, input_image_path:str,
target_image_path:str,
threshold:float=0.5,
num_input_steps:int=3,
num_future_steps:int=1,
image_dimension:int=32,
data_transformations=None,
istraining_mode:bool=True
):

self.input_image_path    = input_image_path
self.target_image_path   = target_image_path
self.threshold           = threshold
self.num_input_steps     = num_input_steps
self.num_future_steps    = num_future_steps
self.image_dimension     = image_dimension
self.data_transformations= data_transformations
self.istraining_mode     = istraining_mode

# get a list of input filenames as sort them (e.g. 1.png, 2.png,..,N.png)
input_image_fp = sorted(glob(os.path.join(self.input_image_path , "*")),
key=lambda x: int(os.path.basename(x).split('.')[0])
)

# repeat the input image untill it matches the number of segmentation
# step of the target image
self.input_image_fp = [i for i in input_image_fp for _ in range(100)]

# get a list of the target filenames and sort them by the first id and second
# id after the underscore (e.g.   1_1.png, 1_2,..,N_M.png)
self.target_image_fp= sorted(glob(os.path.join(self.target_image_path , "*")),
key=lambda x: (int(os.path.basename(x).split('_')[0]),
int(os.path.basename(x).split('_')[1].split('.')[0]))
)

# check if in training mode
# to apply transformations
if (self.data_transformations is None) and (self.istraining_mode):
self.data_transformations= torchvision.transforms.Compose([
torchvision.transforms.Resize(size=(self.image_dimension,self.image_dimension),
interpolation=Image.BILINEAR),
torchvision.transforms.RandomHorizontalFlip(p=0.5),
torchvision.transforms.RandomVerticalFlip(p=0.5),
torchvision.transforms.ToTensor()
])

if (self.data_transformations is None) and (not self.istraining_mode):
self.data_transformations== torchvision.transforms.Compose([
torchvision.transforms.Resize(size=(self.image_dimension,self.image_dimension),
interpolation=Image.BILINEAR),
torchvision.transforms.ToTensor()
])

self.transforms = self.data_transformations

def _create_binary_mask(self, x):
x[x>=self.threshold] = 1
x[x 

Подробнее здесь: [url]https://stackoverflow.com/questions/65377998/dataloader-of-different-sequence-of-images-in-a-single-folder[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Использование последовательности различной длины в качестве входной фигуры

Последнее сообщение Anonymous « 28 ноя 2024, 22:29
Добавлено в форуме Python

Anonymous » 28 ноя 2024, 22:29 » в форуме Python

В качестве примера, моя форма данных (100, 27, 1000), где 100 — количество выборок, 27 — длина всей последовательности данных, а 1000 — количество объектов.
Я хочу используйте RNN для обучения данных, но для входной формы в модели RNN я хочу, чтобы...

0 Ответы

7 Просмотры

Последнее сообщение Anonymous
28 ноя 2024, 22:29
Почему мой многопоточный загрузчик сокетов на основе Python работает медленнее, чем мой многопоточный загрузчик, использ

Последнее сообщение Гость « 01 мар 2024, 10:12
Добавлено в форуме Python

Гость » 01 мар 2024, 10:12 » в форуме Python

Я пытаюсь реализовать многопоточный загрузчик сокетов (с прокси-сервером), но он намного медленнее, чем я ожидал. Поэтому я пытаюсь реализовать это другим способом (запросами). Это быстрее, чем сокет, интересно, почему? Какая причина этого? Какую...

0 Ответы

115 Просмотры

Последнее сообщение Гость
01 мар 2024, 10:12
Файл .htaccess, чтобы разрешить доступ к папке изображений для просмотра изображений?

Последнее сообщение Anonymous « 24 ноя 2024, 12:51
Добавлено в форуме Php

Anonymous » 24 ноя 2024, 12:51 » в форуме Php

У меня есть папка с изображениями по следующему URL-адресу.

www.mysite.com/uploads/

На другой странице:

www.mysite.com/search.php/

Я пытаюсь получить доступ к изображениям, на которых есть правильная ссылка на тег, однако получаю:...

0 Ответы

67 Просмотры

Последнее сообщение Anonymous
24 ноя 2024, 12:51
Laravel – как использовать Uppy для загрузки изображений и сохранения изображений в папке на моем сервере

Последнее сообщение Anonymous « 26 ноя 2024, 12:05
Добавлено в форуме Php

Anonymous » 26 ноя 2024, 12:05 » в форуме Php

У меня есть проект с загрузкой изображений, и я использую для этого Uppy. Загруженное изображение сохраняется в скрытой форме ввода, как показано ниже;

Я пытаюсь получить изображение из URL-адреса при вводе скрытой формы, но у меня возникают...

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
26 ноя 2024, 12:05
Определите, какие элементы последовательности A можно использовать для создания данной последовательности B за линейное

Последнее сообщение Anonymous « 08 июл 2024, 22:37
Добавлено в форуме C++

Anonymous » 08 июл 2024, 22:37 » в форуме C++

Предположим, у нас есть последовательность A и подпоследовательность A, называемая B. Мне нужно определить, какие элементы последовательности A потенциально могут быть использованы для построения подпоследовательности B.
Например, предположим, что A...

0 Ответы

31 Просмотры

Последнее сообщение Anonymous
08 июл 2024, 22:37

Вернуться в «Python»