Как применить увеличение изображения в конвейере TensorFlow для большого набора данных? - Цифровое Кемерово

Как применить увеличение изображения в конвейере TensorFlow для большого набора данных? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Как применить увеличение изображения в конвейере TensorFlow для большого набора данных?

Цитата

Сообщение Anonymous » 31 июл 2024, 20:13

У меня есть набор изображений, каждое из которых содержит слово длиной от 1 до 5 букв. Я хочу использовать глубокое обучение для классификации символов, составляющих слово на каждом изображении. Ярлыки этих изображений имеют следующий формат:

Код: Выделить всё

totalcharacter_indexoffirstchar_indexofsecondchar_.._indexoflastchar

Я пытаюсь загрузить эти изображения в конвейеры TensorFlow, чтобы уменьшить сложность из-за ограничений памяти. Ниже приведен мой код для загрузки и обработки изображений и меток из каталога:

Код: Выделить всё

def process_img(file_path):
label = get_label(file_path)
image = tf.io.read_file(file_path)
image = tf.image.decode_png(image, channels=1)
image = tf.image.convert_image_dtype(image, tf.float32)
target_shape = [695, 1204]
image = tf.image.resize_with_crop_or_pad(image, target_shape[0], target_shape[1])

# Encode the label
encoded_label = tf.py_function(func=encode_label, inp=[label], Tout=tf.float32)
encoded_label.set_shape([5, len(urdu_alphabets)])

return image, encoded_label

train_ds = train_ds.map(process_img, num_parallel_calls=tf.data.experimental.AUTOTUNE)
test_ds = test_ds.map(process_img, num_parallel_calls=tf.data.experimental.AUTOTUNE)
test_ds = test_ds.batch(32)
train_ds = train_ds.cache()
test_ds = test_ds.cache()
train_ds = train_ds.shuffle(len(train_ds))
test_ds = test_ds.prefetch(tf.data.AUTOTUNE)
print(train_ds)
print(test_ds)

train_ds выглядит следующим образом:

Код: Выделить всё

Теперь я хочу применить к изображениям простые дополнения, такие как вращение, сдвиг, эрозия и расширение. Первоначально я использовал следующую функцию:

Код: Выделить всё

def augment(image, label):
image = tf.image.random_flip_left_right(image)
image = tf.image.random_flip_up_down(image)
image = tf.keras.preprocessing.image.random_rotation(image, rg=15, row_axis=0, col_axis=1, channel_axis=2, fill_mode='nearest', cval=0.0, interpolation_order=1)
image = tf.image.random_zoom(image, [0.85, 0.85])
image = tf.image.random_shear(image, 0.3)
image = tf.image.random_shift(image, 0.1, 0.1)
return image, label

train_augmented_ds = train_ds.map(augment, num_parallel_calls=tf.data.AUTOTUNE)
train_augmented_ds = train_augmented_ds.prefetch(buffer_size=tf.data.AUTOTUNE)

Однако многие из этих функций в tf.image устарели. Как я могу эффективно применить эти дополнения к изображениям в конвейере TensorFlow?
Примечание. Я могу выполнить эти дополнения, загружая изображения без конвейеров TensorFlow с использованием массивов NumPy, но мой набор данных очень большой (1,1 миллиона изображений), поэтому мне нужен эффективный способ сделать это.
Буду благодарен за вашу помощь. Спасибо!

Подробнее здесь: https://stackoverflow.com/questions/788 ... ge-dataset

Реклама

1722446014

Anonymous

У меня есть набор изображений, каждое из которых содержит слово длиной от 1 до 5 букв. Я хочу использовать глубокое обучение для классификации символов, составляющих слово на каждом изображении. Ярлыки этих изображений имеют следующий формат:
[code]totalcharacter_indexoffirstchar_indexofsecondchar_.._indexoflastchar[/code]
Я пытаюсь загрузить эти изображения в конвейеры TensorFlow, чтобы уменьшить сложность из-за ограничений памяти. Ниже приведен мой код для загрузки и обработки изображений и меток из каталога:
[code]def process_img(file_path):
label = get_label(file_path)
image = tf.io.read_file(file_path)
image = tf.image.decode_png(image, channels=1)
image = tf.image.convert_image_dtype(image, tf.float32)
target_shape = [695, 1204]
image = tf.image.resize_with_crop_or_pad(image, target_shape[0], target_shape[1])

# Encode the label
encoded_label = tf.py_function(func=encode_label, inp=[label], Tout=tf.float32)
encoded_label.set_shape([5, len(urdu_alphabets)])

return image, encoded_label

train_ds = train_ds.map(process_img, num_parallel_calls=tf.data.experimental.AUTOTUNE)
test_ds = test_ds.map(process_img, num_parallel_calls=tf.data.experimental.AUTOTUNE)
test_ds = test_ds.batch(32)
train_ds = train_ds.cache()
test_ds = test_ds.cache()
train_ds = train_ds.shuffle(len(train_ds))
test_ds = test_ds.prefetch(tf.data.AUTOTUNE)
print(train_ds)
print(test_ds)
[/code]
train_ds выглядит следующим образом:
[code][/code]
Теперь я хочу применить к изображениям простые дополнения, такие как вращение, сдвиг, эрозия и расширение. Первоначально я использовал следующую функцию:
[code]def augment(image, label):
image = tf.image.random_flip_left_right(image)
image = tf.image.random_flip_up_down(image)
image = tf.keras.preprocessing.image.random_rotation(image, rg=15, row_axis=0, col_axis=1, channel_axis=2, fill_mode='nearest', cval=0.0, interpolation_order=1)
image = tf.image.random_zoom(image, [0.85, 0.85])
image = tf.image.random_shear(image, 0.3)
image = tf.image.random_shift(image, 0.1, 0.1)
return image, label

train_augmented_ds = train_ds.map(augment, num_parallel_calls=tf.data.AUTOTUNE)
train_augmented_ds = train_augmented_ds.prefetch(buffer_size=tf.data.AUTOTUNE)
[/code]
Однако многие из этих функций в tf.image устарели. Как я могу эффективно применить эти дополнения к изображениям в конвейере TensorFlow?
Примечание. Я могу выполнить эти дополнения, загружая изображения без конвейеров TensorFlow с использованием массивов NumPy, но мой набор данных очень большой (1,1 миллиона изображений), поэтому мне нужен эффективный способ сделать это.
Буду благодарен за вашу помощь. Спасибо! 

Подробнее здесь: [url]https://stackoverflow.com/questions/78816835/how-to-apply-image-augmentations-in-tensorflow-pipeline-for-large-dataset[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как применить разные фильтры для каждого поля yField в конвейере агрегации MongoDB в Blazor WASM?

Последнее сообщение Anonymous « 03 дек 2024, 21:51
Добавлено в форуме C#

Anonymous » 03 дек 2024, 21:51 » в форуме C#

Я создаю приложение Blazor WASM, которое генерирует диаграммы с использованием MongoDB. Моя текущая реализация объединяет данные из коллекции MongoDB и поддерживает несколько значений yField для группировки и агрегирования.
Текущий код работает для...

0 Ответы

24 Просмотры

Последнее сообщение Anonymous
03 дек 2024, 21:51
Как применить разные фильтры для каждого поля yField в конвейере агрегации MongoDB в Blazor WASM?

Последнее сообщение Anonymous « 04 дек 2024, 01:06
Добавлено в форуме C#

Anonymous » 04 дек 2024, 01:06 » в форуме C#

Я создаю приложение Blazor WASM, которое генерирует диаграммы с использованием MongoDB. Моя текущая реализация объединяет данные из коллекции MongoDB и поддерживает несколько значений yField для группировки и агрегирования.
Текущий код работает для...

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
04 дек 2024, 01:06
Ошибка в конвейере увеличения изображения для увеличения изображения в Python

Последнее сообщение Anonymous « 18 окт 2024, 02:31
Добавлено в форуме Python

Anonymous » 18 окт 2024, 02:31 » в форуме Python

Насколько мне известно, путь правильный, и я также следую документации Augmentor.

Код:

import Augmentor
import os
import warnings
warnings.filterwarnings('ignore')
import keras
import glob

for img in glob.glob(...

0 Ответы

29 Просмотры

Последнее сообщение Anonymous
18 окт 2024, 02:31
Запрос по перекрестной базе данных большого набора данных в приложении .NET Консоли

Последнее сообщение Anonymous « 21 авг 2025, 15:37
Добавлено в форуме C#

Anonymous » 21 авг 2025, 15:37 » в форуме C#

Я работаю над проектом, где мне нужно объединить данные из двух различных баз данных на одном и том же сервере. Я использую библиотеку System.data.sqlclient , используя SQLConnection и sqlcommand .
Я получил так далеко, что в том, чтобы получить...

0 Ответы

2 Просмотры

Последнее сообщение Anonymous
21 авг 2025, 15:37
Тайм-ауты Laravel Job при потоковой передаче большого файла из S3 в Cloudflare R2, несмотря на увеличение тайм-аута до 6

Последнее сообщение Anonymous « 28 июн 2024, 15:51
Добавлено в форуме Php

Anonymous » 28 июн 2024, 15:51 » в форуме Php

Используя Laravel v10, я пытаюсь передать данные PDF из S3 в Cloudflare R2, используя файловую систему Laravel вместе с League/flysystem-aws-s3-v3, этот процесс выполняется через выделенную очередь. Большую часть времени он работает отлично, но...

0 Ответы

56 Просмотры

Последнее сообщение Anonymous
28 июн 2024, 15:51

Вернуться в «Python»

Programmiererforum