Почему мне не хватает памяти при обучении с большим набором данных, но нет проблем с небольшим набором данных? - Цифровое Кемерово

Почему мне не хватает памяти при обучении с большим набором данных, но нет проблем с небольшим набором данных? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Почему мне не хватает памяти при обучении с большим набором данных, но нет проблем с небольшим набором данных?

Цитата

Сообщение Anonymous » 20 окт 2024, 23:44

Я пытаюсь создать систему обнаружения ключевых точек с помощью Keras. У меня есть модель, подобная UNet, с серией сверток, пакетной нормализацией и максимальным объединением, за которыми следует симметричная серия слоев повышающей выборки, свертки и пакетной нормализации (и пропуска соединений). Когда у меня есть 100 экземпляров, я могу без проблем вызвать model.fit(). Однако, если я оставлю модель той же, но использую 500 экземпляров, Keras выйдет из строя с исключением OOM. Почему это происходит и могу ли я что-нибудь сделать, чтобы это исправить?
Вот (как я думаю) соответствующая часть кода, в которой я вызываю model.fit :

Код: Выделить всё

model = build_model(
filters=50,
filter_step=1,
stages=5,
stage_steps=1,
initial_convolutions=0,
stacks=1,
)

print(model.summary())

dataset = tf.data.Dataset.from_tensor_slices((X, y))
dataset = dataset.batch(1)

model.fit(
dataset,
epochs=2**7,
callbacks=[
EarlyStopping(monitor="loss", patience=5, min_delta=1e-7, start_from_epoch=10),
LearningRateScheduler(step_decay)
],
)

Код: Выделить всё

и y — это массивы Numpy следующих форм:

Код: Выделить всё
```
X
```
: (100, 1024, 1024, 3)
Код: Выделить всё
```
y
```
: (100, 1024, 1024)

100 — размер набора данных. Если я увеличу это значение до 500 (или более), я получу исключение нехватки памяти. Мне кажется, что Керас, возможно, пытается загрузить весь набор данных в память, несмотря на использование from_tensor_slices и пакетного(1), поэтому я явно что-то не понимаю.

Подробнее здесь: https://stackoverflow.com/questions/770 ... e-no-probl

Реклама

1729457052

Anonymous

Я пытаюсь создать систему обнаружения ключевых точек с помощью Keras. У меня есть модель, подобная UNet, с серией сверток, пакетной нормализацией и максимальным объединением, за которыми следует симметричная серия слоев повышающей выборки, свертки и пакетной нормализации (и пропуска соединений). Когда у меня есть 100 экземпляров, я могу без проблем вызвать model.fit(). Однако, если я оставлю модель той же, но использую 500 экземпляров, Keras выйдет из строя с исключением OOM. Почему это происходит и могу ли я что-нибудь сделать, чтобы это исправить?
Вот (как я думаю) соответствующая часть кода, в которой я вызываю model.fit :
[code]model = build_model(
filters=50,
filter_step=1,
stages=5,
stage_steps=1,
initial_convolutions=0,
stacks=1,
)

print(model.summary())

dataset = tf.data.Dataset.from_tensor_slices((X, y))
dataset = dataset.batch(1)

model.fit(
dataset,
epochs=2**7,
callbacks=[
EarlyStopping(monitor="loss", patience=5, min_delta=1e-7, start_from_epoch=10),
LearningRateScheduler(step_decay)
],
)
[/code]
[code]X[/code] и y — это массивы Numpy следующих форм:
[list]
[*][code]X[/code]: (100, 1024, 1024, 3)
[*][code]y[/code]: (100, 1024, 1024)
[/list]
100 — размер набора данных. Если я увеличу это значение до 500 (или более), я получу исключение нехватки памяти. Мне кажется, что Керас, возможно, пытается загрузить весь набор данных в память, несмотря на использование from_tensor_slices и пакетного(1), поэтому я явно что-то не понимаю. 

Подробнее здесь: [url]https://stackoverflow.com/questions/77029483/why-do-i-run-out-of-memory-when-training-with-a-large-dataset-but-have-no-probl[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

При работе с большим набором данных код зависает при попытке импортировать его в фрейм данных.

Последнее сообщение Anonymous « 28 окт 2024, 16:01
Добавлено в форуме Python

Anonymous » 28 окт 2024, 16:01 » в форуме Python

Я работаю в Colab с набором данных HAM10000, который содержит 10015 изображений. При импорте изображений в фрейм данных процесс зависает на ~103 элементах. В конечном итоге процесс возобновится с нормальной скоростью, но количество времени, которое...

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
28 окт 2024, 16:01
Операция Pandas groupby приводит к выделению огромного количества памяти с относительно небольшим входным фреймом данных

Последнее сообщение Anonymous « 07 ноя 2024, 05:33
Добавлено в форуме Python

Anonymous » 07 ноя 2024, 05:33 » в форуме Python

Я столкнулся с проблемой памяти при операции pandas groupby при установке наблюдаемого=False. Мой входной фрейм данных относительно невелик (79 860 строк × 790 столбцов), но операция попыталась выделить более 40 ГБ памяти.
Вот минимальный...

0 Ответы

24 Просмотры

Последнее сообщение Anonymous
07 ноя 2024, 05:33
Альтаир терпит неудачу при создании грандиозной гистограммы с большим набором данных

Последнее сообщение Anonymous « 24 апр 2025, 08:12
Добавлено в форуме Python

Anonymous » 24 апр 2025, 08:12 » в форуме Python

Когда я пытаюсь сделать гистограмму с Altair с кодом (n = 1 миллион) ниже,
import polars as pl
import numpy as np
import altair as alt

n = 1000000
s = np.random.normal(0, 1, n)
h = np.random.normal(0, 1, n)
df = pl.DataFrame({ value : s, h :...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
24 апр 2025, 08:12
Действие с набором фиксированных параметров в URL и набором дополнительных параметров либо из Post, либо из QueryString

Последнее сообщение Anonymous « 08 апр 2025, 00:35
Добавлено в форуме C#

Anonymous » 08 апр 2025, 00:35 » в форуме C#

В моей коллекции маршрутов у меня есть

routes.maproute(
recalculate ,
{sitelanguage}/formula.mvc/relcalculate/ {идентификаторы {controller = formula , action = recalculate , wratio = , customrecalcstring = }
);

Действие, которое он отображает,...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
08 апр 2025, 00:35
CS50P, возможно, вызывает проблемы в функции is_valid с набором проблем CS50p 2 [закрыто]

Последнее сообщение Anonymous « 23 апр 2024, 02:16
Добавлено в форуме Python

Anonymous » 23 апр 2024, 02:16 » в форуме Python

Надеюсь, можно обратиться сюда. В настоящее время я пытаюсь решить вопрос о наборе проблем CS50P 2, и я не могу понять, почему мой код не работает, когда я пробую это работает, если не включать функцию is_valid, поэтому я полагаю, что проблема может...

0 Ответы

44 Просмотры

Последнее сообщение Anonymous
23 апр 2024, 02:16

Вернуться в «Python»

Programmiererforum