Ошибка OOM на графическом процессоре во время обучения RNN на этапе выбора модели, проблеме измерения тензора или неправ

Ошибка OOM на графическом процессоре во время обучения RNN на этапе выбора модели, проблеме измерения тензора или неправ ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Ошибка OOM на графическом процессоре во время обучения RNN на этапе выбора модели, проблеме измерения тензора или неправ

Цитата

Сообщение Anonymous » 09 фев 2025, 20:12

У меня есть тензор NLP, такой как поезд: (22k, 170, 300) val: (2k, 170, 300), тест: (25K, 170 300), где последние 300 - фаста -текстовые эмоции, также у меня есть один GPU Тесла 32 ГБ. Я делаю выбор модели на rnn, не обученном, пакет/buffer_size - 64 Слои - 5:

Код: Выделить всё

for config in param_grid:
model = self.create_model(config)
train = model.forward(embedded_training_data)
val = model.forward(embedded_val_data)
test= model.forward(embedded_test_data)

Созданная модель представляет собой последовательность Keras, где каждый слои являются keras.layers.bidereectional и sequence = true Следовательно, вывод 3D (пакет, временные рамки, функции), метод прямого это следующее и использует вычисления партий с именем compute_states: < /p>
def compute_states(self, x):
x_train_states = []
for i, layer in enumerate(self.layers):
outputs, r, b = layer(x)
x_train_states.append(outputs) # Aggiungi alla lista

x = outputs # Update input for next layer

return tf.concat(x_train_states, axis=2) if x_train_states else None

@tf.function
def forward(self, data):
total_samples = tf.shape(data)[0]
buffer_size = tf.constant(self.buffer_size, dtype=tf.int32)
num_batches = tf.cast(tf.math.ceil(total_samples / buffer_size), tf.int32)

states_array = tf.TensorArray(dtype=tf.float32, size=num_batches)

for i in tf.range(num_batches):
start_idx = i * buffer_size
end_idx = tf.minimum((i + 1) * buffer_size, total_samples)
batch = data[start_idx:end_idx]
states = self.compute_states(batch)
states_array = states_array.write(i, states)

states = states_array.concat()
return states
< /code>
Эти функции хороши и очень скорости на процессоре, но на графическом процессоре я получаю ошибку OOM при объединении партий (starts_array.concat ()). Я хотел бы знать, есть ли какие -либо проблемы в моем коде, и поэтому я мог бы оптимизировать его или если размеры тензоров неразрешимы.

Подробнее здесь: https://stackoverflow.com/questions/794 ... -dimension

1739121160

Anonymous

 У меня есть тензор NLP, такой как поезд: (22k, 170, 300) val: (2k, 170, 300), тест: (25K, 170 300), где последние 300 - фаста -текстовые эмоции, также у меня есть один GPU Тесла 32 ГБ. Я делаю выбор модели на rnn, не обученном, пакет/buffer_size - 64 Слои - 5: 
[code]for config in param_grid:
model = self.create_model(config)
train = model.forward(embedded_training_data)
val = model.forward(embedded_val_data)
test= model.forward(embedded_test_data)
[/code]
Созданная модель представляет собой последовательность Keras, где каждый слои являются keras.layers.bidereectional и sequence = true  Следовательно, вывод 3D (пакет, временные рамки, функции), метод прямого это следующее и использует вычисления партий с именем compute_states: < /p>
def compute_states(self, x):
x_train_states = []
for i, layer in enumerate(self.layers):
outputs, r, b = layer(x)
x_train_states.append(outputs)  # Aggiungi alla lista

x = outputs  # Update input for next layer

return tf.concat(x_train_states, axis=2) if x_train_states else None

@tf.function
def forward(self, data):
total_samples = tf.shape(data)[0]
buffer_size = tf.constant(self.buffer_size, dtype=tf.int32)
num_batches = tf.cast(tf.math.ceil(total_samples / buffer_size), tf.int32)

states_array = tf.TensorArray(dtype=tf.float32, size=num_batches)

for i in tf.range(num_batches):
start_idx = i * buffer_size
end_idx = tf.minimum((i + 1) * buffer_size, total_samples)
batch = data[start_idx:end_idx]
states = self.compute_states(batch)
states_array = states_array.write(i, states)

states = states_array.concat()
return states
< /code>
Эти функции хороши и очень скорости на процессоре, но на графическом процессоре я получаю ошибку OOM при объединении партий (starts_array.concat ()). Я хотел бы знать, есть ли какие -либо проблемы в моем коде, и поэтому я мог бы оптимизировать его или если размеры тензоров неразрешимы.  

Подробнее здесь: [url]https://stackoverflow.com/questions/79425292/oom-error-on-gpu-while-training-a-rnn-in-model-selection-phase-tensor-dimension[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как правильно обрабатывать сбой выполнения нескольких графических процессоров на одном графическом процессоре из-за OOM

Последнее сообщение Anonymous « 12 дек 2024, 13:34
Добавлено в форуме Python

Anonymous » 12 дек 2024, 13:34 » в форуме Python

Я работаю с несколькими графическими процессорами, обрабатывающими большие объемы данных.
Я хочу создать систему обнаружения нехватки памяти (OOM), которая пропускает текущий пакет на всех графических процессорах, если на каком-либо из них не...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
12 дек 2024, 13:34
Математические вычисления, выполняемые на процессоре, дают разные результаты на графическом процессоре

Последнее сообщение Anonymous « 09 май 2024, 19:51
Добавлено в форуме C++

Anonymous » 09 май 2024, 19:51 » в форуме C++

Я пытаюсь заставить шейдер фрагментов GLSL искажать входящие фрагменты на основе их текстурных координат, чтобы плохо имитировать CRT.
После того, как код не заработал, я перенес его на C++, чтобы изменить значения RGB текстуры. Код работал так, как...

0 Ответы

88 Просмотры

Последнее сообщение Anonymous
09 май 2024, 19:51
Выполнение операций на графическом процессоре, а не на процессоре (вычисление числа Pi) [закрыто]

Последнее сообщение Anonymous « 31 июл 2024, 21:12
Добавлено в форуме C#

Anonymous » 31 июл 2024, 21:12 » в форуме C#

Недавно я много читал о программном обеспечении (в основном научном/математическом и шифровальном), которое переносит часть вычислений на графический процессор, что приводит к увеличению скорости поддерживаемых операций в 100–1000 (!) раз. >

Есть...

0 Ответы

27 Просмотры

Последнее сообщение Anonymous
31 июл 2024, 21:12
Как указать Python работать на процессоре, а не на графическом процессоре при использовании рабочей станции?

Последнее сообщение Anonymous « 04 окт 2024, 02:40
Добавлено в форуме Python

Anonymous » 04 окт 2024, 02:40 » в форуме Python

Я относительно новичок в аппаратном обеспечении графических процессоров. Раньше я часто использовал Google Colab и могу указать тип среды выполнения (ЦП, ГП), чтобы контролировать, где будет выполняться мой код Python.
Недавно у меня появилась...

0 Ответы

30 Просмотры

Последнее сообщение Anonymous
04 окт 2024, 02:40
Как указать Python, чтобы он работал на процессоре, а не на графическом процессоре при использовании рабочей станции?

Последнее сообщение Anonymous « 04 окт 2024, 03:56
Добавлено в форуме Python

Anonymous » 04 окт 2024, 03:56 » в форуме Python

Я относительно новичок в аппаратном обеспечении графических процессоров. Раньше я часто использовал Google Colab для обучения LLM с использованием pytorch, и я могу указать тип среды выполнения (ЦП и ГП), чтобы контролировать, где будет выполняться...

0 Ответы

24 Просмотры

Последнее сообщение Anonymous
04 окт 2024, 03:56

Вернуться в «Python»