Как эффективно делать множество прогнозов с помощью небольшой нейронной сети? - Цифровое Кемерово

Как эффективно делать множество прогнозов с помощью небольшой нейронной сети? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Как эффективно делать множество прогнозов с помощью небольшой нейронной сети?

Цитата

Сообщение Anonymous » 03 июл 2024, 00:49

Мне нужно сделать много прогнозов с помощью небольших нейронных сетей (100–150 параметров). Я реализовал это в TensorFlow и столкнулся с проблемами эффективности. вот псевдокод:

Код: Выделить всё

for my_dense_netowrk,my_lstm_netowrk in networks_list
my_dense_netowrk.paramters = 100
my_lstm_netowrk.paramters = 150
for images in data[:60]:
@tf.function
def tf_wrapper(images, state):
model_data = meta_model(images)
data_prepared = image_preparation(model_data)

results = my_dense_netowrk(data_prepared)
results.shape = (19000,1,1)

better_results, state = my_lstm_netowrk(results, state)
return better_results, state

better_results, state = tf_wrapper(images, state)

my_dense_netowrk_n2.paramters = 100
my_lstm_netowrk_n2.paramters = 100

and continue...

Я использую API конвейера данных тензорного потока, и фактически все необходимые данные (переменная данных) могут быть размещены в моей памяти.
Я не указал размер пакета для своей нейронной сети при построении и вставке данных в виде огромной стопки (размер пакета 19000) в нейронную сеть для распараллеливания всего. Даже lstm не ограничен обработкой последовательностей, поскольку ему приходится обрабатывать 19 000 входных данных одновременно. Но когда я увеличил параметры своей нейронной сети в 10 раз (что мне не нужно), мой код почти не заметил, полагая, что размер пакета довольно велик.
@tf. Функция немного ускоряет работу.
Я пробовал профилировать, но не смог найти узкое место, так как происходит слишком много операций. Я обнаружил, что запуск ядра занимает половину времени, потому что обычно тензорный поток ожидает, что этот процесс займет много времени, поэтому я думаю, он не оптимизирован для таких задач, потому что, когда я увеличиваю свой цикл с 60 до 6000, он становится в 10 раз более эффективным на каждый проход цикла! Похоже, на подготовку требуется время.
Функция image_preparation() использует только tf-операции, такие как изменение формы, стек, плитка, и я не могу подготовить данные заранее.
Я использую macOS с чипом M3 Max, и нет никакой разницы, использую ли я графический процессор или процессор. Я пробовал Python 3.8, 3.9, 3.10, 3.11, 3.12.

Так что похоже, что tensorflow не разливается по моим моделям, что странно, и там В Интернете не так много дискуссий о том, как эффективно получать множество прогнозов из небольших моделей, все используют такие библиотеки для огромных НС. И графический процессор совсем не помогает, хотя я думаю, что мой конвейер должен от этого выиграть, поскольку я использую огромные пакеты. Поэтому мне очень сложно найти хорошее решение моей проблемы, и я хотел попросить совета. Может быть, для моей проблемы есть лучшие фреймворки машинного обучения (PyTorch, Jax, может быть, что-то еще?) Или я просто плохо разбираюсь в профилировании? или мне для этого попробовать собрать собственное ядро на ассемблере? Я не знаю

Подробнее здесь: https://stackoverflow.com/questions/786 ... al-network

Реклама

1719956945

Anonymous

Мне нужно сделать много прогнозов с помощью небольших нейронных сетей (100–150 параметров). Я реализовал это в TensorFlow и столкнулся с проблемами эффективности. вот псевдокод:
[code]for my_dense_netowrk,my_lstm_netowrk in networks_list
my_dense_netowrk.paramters = 100
my_lstm_netowrk.paramters = 150
for images in data[:60]:
@tf.function
def tf_wrapper(images, state):
model_data = meta_model(images)
data_prepared = image_preparation(model_data)

results = my_dense_netowrk(data_prepared)
results.shape = (19000,1,1)

better_results, state = my_lstm_netowrk(results, state)
return better_results, state

better_results, state = tf_wrapper(images, state)

my_dense_netowrk_n2.paramters = 100
my_lstm_netowrk_n2.paramters = 100

and continue...
[/code]
[list]
[*]Я использую API конвейера данных тензорного потока, и фактически все необходимые данные (переменная данных) могут быть размещены в моей памяти.
[*]Я не указал размер пакета для своей нейронной сети при построении и вставке данных в виде огромной стопки (размер пакета 19000) в нейронную сеть для распараллеливания всего. Даже lstm не ограничен обработкой последовательностей, поскольку ему приходится обрабатывать 19 000 входных данных одновременно. Но когда я увеличил параметры своей нейронной сети в 10 раз (что мне не нужно), мой код почти не заметил, полагая, что размер пакета довольно велик.
[*]@tf. Функция немного ускоряет работу.
[*]Я пробовал профилировать, но не смог найти узкое место, так как происходит слишком много операций. Я обнаружил, что запуск ядра занимает половину времени, потому что обычно тензорный поток ожидает, что этот процесс займет много времени, поэтому я думаю, он не оптимизирован для таких задач, потому что, когда я увеличиваю свой цикл с 60 до 6000, он становится в 10 раз более эффективным на каждый проход цикла! Похоже, на подготовку требуется время.
[*]Функция image_preparation() использует только tf-операции, такие как изменение формы, стек, плитка, и я не могу подготовить данные заранее.
[*]Я использую macOS с чипом M3 Max, и нет никакой разницы, использую ли я графический процессор или процессор. Я пробовал Python 3.8, 3.9, 3.10, 3.11, 3.12.
[/list]
Так что похоже, что tensorflow не разливается по моим моделям, что странно, и там В Интернете не так много дискуссий о том, как эффективно получать множество прогнозов из небольших моделей, все используют такие библиотеки для огромных НС. И графический процессор совсем не помогает, хотя я думаю, что мой конвейер должен от этого выиграть, поскольку я использую огромные пакеты. Поэтому мне очень сложно найти хорошее решение моей проблемы, и я хотел попросить совета. Может быть, для моей проблемы есть лучшие фреймворки машинного обучения (PyTorch, Jax, может быть, что-то еще?) Или я просто плохо разбираюсь в профилировании? или мне для этого попробовать собрать собственное ядро на ассемблере? Я не знаю 

Подробнее здесь: [url]https://stackoverflow.com/questions/78699009/how-to-efficiently-make-a-lot-of-predictions-with-small-neural-network[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как эффективно делать множество прогнозов с помощью небольшой нейронной сети?

Последнее сообщение Anonymous « 02 июл 2024, 22:52
Добавлено в форуме Python

Anonymous » 02 июл 2024, 22:52 » в форуме Python

Я работаю над научно-исследовательским проектом, где мне нужно делать много прогнозов с помощью небольших нейронных сетей (100–150 параметров). Я реализовал это в TensorFlow и столкнулся с проблемами эффективности. вот псевдокод:

for...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
02 июл 2024, 22:52
Мои потери при тестировании увеличиваются, но потери поездов для нейронной сети уменьшаются. Что я должен делать?

Последнее сообщение Anonymous « 11 май 2024, 02:35
Добавлено в форуме Python

Anonymous » 11 май 2024, 02:35 » в форуме Python

Моя нейронная сеть
def buildModel(optimizer):
model = tf.keras.models.Sequential( )
model.compile(loss='categorical_crossentropy', optimizer=optimizer, metrics= )
return model

tf.keras.optimizers.legacy.Adam()

model = buildModel('adam')
history =...

0 Ответы

103 Просмотры

Последнее сообщение Anonymous
11 май 2024, 02:35
Как эффективно транслировать и визуализировать метрики обучения нейронной сети в реальном времени на веб-панели, не блок

Последнее сообщение Anonymous « 19 июн 2025, 05:27
Добавлено в форуме Javascript

Anonymous » 19 июн 2025, 05:27 » в форуме Javascript

Вы создаете веб-приложение, которое контролирует обучение модели машинного обучения в режиме реального времени. Бэкэнд отправляет метрики обучения (потеря, точность, градиентные нормы) каждые несколько секунд через WebSocket, но вы испытываете...

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
19 июн 2025, 05:27
Как я могу решить проблемы несоответствия размеров или отображения веса в нейронной сети Кохонена с помощью Python?

Последнее сообщение Anonymous « 29 ноя 2024, 06:08
Добавлено в форуме Python

Anonymous » 29 ноя 2024, 06:08 » в форуме Python

Я реализую самоорганизующуюся карту Кохонена (SOM) на Python. Моя цель — обучить SOM масштабированным входным данным (X_scaled) и итеративно обновлять веса в течение нескольких эпох. Однако я столкнулся с двумя основными проблемами:...

0 Ответы

7 Просмотры

Последнее сообщение Anonymous
29 ноя 2024, 06:08
Как я могу решить проблемы несоответствия размеров или отображения веса в нейронной сети Кохонена с помощью Python?

Последнее сообщение Anonymous « 29 ноя 2024, 22:56
Добавлено в форуме Python

Anonymous » 29 ноя 2024, 22:56 » в форуме Python

Я реализую самоорганизующуюся карту Кохонена (SOM) на Python. Моя цель — обучить SOM масштабированным входным данным (X_scaled) и итеративно обновлять веса в течение нескольких эпох. Однако я столкнулся с двумя основными проблемами:...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
29 ноя 2024, 22:56

Вернуться в «Python»

Programmiererforum