Как реализовать переработку памяти графического процессора в CUDA C++ для потоковой передачи данных в TensorFlow? - Цифровое Кемерово

Как реализовать переработку памяти графического процессора в CUDA C++ для потоковой передачи данных в TensorFlow? ⇐ C++

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Как реализовать переработку памяти графического процессора в CUDA C++ для потоковой передачи данных в TensorFlow?

Цитата

Сообщение Anonymous » 04 янв 2025, 18:59

Мне нужно определиться со спецификацией проекта для моего курса HPC, который включает оптимизацию использования памяти графического процессора в контексте потоковой передачи данных. В частности, я стремлюсь реализовать механизм повторного использования выделенной памяти на графическом процессоре для повышения эффективности при обработке потока входных данных.
Я рассматривал TensorFlow в качестве платформы для этой задачи, потому что о встроенной поддержке операторов графического процессора, и мне было интересно, включает ли API TensorFlow функции для моделирования или обработки потоковой передачи. Однако я не уверен, как подойти к проблеме повторного использования памяти в этом контексте.
Вот мои конкретные вопросы:

Переработка памяти в TensorFlow. Есть ли в TensorFlow встроенные инструменты или шаблоны для переработки памяти графического процессора во время непрерывной обработки данных, или мне нужно будет реализовать собственные решения? Целью моего проекта является реализация кода CUDA C++, поэтому меня особенно интересует, нет ли в TensorFlow решения для обработки повторного использования памяти графического процессора в контекстах, где входными данными является поток данных (например, разреженные матрицы или другие структуры данных, размеры которых значительны). влияние на производительность).
Пользовательские операторы графического процессора. Если мне нужно создать собственные операторы графического процессора для более эффективного управления памятью, как мне следует подойти к этому в TensorFlow? Существуют ли ресурсы или примеры для реализации таких пользовательских операторов?
Профилирование использования памяти. Каковы наилучшие методы профилирования и мониторинга использования памяти графического процессора в TensorFlow и CUDA? особенно при работе с потоками данных? Цель состоит в том, чтобы оптимизировать использование памяти графического процессора и минимизировать влияние узкого места передачи PCIe. Я рассматриваю возможность использования nvprof и его графической версии для профилирования выполнения CUDA.
Потоковая передача в TensorFlow: предоставляет ли TensorFlow API для обработки потоковый ввод данных? или, возможно, инструменты для эмуляции такого поведения?

Если TensorFlow не лучший выбор для проекта такого типа, я также был бы признателен за предложения по альтернативным фреймворкам или инструменты, которые могут лучше подходить для управления памятью графического процессора в контексте потоковой передачи.
Чтобы обеспечить некоторый контекст, этот проект уже реализован в библиотеке WindFlow. Мы с профессором обсуждали возможность реализации этой функции в другом инструменте потоковой передачи, таком как Flink, но Flink не поддерживает «операторов» графического процессора. В результате масштаб проекта, идущего по этому пути, может стать слишком большим для экзамена стоимостью всего 9 КОЕ
Заранее прошу прощения, если мой вопрос покажется несколько расплывчатым; В настоящее время я прохожу фазу, наполненную двусмысленностью и множеством потенциальных направлений.
Любые рекомендации, ссылки или примеры кода для начала работы будут очень признательны!
Спасибо!

Подробнее здесь: https://stackoverflow.com/questions/793 ... n-tensorfl

Реклама

1736006354

Anonymous

Мне нужно определиться со спецификацией проекта для моего курса HPC, который включает оптимизацию использования памяти графического процессора в контексте потоковой передачи данных. В частности, я стремлюсь реализовать механизм повторного использования выделенной памяти на графическом процессоре для повышения эффективности при обработке потока входных данных.
Я рассматривал TensorFlow в качестве платформы для этой задачи, потому что о встроенной поддержке операторов графического процессора, и мне было интересно, включает ли API TensorFlow функции для моделирования или обработки потоковой передачи. Однако я не уверен, как подойти к проблеме повторного использования памяти в этом контексте.
Вот мои конкретные вопросы:
[list]
[*][b]Переработка памяти в TensorFlow[/b]. Есть ли в TensorFlow встроенные инструменты или шаблоны для переработки памяти графического процессора во время непрерывной обработки данных, или мне нужно будет реализовать собственные решения? Целью моего проекта является реализация кода CUDA C++, поэтому меня особенно интересует, нет ли в TensorFlow решения для обработки повторного использования памяти графического процессора в контекстах, где входными данными является поток данных (например, разреженные матрицы или другие структуры данных, размеры которых значительны). влияние на производительность).
[*][b]Пользовательские операторы графического процессора[/b]. Если мне нужно создать собственные операторы графического процессора для более эффективного управления памятью, как мне следует подойти к этому в TensorFlow? Существуют ли ресурсы или примеры для реализации таких пользовательских операторов?
[*][b]Профилирование использования памяти[/b]. Каковы наилучшие методы профилирования и мониторинга использования памяти графического процессора в TensorFlow и CUDA? особенно при работе с потоками данных? Цель состоит в том, чтобы оптимизировать использование памяти графического процессора и минимизировать влияние узкого места передачи PCIe. Я рассматриваю возможность использования [b]nvprof[/b] и его графической версии для профилирования выполнения CUDA.
[*][b]Потоковая передача в TensorFlow[/b]: предоставляет ли TensorFlow API для обработки потоковый ввод данных? или, возможно, инструменты для эмуляции такого поведения?
[/list]
Если TensorFlow не лучший выбор для проекта такого типа, я также был бы признателен за предложения по альтернативным фреймворкам или инструменты, которые могут лучше подходить для управления памятью графического процессора в контексте потоковой передачи.
Чтобы обеспечить некоторый контекст, этот проект уже реализован в библиотеке WindFlow. Мы с профессором обсуждали возможность реализации этой функции в другом инструменте потоковой передачи, таком как Flink, но Flink не поддерживает «операторов» графического процессора. В результате масштаб проекта, идущего по этому пути, может стать слишком большим для экзамена стоимостью всего 9 КОЕ
Заранее прошу прощения, если мой вопрос покажется несколько расплывчатым; В настоящее время я прохожу фазу, наполненную двусмысленностью и множеством потенциальных направлений.
Любые рекомендации, ссылки или примеры кода для начала работы будут очень признательны!
Спасибо!  

Подробнее здесь: [url]https://stackoverflow.com/questions/79329139/how-to-implement-gpu-memory-recycling-in-cuda-c-for-data-streaming-in-tensorfl[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как реализовать переработку памяти графического процессора в CUDA C++ для потоковой передачи данных в TensorFlow?

Последнее сообщение Anonymous « 05 янв 2025, 01:18
Добавлено в форуме C++

Anonymous » 05 янв 2025, 01:18 » в форуме C++

Мне нужно определиться со спецификацией проекта для моего курса HPC, который включает оптимизацию использования памяти графического процессора в контексте потоковой передачи данных. В частности, я стремлюсь реализовать механизм повторного...

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
05 янв 2025, 01:18
Вставьте переработку в другой переработку

Последнее сообщение Anonymous « 16 фев 2025, 06:06
Добавлено в форуме Android

Anonymous » 16 фев 2025, 06:06 » в форуме Android

Я создаю набор из 5 карт со стилем карт Google Now. Сначала я сосредотачиваюсь с макетом в целом.

Я использую Cardview и Recyclerview, и то, чего я хочу достичь, что -то вроде этого:

Это мой кардад (также общий Адаптер):

public class...

0 Ответы

13 Просмотры

Последнее сообщение Anonymous
16 фев 2025, 06:06
Вставьте переработку в другой переработку

Последнее сообщение Anonymous « 16 июн 2025, 13:03
Добавлено в форуме Android

Anonymous » 16 июн 2025, 13:03 » в форуме Android

Я создаю набор из 5 карт со стилем карт Google Now. Сначала я сосредотачиваюсь с макетом в целом.

Я использую Cardview и Recyclerview, и то, чего я хочу достичь, - это что -то вроде этого:

Общий адаптер):

public class CardAdapter extends...

0 Ответы

4 Просмотры

Последнее сообщение Anonymous
16 июн 2025, 13:03
Tensorflow и CUDA использование графического процессора и совместимость с CUDA

Последнее сообщение Anonymous « 01 апр 2025, 16:29
Добавлено в форуме Python

Anonymous » 01 апр 2025, 16:29 » в форуме Python

Я пытаюсь обучить модель Tensorflow на GPU, но я изо всех сил пытался ее запустить.
По сути, я использую высокопроизводительный компьютерный кластер и отправляю задания, используя избегальные и стебные ошибки.
Моя среда-следующее: # p a c k a g e s...

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
01 апр 2025, 16:29
Код, запускаемый на версии процессора tensorflow, не будет работать на версии графического процессора tensorflow, пробуя

Последнее сообщение Anonymous « 02 янв 2024, 16:53
Добавлено в форуме Python

Anonymous » 02 янв 2024, 16:53 » в форуме Python

Сейчас я работаю над выпускным экзаменом CQF по глубокому обучению.

Я построил модель cnn-bilstm-attention ранее по ходу курса. Когда я добавлял в модель все больше и больше функций, процесс обучения становился все медленнее и медленнее. 4 функции...

0 Ответы

150 Просмотры

Последнее сообщение Anonymous
02 янв 2024, 16:53

Вернуться в «C++»

Programmiererforum