Как лучше всего разработать приложение среднего и большого размера на графическом процессоре с помощью CUDA? По сути, все учебные пособия, с которыми я сталкивался, обычно представляют собой вариации одних и тех же основных шагов:
Создайте несколько массивов на ЦП и инициализируйте их значения.
Выделите память для массивов на графическом процессоре и скопируйте значения из процессора в графический процессор.
Вызовите глобальное ядро на графическом процессоре, которое выполнит над ним некоторые операции.< /li>
Скопируйте значения обратно в ЦП и распечатайте результат.
Как бы вы продолжили разработку программы? где данные, передаваемые от ЦП к ЦП, намного сложнее, чем несколько массивов?
Как лучше всего разработать приложение среднего и большого размера на графическом процессоре с помощью CUDA? По сути, все учебные пособия, с которыми я сталкивался, обычно представляют собой вариации одних и тех же основных шагов: [list] [*]Создайте несколько массивов на ЦП и инициализируйте их значения. [*]Выделите память для массивов на графическом процессоре и скопируйте значения из процессора в графический процессор. [*]Вызовите глобальное ядро на графическом процессоре, которое выполнит над ним некоторые операции.< /li> Скопируйте значения обратно в ЦП и распечатайте результат. [/list] Как бы вы продолжили разработку программы? где данные, передаваемые от ЦП к ЦП, намного сложнее, чем несколько массивов?
Недавно я много читал о программном обеспечении (в основном научном/математическом и шифровальном), которое переносит часть вычислений на графический процессор, что приводит к увеличению скорости поддерживаемых операций в 100–1000 (!) раз. >
Я пытаюсь заставить шейдер фрагментов GLSL искажать входящие фрагменты на основе их текстурных координат, чтобы плохо имитировать CRT.
После того, как код не заработал, я перенес его на C++, чтобы изменить значения RGB текстуры. Код работал так, как...
Я относительно новичок в аппаратном обеспечении графических процессоров. Раньше я часто использовал Google Colab и могу указать тип среды выполнения (ЦП, ГП), чтобы контролировать, где будет выполняться мой код Python.
Недавно у меня появилась...
Я относительно новичок в аппаратном обеспечении графических процессоров. Раньше я часто использовал Google Colab для обучения LLM с использованием pytorch, и я могу указать тип среды выполнения (ЦП и ГП), чтобы контролировать, где будет выполняться...
Я работаю над программой CUDA в WSL2 (Ubuntu 20.04) для тестирования ускорения графического процессора. Мое оборудование включает AMD R7 5800H и NVIDIA RTX 3070 Mobile. Я сравнил время выполнения моей программы на процессоре (последовательное...