Как вызвать функцию устройства в другой DLL в ядре CUDA

Как вызвать функцию устройства в другой DLL в ядре CUDA ⇐ C++

1 сообщение • Страница 1 из 1

Anonymous

Как вызвать функцию устройства в другой DLL в ядре CUDA

Цитата

Сообщение Anonymous » 09 дек 2024, 23:53

У меня есть DLL с экспортированной функцией устройства, и я пытаюсь написать исполняемый файл, который будет параллельно вызывать эту функцию на устройстве. Но я получаю ошибку компилятора в строке с вызовом ядра, и ошибка исчезает, если я закомментирую вызов функции DLL. Для создания DLL используется файл myfunc.cu:

Код: Выделить всё

#include "cuda_runtime.h"

__declspec(dllexport) __device__ double myfunc(double x) {
return x * x;  // Example function: square the input
}

Я создаю его с помощью:

Код: Выделить всё

nvcc -shared -o myfunc.dll myfunc.cu

Он создает файлы dll и lib.
Затем я вызываю программу kernel.cu:

Код: Выделить всё

#include 
#include "device_launch_parameters.h"

__device__ double myfunc(double x);

__global__ void kernel(double* a, double* c) {
int idx = blockIdx.x * blockDim.x + threadIdx.x;
c[idx] = myfunc(a[idx]);
}

int main() {
// ... (Host code to allocate memory, initialize data, and launch the kernel)

int num_elements = 10000;
double* a_h, * c_h;
double* a_d, * c_d;

// Allocate memory on the host
cudaMallocHost(&a_h, num_elements * sizeof(double));
cudaMallocHost(&c_h, num_elements * sizeof(double));

// Allocate memory on the device
cudaMalloc(&a_d, num_elements * sizeof(double));
cudaMalloc(&c_d, num_elements * sizeof(double));

// Copy data from host to device
cudaMemcpy(a_d, a_h, num_elements * sizeof(double), cudaMemcpyHostToDevice);

// Launch the kernel
kernel  (a_d, c_d);

// Copy results from device to host
cudaMemcpy(c_h, c_d, num_elements * sizeof(double), cudaMemcpyDeviceToHost);

// ... (Host code to use the results)

// Free memory
cudaFree(a_d);
cudaFree(c_d);
cudaFreeHost(a_h);
cudaFreeHost(c_h);

return 0;
}

Я создал это в Visual Studio 2022 в проекте, который запускался по умолчанию для среды выполнения CUDA, и добавил myfunc.lib во входные данные компоновщика.
На линии

Код: Выделить всё

kernel  (a_d, c_d);

Я получаю сообщение об ошибке «ожидалось выражение» с красной волнистой линией под третьим

Подробнее здесь: https://stackoverflow.com/questions/792 ... uda-kernel

1733777590

Anonymous

У меня есть DLL с экспортированной функцией устройства, и я пытаюсь написать исполняемый файл, который будет параллельно вызывать эту функцию на устройстве. Но я получаю ошибку компилятора в строке с вызовом ядра, и ошибка исчезает, если я закомментирую вызов функции DLL. Для создания DLL используется файл myfunc.cu:
[code]#include "cuda_runtime.h"

__declspec(dllexport) __device__ double myfunc(double x) {
return x * x;  // Example function: square the input
}
[/code]
Я создаю его с помощью:
[code]nvcc -shared -o myfunc.dll myfunc.cu
[/code]
Он создает файлы dll и lib.
Затем я вызываю программу kernel.cu:[code]#include 
#include "device_launch_parameters.h"

__device__ double myfunc(double x);

__global__ void kernel(double* a, double* c) {
int idx = blockIdx.x * blockDim.x + threadIdx.x;
c[idx] = myfunc(a[idx]);
}

int main() {
// ... (Host code to allocate memory, initialize data, and launch the kernel)

int num_elements = 10000;
double* a_h, * c_h;
double* a_d, * c_d;

// Allocate memory on the host
cudaMallocHost(&a_h, num_elements * sizeof(double));
cudaMallocHost(&c_h, num_elements * sizeof(double));

// Allocate memory on the device
cudaMalloc(&a_d, num_elements * sizeof(double));
cudaMalloc(&c_d, num_elements * sizeof(double));

// Copy data from host to device
cudaMemcpy(a_d, a_h, num_elements * sizeof(double), cudaMemcpyHostToDevice);

// Launch the kernel
kernel  (a_d, c_d);

// Copy results from device to host
cudaMemcpy(c_h, c_d, num_elements * sizeof(double), cudaMemcpyDeviceToHost);

// ... (Host code to use the results)

// Free memory
cudaFree(a_d);
cudaFree(c_d);
cudaFreeHost(a_h);
cudaFreeHost(c_h);

return 0;
}
[/code]
Я создал это в Visual Studio 2022 в проекте, который запускался по умолчанию для среды выполнения CUDA, и добавил myfunc.lib во входные данные компоновщика.
На линии
[code]kernel  (a_d, c_d);
[/code]
Я получаю сообщение об ошибке «ожидалось выражение» с красной волнистой линией под третьим 

Подробнее здесь: [url]https://stackoverflow.com/questions/79266424/how-to-call-a-device-function-in-another-dll-in-cuda-kernel[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Cuda C++ Доступ к структуре из глобальной памяти устройства в ядре приводит к несанкционированному доступу к памяти

Последнее сообщение Anonymous « 24 сен 2024, 04:24
Добавлено в форуме C++

Anonymous » 24 сен 2024, 04:24 » в форуме C++

Я работал над более крупной программой, используя набор инструментов Nvidia Cuda, но продолжал получать ошибки несанкционированного доступа к памяти. В итоге я локализовал проблему в доступе к структуре, однако, насколько я понял, структура и все...

0 Ответы

20 Просмотры

Последнее сообщение Anonymous
24 сен 2024, 04:24
RuntimeError: ошибка времени выполнения cuda (35): версия драйвера CUDA недостаточна для версии среды выполнения CUDA в

Последнее сообщение Anonymous « 03 ноя 2024, 19:04
Добавлено в форуме Python

Anonymous » 03 ноя 2024, 19:04 » в форуме Python

Когда я пытаюсь загрузить контрольную точку pytorch:

checkpoint = torch.load(pathname)

Я вижу:

RuntimeError: ошибка выполнения cuda (35): CUDA версия драйвера недостаточна для версии среды выполнения CUDA по адресу...

0 Ответы

75 Просмотры

Последнее сообщение Anonymous
03 ноя 2024, 19:04
CUDA ON DEBIAN TRIXIE: версия драйвера CUDA недостаточно для версии времени выполнения CUDA

Последнее сообщение Anonymous « 20 авг 2025, 18:06
Добавлено в форуме Linux

Anonymous » 20 авг 2025, 18:06 » в форуме Linux

У меня есть nvidia-driver-580 и cuda-tools-13 , установленные на Debian Trixie (оба являются самой новой версией, которую я мог найти): $ a p t l i s t - - i n s t a l l e d | a g n v i d i a f i r m w a r e - n v i d i a - g s p / u n k n o w n , n...

0 Ответы

6 Просмотры

Последнее сообщение Anonymous
20 авг 2025, 18:06
Невозможно загрузить DLL Microsoft.Data.SqlClient.SNI.x86.dll в ядре Entityframework.

Последнее сообщение Anonymous « 28 июн 2024, 10:50
Добавлено в форуме C#

Anonymous » 28 июн 2024, 10:50 » в форуме C#

У меня есть проект веб-формы (проект A), который имеет ссылку на другой проект библиотеки классов (проект B), который я использую для уровня доступа к данным. Я установил EntityFramework 3.1.15 в обоих проектах A и B, теперь я получил ошибка времени...

0 Ответы

32 Просмотры

Последнее сообщение Anonymous
28 июн 2024, 10:50
«RuntimeError: ошибка CUDA: срабатывание утверждения на стороне устройства. Ошибки ядра CUDA могут асинхронно сообщаться

Последнее сообщение Anonymous « 18 сен 2024, 15:37
Добавлено в форуме Python

Anonymous » 18 сен 2024, 15:37 » в форуме Python

[

](
sstatic.net/H3JmrldO.png
)
Для отладки рассмотрите возможность передачи CUDA_LAUNCH_BLOCKING=1
Скомпилируйте с TORCH_USE_CUDA_DSA, чтобы включить утверждения на стороне устройства.
Я тренирую YOLOv8 определять атрибуты одежды. Изображения...

0 Ответы

20 Просмотры

Последнее сообщение Anonymous
18 сен 2024, 15:37

Вернуться в «C++»