Функция-член Cuda __device__ с явным объявлением шаблона

Функция-член Cuda device с явным объявлением шаблона ⇐ C++

1 сообщение • Страница 1 из 1

Гость

Функция-член Cuda __device__ с явным объявлением шаблона

Цитата

Сообщение Гость » 09 мар 2024, 13:31

I have a templated struct and I want to speed compilation times by separating declaration and implementation, using explicit template declaration (I'm using Kokkos 4.1, with Cuda backend, GCC 11.3 and Cuda 11.8).

I have a struct that looks like this:

Код: Выделить всё

template struct Orbit {     MetricsAndFields fields;     Parameters params;     Orbit() = default;     Orbit(MetricsAndFields fields, Parameters params) : fields(fields), params(params) {}          __host__ __device__  T eom_denominator(const Particle& p); };

Now in my .cpp file, I explicitely declare the struct as needed:

Код: Выделить всё

template struct Orbit; // #ifdef ENABLE_GPU template struct Orbit;

and obviously implement the function:

Код: Выделить всё

template __host__ __device__ T Orbit::eom_denominator(const Particle& p) {     // Implementation }

When compiling, I get the following linker error:

Код: Выделить всё

ptxas fatal   : Unresolved extern function '_ZN5OrbitIL9OrbitType1ELb0E8MyReaderIdN6Kokkos9CudaSpaceEEdS3_E15eom_denominatorERK8ParticleIdE'

which means that it doesn't find my templated member function.

When I drop the device qualifier of my function, then it compiles just fine (by warning that I'm not allowed to call host function from device code). So, the problem comes from

Код: Выделить всё

__device__

. I tried to use

Код: Выделить всё

__noinline__

, but I still get the linker error.

Is there any way around that? Or am I forced to have slow compilation times?

Источник: https://stackoverflow.com/questions/781 ... eclaration

1709980309

Гость


I have a templated struct and I want to speed compilation times by separating declaration and implementation, using explicit template declaration (I'm using Kokkos 4.1, with Cuda backend, GCC 11.3 and Cuda 11.8).
 
I have a struct that looks like this:
 
[code]template struct Orbit {     MetricsAndFields fields;     Parameters params;     Orbit() = default;     Orbit(MetricsAndFields fields, Parameters params) : fields(fields), params(params) {}          __host__ __device__  T eom_denominator(const Particle& p); }; [/code] Now in my .cpp file, I explicitely declare the struct as needed:
 
[code]template struct Orbit; // #ifdef ENABLE_GPU template struct Orbit; [/code] and obviously implement the function:
 
[code]template __host__ __device__ T Orbit::eom_denominator(const Particle& p) {     // Implementation } [/code] When compiling, I get the following linker error: [code]ptxas fatal   : Unresolved extern function '_ZN5OrbitIL9OrbitType1ELb0E8MyReaderIdN6Kokkos9CudaSpaceEEdS3_E15eom_denominatorERK8ParticleIdE'[/code] which means that it doesn't find my templated member function.
 
When I drop the [b]device[/b] qualifier of my function, then it compiles just fine (by warning that I'm not allowed to call host function from device code). So, the problem comes from [code]__device__[/code]. I tried to use [code]__noinline__[/code], but I still get the linker error.
 
Is there any way around that? Or am I forced to have slow compilation times?
 

Источник: [url]https://stackoverflow.com/questions/78131986/cuda-device-member-function-with-explicit-template-declaration[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

В чем разница между использованием `var` и явным объявлением типа в C#? [дублировать]

Последнее сообщение Anonymous « 26 апр 2025, 00:53
Добавлено в форуме C#

Anonymous » 26 апр 2025, 00:53 » в форуме C#

они оба, кажется, делают одно и то же в этом случае. Существует ли какая-либо практическая разница между использованием var и явным написанием типа, подобного INT, String и т. Д.?var number = 5;
int number = 5;

Подробнее здесь:

0 Ответы

12 Просмотры

Последнее сообщение Anonymous
26 апр 2025, 00:53
Каков идиоматический способ иметь функцию-член шаблонного класса с объявлением, действительным только в том случае, если

Последнее сообщение Anonymous « 02 ноя 2024, 07:28
Добавлено в форуме C++

Anonymous » 02 ноя 2024, 07:28 » в форуме C++

Функция языка C++20 Concepts позволяет ограничивать функции-члены классов-шаблонов. Однако эти ограничения применяются только к телу функций-членов, а не к объявлению — объявление все равно должно быть действительным.
Я столкнулся с ситуацией, когда...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
02 ноя 2024, 07:28
Каков идиоматический способ иметь функцию-член шаблонного класса с объявлением, действительным только в том случае, если

Последнее сообщение Anonymous « 02 ноя 2024, 15:41
Добавлено в форуме C++

Anonymous » 02 ноя 2024, 15:41 » в форуме C++

Функция языка C++20 Concepts позволяет ограничивать функции-члены классов-шаблонов. Однако эти ограничения применяются только к телу функций-членов, а не к объявлению — объявление все равно должно быть действительным.
Я столкнулся с ситуацией, когда...

0 Ответы

20 Просмотры

Последнее сообщение Anonymous
02 ноя 2024, 15:41
Deamon Device Device Crashed

Последнее сообщение Anonymous « 08 фев 2025, 15:37
Добавлено в форуме Android

Anonymous » 08 фев 2025, 15:37 » в форуме Android

Я изменил имя каталога, в котором установлен Flutter. После этого ошибка возникает всякий раз, когда я запускал Android Studio. Ошибка - ' Демон устройства Flutter не может быть запущен. Описание здесь src = />
Я использую физическое устройство для...

0 Ответы

39 Просмотры

Последнее сообщение Anonymous
08 фев 2025, 15:37
Some_operation (). to (device) vs to (device) .some_operation ()

Последнее сообщение Anonymous « 31 май 2025, 16:24
Добавлено в форуме Python

Anonymous » 31 май 2025, 16:24 » в форуме Python

Только что нашел я случайно кодировал some_data.unsqueeze (0) .to (device) и some_data.to (device) .unsqueeze (0) .
Если я правильно помню, torch.tensor.to ? /> Что заставляет меня задуматься, предположим, что устройство установлено на графический...

0 Ответы

7 Просмотры

Последнее сообщение Anonymous
31 май 2025, 16:24

Вернуться в «C++»

Функция-член Cuda __device__ с явным объявлением шаблона ⇐ C++

Быстрый ответ

Функция-член Cuda device с явным объявлением шаблона ⇐ C++