Я пытаюсь выучить CUDA, и у меня возникают проблемы, чтобы обернуть голову вокруг Warps и полосы движения в них. Полоса - это слово, которое я использую для потоков внутри той же основы. Я могу обмениваться данными между полосами движения следующим образом: < /p>
int lane_id = threadIdx.x & 31;
if(lane_id != 0 && lane_id != 1){return;}
int val;
if(lane_id == 0) val = 42;
if(lane_id == 1) val = 123;
val = __shfl_sync(0b11, val, lane_id ^ 1);
if(lane_id == 0) assert(val == 123);
if(lane_id == 1) assert(val == 42);
Мне интересно, должен ли вызов __shfl_sync быть единственным вызовом или его также можно разделить на два вызова, как это:
int lane_id = threadIdx.x & 31;
if(lane_id != 0 && lane_id != 1){return;}
int val;
if(lane_id == 0) val = __shfl_sync(0b11, 42, 1);
if(lane_id == 1) val = __shfl_sync(0b11, 123, 0);
if(lane_id == 0) assert(val == 123);
if(lane_id == 1) assert(val == 42);
Подробнее здесь: https://stackoverflow.com/questions/796 ... -shfl-sync
Могут ли потоки в варп -синхронизации с различными вызовами __SHFL_SYNC? ⇐ C++
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Std :: sync :: oncelock и oney_cell :: sync :: lazy не возвращайте тот же тип
Anonymous » » в форуме MySql - 0 Ответы
- 545 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Как применить обратную варп (grid_sample grid_sample) с прямым оптическим потоком?
Anonymous » » в форуме Python - 0 Ответы
- 6 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Как применить обратную варп (grid_sample grid_sample) с прямым оптическим потоком?
Anonymous » » в форуме Python - 0 Ответы
- 8 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Как применить обратную варп (grid_sample grid_sample) с прямым оптическим потоком?
Anonymous » » в форуме Python - 0 Ответы
- 6 Просмотры
-
Последнее сообщение Anonymous
-