Мне нужно использовать такую функцию, как Cudadevicesynchronize, чтобы ждать ядра, чтобы закончить выполнение. Однако после версии 11.6 больше невозможно использовать какую -либо форму синхронизации в функциях устройства. Как мы можем синхронизировать Subkernels в функции устройства?
Мне нужно использовать такую функцию, как Cudadevicesynchronize, чтобы ждать ядра, чтобы закончить выполнение. Однако после версии 11.6 больше невозможно использовать какую -либо форму синхронизации в функциях устройства. Как мы можем синхронизировать Subkernels в функции устройства?[code]__global__ void NNFeedForwardNormalMultiple(double* __restrict__ values, double* __restrict__ weigths, double* result, int inputsize, int outputsize) { int idx = threadIdx.x + blockIdx.x * blockDim.x; int outputidx = idx / outputsize; int inputidx = idx % outputsize;