Многопоточный красно-черный Gauss Seidel работает медленноC++

Программы на C++. Форум разработчиков
Anonymous
 Многопоточный красно-черный Gauss Seidel работает медленно

Сообщение Anonymous »

Я новичок в многопоточности и некоторое время пытался реализовать в многопоточности этап несжимаемости в моем моделировании жидкости PIC/FLIP на C++, используя библиотеку. Лучший способ, который я нашел, — это разделить сетку по горизонтали n раз для n потоков, а затем выполнить два прохода по сетке, чтобы решить проблему несжимаемости, используя красно-черный цвет. Гаусс Зейдель. Я использую тот же пул потоков, который Пецца использовал в своем видео, и который мог запускать огромное количество объектов со скоростью 60 кадров в секунду, поэтому я не думаю, что проблема связана с пулом потоков, а скорее с тем, как я используя его. Вот метод, который я использую в многопоточном режиме:

Код: Выделить всё

void solveIncompressibilityRedBlackForColumns(const float dt, const float overRelaxation, const int startColumn, const int endColumn, const bool red) {
int n = this->numY;
for (int i = startColumn; i < endColumn; ++i) {
for (int j = 1; j < numY - 1; ++j) {
if (red) {
if ((i + j) % 2 != 0) {
continue;
}
}
if (!red) {
if ((i + j) % 2 == 0) {
continue;
}
}
if (this->cellType[i * n + j] == FLUID_CELL) {
float leftType = cellType[(i - 1) * n + j] v[i * n + j];
if (this->particleRestDensity > 0.f) {
float k = 10.f; // 3, 10
float compression = this->particleDensity[i * n + j] -this->particleRestDensity;
if (compression > 0.f) {
divergence = divergence - k * compression;
}
}
float p = divergence / divideBy;
p *= overRelaxation;
this->u[i * n + j] += leftType * p;
this->u[(i + 1) * n + j] -= rightType * p;
this->v[i * n + j] += topType * p;
this->v[i * n + j + 1] -= bottomType * p;
}
}
}
}
}
который, по сути, просто выполняет некоторые математические действия, чтобы сделать определенные ячейки сетки несжимаемыми. А вот собственно многопоточная часть кода, выполняющего этот метод:

Код: Выделить всё

for (int _ = 0; _ < 10; ++_) {

for (int i = 0; i < numThreads; ++i) {
if (i != numThreads - 1) {
thread_pool.addTask([&, this, i]() {
this->solveIncompressibilityRedBlackForRows(sdtoverRelaxation, i * numRowsEachThread + 1, i*numRowsEachThread + numRowsEachThread + 1, true);
});
}
else {
thread_pool.addTask([&, this, i]() {
this->solveIncompressibilityRedBlackForRows(sdtoverRelaxation, i * numRowsEachThread + 1, i*numRowsEachThread + numRowsEachThread + numMissedRows + 1, true);
});
}
}
thread_pool.waitForCompletion();

for (int i = 0; i < numThreads; ++i) {
if (i != numThreads - 1) {
thread_pool.addTask([&, this, i]() {
this->solveIncompressibilityRedBlackForRows(sdtoverRelaxation, i * numRowsEachThread + 1, i*numRowsEachThread + numRowsEachThread + 1, false);
});
}
else {
thread_pool.addTask([&, this, i]() {
this->solveIncompressibilityRedBlackForRows(sdt, overRelaxation, i * numRowsEachThread + 1, i * numRowsEachThread + numRowsEachThread + numMissedRows + 1, false);
});
}
}
thread_pool.waitForCompletion();
}
Я думал, что он работает медленно из-за накладных расходов на объединение потоков, но когда я запускаю это на все более крупных сетках с одинаковым количеством потоков, время, затрачиваемое на каждый кадр, уменьшается гораздо быстрее, чем однопоточная программа на сетках того же размера. Я ожидал, что многопоточный код будет хотя бы хорошо масштабироваться, но это совсем не так. Я также не думаю, что это потому, что я отправляю и объединяю потоки в цикле 10 раз, потому что в видео Пеццы он отправляет и объединяет потоки 8 раз за кадр (но опять же я очень мало знаю о многопоточности).

Подробнее здесь: https://stackoverflow.com/questions/790 ... nning-slow

Вернуться в «C++»