Ошибка в реализации поиска по дереву Монте-Карло.

Ошибка в реализации поиска по дереву Монте-Карло. ⇐ C++

1 сообщение • Страница 1 из 1

Anonymous

Ошибка в реализации поиска по дереву Монте-Карло.

Цитата

Сообщение Anonymous » 06 июл 2024, 20:11

Я работаю над движком «Крестики-нолики», используя алгоритм поиска по дереву Монте-Карло (MCTS). Однако я столкнулся с ошибкой, из-за которой ИИ иногда не может заблокировать выигрышные ходы противника, что приводит к проигрышам. Кроме того, программа иногда аварийно завершает работу из-за ошибки сегментации.
Я включил MCVE из своего кода ниже:

Код: Выделить всё

main.cc

Код: Выделить всё

#include "node.hpp"
#include 
#include 
#include 
#include 
#include 
#include 

#define DEBUG 0

void print_board(uint16_t ai_board, uint16_t enemy_board, char ai, char player) {
char board[9] = {' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' '};

for (int i = 0; i < 9; i++) {
if (ai_board & (1  0)
return;

for(int pos = 0; pos < 9; pos++) {
bool p1 = this->ai_board & (1 enemy_board & (1 arena, !this->is_ai_turn);
n.parent = this;
n.ai_board = this->ai_board;
n.enemy_board = this->enemy_board;

if(this->is_ai_turn)
n.ai_board |= 1 push_back(n);

assert(this->child_count < 9);
this->children[this->child_count++] = &this->arena->back();
}
}
}

void Node::SimulateAndBackpropagate() {
int eval = this->GetWinner();

uint16_t saved_ai_board = this->ai_board;
uint16_t saved_enemy_board = this->enemy_board;
bool saved_turn = this->is_ai_turn;

std::random_device rd;
std::mt19937 gen(rd());

assert((saved_ai_board & saved_enemy_board) == 0);

while (!eval) {
std::vector available_moves;

for (int pos = 0; pos < 9; pos++) {
bool p1 = this->ai_board & (1 enemy_board & (1 is_ai_turn) {
this->ai_board |= 1 enemy_board |= 1 is_ai_turn = !this->is_ai_turn;
eval = this->GetWinner();
}

this->ai_board = saved_ai_board;
this->enemy_board = saved_enemy_board;
this->is_ai_turn = saved_turn;

auto curr_node = this;
while (curr_node != nullptr) {
curr_node->visit_count++;
curr_node->eval += curr_node->is_ai_turn ? -eval : eval;
curr_node = curr_node->parent;
}
}

Node *Node::CalculateBestMove(size_t iter_count) {
std::random_device rd;
std::mt19937 gen(rd());

for (size_t i = 0; i < iter_count; i++) {
Node *leaf = this->FindBestLeafNode();
leaf->CreateChildren();

if (leaf->child_count > 0) {
std::uniform_int_distribution dis(0, leaf->child_count - 1);
leaf = leaf->children[dis(gen)];
}
leaf->SimulateAndBackpropagate();
}

int64_t best_eval = INT64_MIN;
Node *best_node = nullptr;

for (int i = 0; i < this->child_count; i++) {
if (this->children[i]->eval > best_eval) {
best_eval = this->children[i]->eval;
best_node = this->children[i];
}
}

assert(best_node != nullptr);
return best_node;
}

int Node::GetWinner() {
for (const uint16_t mask :
{0b000000111, 0b000111000, 0b111000000, 0b001001001, 0b010010010,
0b100100100, 0b100010001, 0b001010100}) {
if ((this->ai_board & mask) == mask) {
return 1;
} else if ((this->enemy_board & mask) == mask) {
return -1;
}
}
return 0;
}

double Node::GetUcbScore() {
auto parent = this->parent != nullptr ? this->parent : this;

if (this->visit_count == 0)
return DBL_MAX;

constexpr double c = 1.4;

double exploitation = (double)this->eval / this->visit_count;
double exploration = c * sqrt(log(parent->visit_count) / this->visit_count);

return exploration + exploitation;
}

Пример ошибки
Вот пример, когда ИИ (X) делает ход, игнорирующий выигрышный ход противника:

Код: Выделить всё

 A   B   C

| X |     1
---|---|---
|   |     2
---|---|---
O |   | O   3

Примечание
Я провел много работ по отладке и не смог найти ошибку, поэтому считаю, что моя реализация MCTS неверна.

Подробнее здесь: https://stackoverflow.com/questions/787 ... ementation

1720285873

Anonymous

Я работаю над движком «Крестики-нолики», используя алгоритм поиска по дереву Монте-Карло (MCTS). Однако я столкнулся с ошибкой, из-за которой ИИ иногда не может заблокировать выигрышные ходы противника, что приводит к проигрышам. Кроме того, программа иногда аварийно завершает работу из-за ошибки сегментации.
Я включил MCVE из своего кода ниже:
[code]main.cc[/code]
[code]#include "node.hpp"
#include 
#include 
#include 
#include 
#include 
#include 

#define DEBUG 0

void print_board(uint16_t ai_board, uint16_t enemy_board, char ai, char player) {
char board[9] = {' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' '};

for (int i = 0; i < 9; i++) {
if (ai_board & (1  0)
return;

for(int pos = 0; pos < 9; pos++) {
bool p1 = this->ai_board & (1 enemy_board & (1 arena, !this->is_ai_turn);
n.parent = this;
n.ai_board = this->ai_board;
n.enemy_board = this->enemy_board;

if(this->is_ai_turn)
n.ai_board |= 1 push_back(n);

assert(this->child_count < 9);
this->children[this->child_count++] = &this->arena->back();
}
}
}

void Node::SimulateAndBackpropagate() {
int eval = this->GetWinner();

uint16_t saved_ai_board = this->ai_board;
uint16_t saved_enemy_board = this->enemy_board;
bool saved_turn = this->is_ai_turn;

std::random_device rd;
std::mt19937 gen(rd());

assert((saved_ai_board & saved_enemy_board) == 0);

while (!eval) {
std::vector available_moves;

for (int pos = 0; pos < 9; pos++) {
bool p1 = this->ai_board & (1 enemy_board & (1 is_ai_turn) {
this->ai_board |= 1 enemy_board |= 1 is_ai_turn = !this->is_ai_turn;
eval = this->GetWinner();
}

this->ai_board = saved_ai_board;
this->enemy_board = saved_enemy_board;
this->is_ai_turn = saved_turn;

auto curr_node = this;
while (curr_node != nullptr) {
curr_node->visit_count++;
curr_node->eval += curr_node->is_ai_turn ? -eval : eval;
curr_node = curr_node->parent;
}
}

Node *Node::CalculateBestMove(size_t iter_count) {
std::random_device rd;
std::mt19937 gen(rd());

for (size_t i = 0; i < iter_count; i++) {
Node *leaf = this->FindBestLeafNode();
leaf->CreateChildren();

if (leaf->child_count > 0) {
std::uniform_int_distribution dis(0, leaf->child_count - 1);
leaf = leaf->children[dis(gen)];
}
leaf->SimulateAndBackpropagate();
}

int64_t best_eval = INT64_MIN;
Node *best_node = nullptr;

for (int i = 0; i < this->child_count; i++) {
if (this->children[i]->eval > best_eval) {
best_eval = this->children[i]->eval;
best_node = this->children[i];
}
}

assert(best_node != nullptr);
return best_node;
}

int Node::GetWinner() {
for (const uint16_t mask :
{0b000000111, 0b000111000, 0b111000000, 0b001001001, 0b010010010,
0b100100100, 0b100010001, 0b001010100}) {
if ((this->ai_board & mask) == mask) {
return 1;
} else if ((this->enemy_board & mask) == mask) {
return -1;
}
}
return 0;
}

double Node::GetUcbScore() {
auto parent = this->parent != nullptr ? this->parent : this;

if (this->visit_count == 0)
return DBL_MAX;

constexpr double c = 1.4;

double exploitation = (double)this->eval / this->visit_count;
double exploration = c * sqrt(log(parent->visit_count) / this->visit_count);

return exploration + exploitation;
}
[/code]
Пример ошибки
Вот пример, когда ИИ (X) делает ход, игнорирующий выигрышный ход противника:
[code] A   B   C

| X |     1
---|---|---
|   |     2
---|---|---
O |   | O   3
[/code]
Примечание
Я провел много работ по отладке и не смог найти ошибку, поэтому считаю, что моя реализация MCTS неверна. 

Подробнее здесь: [url]https://stackoverflow.com/questions/78710887/bug-in-monte-carlo-tree-search-implementation[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Ошибка в реализации поиска по дереву Монте-Карло.

Последнее сообщение Anonymous « 05 июл 2024, 13:24
Добавлено в форуме C++

Anonymous » 05 июл 2024, 13:24 » в форуме C++

Я работаю над движком «Крестики-нолики», используя алгоритм поиска по дереву Монте-Карло (MCTS). Однако я столкнулся с ошибкой, из-за которой ИИ иногда не может заблокировать выигрышные ходы противника, что приводит к проигрышам. Кроме того,...

0 Ответы

21 Просмотры

Последнее сообщение Anonymous
05 июл 2024, 13:24
Как реализовать поиск по дереву Монте-Карло?

Последнее сообщение Anonymous « 01 ноя 2024, 17:36
Добавлено в форуме Python

Anonymous » 01 ноя 2024, 17:36 » в форуме Python

Я работаю над проектом, который включает в себя поиск по дереву Монте-Карло, и пытаюсь реализовать его для Connect 4, прежде чем пытаться применить его к более сложной задаче.
Вот мой код для игры:
class board:

def __init__(self):
self.board =...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
01 ноя 2024, 17:36
Монте-Карло с OpenMP

Последнее сообщение Гость « 22 сен 2023, 16:42
Добавлено в форуме C++

Гость » 22 сен 2023, 16:42 » в форуме C++

Я изучаю OpenMP, и мне нужно внедрить его в симуляцию Монте-Карло. Однако после того, как я это реализовал, затраченное время все равно не сократилось так сильно, как ожидалось, как показано на рисунке. Мой код OpenMP используется неправильно,...

0 Ответы

31 Просмотры

Последнее сообщение Гость
22 сен 2023, 16:42
Монте-Карло с OpenMP

Последнее сообщение Anonymous « 23 сен 2023, 05:34
Добавлено в форуме C++

Anonymous » 23 сен 2023, 05:34 » в форуме C++

Я изучаю OpenMP, и мне нужно внедрить его в симуляцию Монте-Карло для оценки вероятности появления последовательных королей в перетасованной колоде. Однако после того, как я это реализовал, затраченное время все равно не сократилось так сильно, как...

0 Ответы

27 Просмотры

Последнее сообщение Anonymous
23 сен 2023, 05:34
Как проверить равновесие в моделировании Монте-Карло?

Последнее сообщение Anonymous « 01 мар 2024, 11:53
Добавлено в форуме C#

Anonymous » 01 мар 2024, 11:53 » в форуме C#

Я написал следующий класс, чтобы проверить, находится ли симуляция Монте-Карло в равновесии.

Первая функция использует статистическую проверку ошибок

# Файл: r_end_to_end_squared_scalar.dat # Описание: Данные моделирования Монте-Карло,...

0 Ответы

24 Просмотры

Последнее сообщение Anonymous
01 мар 2024, 11:53

Вернуться в «C++»