Попытка реализовать Tic-Tac-Toe с помощью Minimax algortighm, но не оптимальные движения

Попытка реализовать Tic-Tac-Toe с помощью Minimax algortighm, но не оптимальные движения ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Попытка реализовать Tic-Tac-Toe с помощью Minimax algortighm, но не оптимальные движения

Цитата

Сообщение Anonymous » 02 мар 2025, 12:42

Я пытаюсь внедрить игру Tic-tac-toe, используя Minimax algortihm. Я запустил программу, но она не выбрала оптимальный ход, и я действительно потерял, почему это не так, это, вероятно, проблема в функции Minimax, но я, возможно, заканчивает неправильно. Так, например, если я положил X в любом месте, он всегда начинает при 3,3 < /p>
1 2 3
1
2 X
3 O
< /code>
Это также не пытается заблокировать 3 в строке, поэтому, если я помесчу еще один x в 1,1, я получаю этот результат: < /p>
1 2 3
1 X
2 X
3 O O
< /code>
Кажется, что он активно переключился на худшее движение, в итоге я в конечном итоге выглядит так: < /p>
1 2 3
1 X X O
2 O X
3 X O O
< /code>
Это согласуется с различными состояниями доски.from abc import ABC, abstractmethod
import numpy as np
import math
#create the nodes for a board state
class Node(ABC):
@abstractmethod
def find_children(self):
"All possible successors of this board state"
return set()
@abstractmethod
def is_terminal(self):
"Returns True if the node has no children"
return True
@abstractmethod
def reward(self):
"Assumes `self` is terminal node. 1=win, 0=loss, .5=tie, etc"
return 0

class MinimaxTreeSearch:
def __init__(self, depth=5):
self.depth = depth # Define search depth limit

def choose(self, node):
if node.is_terminal() or self.depth==0:
raise RuntimeError(f"choose called on terminal node {node}")
best_move,_ = self.minimax(node, self.depth,maxi=True)
return best_move
def minimax(self, node, depth,maxi):
if depth == 0 or node.is_terminal():
return None, self.evaluate(node)
moves = list(node.find_children())
if maxi:
best = -math.inf
best_move = None
for move in moves:
_, value = self.minimax(node=move, depth=depth-1,maxi=False)
if value > best:
best = value
best_move = move
return best_move, best
else:
best = math.inf
best_move = None
for move in moves:
_, value = self.minimax(node=move, depth=depth-1,maxi=True)
if value < best:
best = value
best_move = move
return best_move, best

def evaluate(self, node):
if node.is_terminal():
return node.reward() # Use game-specific reward
return 0 # Neutral score for intermediate states

class ticboard(Node):
def __init__(board, board_state=[None,] * 9, winner=None,turn=True, terminal=False):
board.board_state=board_state

board.turn = turn
board.winner = winner
board.terminal = terminal
def find_children(board):
if board.terminal:
return set()
return{board.make_move(i) for i, value in enumerate(board.board_state) if value is None}

def reward(board):
if not board.terminal:
raise RuntimeError(f"reward on no terminal board {board}")
if board.winner is None:
return 0.5
if board.winner == board.turn:
return 1
return 0

def is_terminal(board):
return board.terminal

def make_move(board, index):
board_state= board.board_state.copy()
board_state[index] = board.turn
turn = not board.turn
winner = find_winner(board_state)
is_terminal = (winner is not None) or not any(spot is None for spot in board_state)
return ticboard(board_state,winner,turn,is_terminal)

def to_pretty_string(board):
to_char = lambda v: ("X" if v is True else ("O" if v is False else " "))
rows = [
[to_char(board.board_state[3 * row + col]) for col in range(3)] for row in range(3)
]
return (
"\n 1 2 3\n"
+ "\n".join(str(i + 1) + " " + " ".join(row) for i, row in enumerate(rows))
+ "\n"
)

def play_game():
tree = MinimaxTreeSearch(depth=5)
board = ticboard()
print(board.to_pretty_string())
while True:
row_col = input("enter row,col: ")
row, col = map(int, row_col.split(","))
index = 3 * (row - 1) + (col - 1)
if board.board_state[index] is not None:
raise RuntimeError("Invalid move")
board = board.make_move(index)
print(board.to_pretty_string())
if board.terminal:
break
board = tree.choose(board)
print(board.to_pretty_string())
if board.terminal:
break

def win_combos():
combos=[]
for start in range(0, 9, 3): # three in a row
combos.append([start, start + 1, start + 2])
for start in range(3): # three in a column
combos.append([start, start + 3, start + 6])
combos.append([0, 4, 8])
combos.append([2, 4, 6])
return(combos)

def find_winner(board_state):
win_combo= win_combos()
for combo in win_combo:
for player in [True,False]:
a, b ,c = combo
if board_state[a] == board_state == board_state[c] and board_state[a] is player:
return player
return None

if __name__ == "__main__":
play_game()
< /code>
Я пытался использовать node.turn вместо maxi (максимизация игрока), но мне трудно понять, как я должен его использовать. Спасибо за помощь и хорошего дня!

Подробнее здесь: https://stackoverflow.com/questions/794 ... not-optima

1740908523

Anonymous

 Я пытаюсь внедрить игру Tic-tac-toe, используя Minimax algortihm. Я запустил программу, но она не выбрала оптимальный ход, и я действительно потерял, почему это не так, это, вероятно, проблема в функции Minimax, но я, возможно, заканчивает неправильно.  Так, например, если я положил X в любом месте, он всегда начинает при 3,3 < /p>
  1 2 3
1
2 X
3     O
< /code>
Это также не пытается заблокировать 3 в строке, поэтому, если я помесчу еще один x в 1,1, я получаю этот результат: < /p>
  1 2 3
1 X
2 X
3   O O
< /code>
Кажется, что он активно переключился на худшее движение, в итоге я в конечном итоге выглядит так: < /p>
  1 2 3
1 X X O
2 O X
3 X O O
< /code>
Это согласуется с различными состояниями доски.from abc import ABC, abstractmethod
import numpy as np
import math
#create the nodes for a board state
class Node(ABC):
@abstractmethod
def find_children(self):
"All possible successors of this board state"
return set()
@abstractmethod
def is_terminal(self):
"Returns True if the node has no children"
return True
@abstractmethod
def reward(self):
"Assumes `self` is terminal node.  1=win, 0=loss, .5=tie, etc"
return 0

class MinimaxTreeSearch:
def __init__(self, depth=5):
self.depth = depth  # Define search depth limit

def choose(self, node):
if node.is_terminal() or self.depth==0:
raise RuntimeError(f"choose called on terminal node {node}")
best_move,_ = self.minimax(node, self.depth,maxi=True)
return best_move
def minimax(self, node, depth,maxi):
if depth == 0 or node.is_terminal():
return None, self.evaluate(node)
moves = list(node.find_children())
if maxi:
best = -math.inf
best_move = None
for move in moves:
_, value = self.minimax(node=move, depth=depth-1,maxi=False)
if value > best:
best = value
best_move = move
return best_move, best
else:
best = math.inf
best_move = None
for move in moves:
_, value = self.minimax(node=move, depth=depth-1,maxi=True)
if value < best:
best = value
best_move = move
return best_move, best

def evaluate(self, node):
if node.is_terminal():
return node.reward()  # Use game-specific reward
return 0  # Neutral score for intermediate states

class ticboard(Node):
def __init__(board, board_state=[None,] * 9, winner=None,turn=True, terminal=False):
board.board_state=board_state

board.turn = turn
board.winner = winner
board.terminal = terminal
def find_children(board):
if board.terminal:
return set()
return{board.make_move(i) for i, value in enumerate(board.board_state) if value is None}

def reward(board):
if not board.terminal:
raise RuntimeError(f"reward on no terminal board {board}")
if board.winner is None:
return 0.5
if board.winner == board.turn:
return 1
return 0

def is_terminal(board):
return board.terminal

def make_move(board, index):
board_state= board.board_state.copy()
board_state[index] = board.turn
turn = not board.turn
winner = find_winner(board_state)
is_terminal = (winner is not None) or not any(spot is None for spot in board_state)
return ticboard(board_state,winner,turn,is_terminal)

def to_pretty_string(board):
to_char = lambda v: ("X" if v is True else ("O" if v is False else " "))
rows = [
[to_char(board.board_state[3 * row + col]) for col in range(3)] for row in range(3)
]
return (
"\n  1 2 3\n"
+ "\n".join(str(i + 1) + " " + "  ".join(row) for i, row in enumerate(rows))
+ "\n"
)

def play_game():
tree = MinimaxTreeSearch(depth=5)
board = ticboard()
print(board.to_pretty_string())
while True:
row_col = input("enter row,col: ")
row, col = map(int, row_col.split(","))
index = 3 * (row - 1) + (col - 1)
if board.board_state[index] is not None:
raise RuntimeError("Invalid move")
board = board.make_move(index)
print(board.to_pretty_string())
if board.terminal:
break
board = tree.choose(board)
print(board.to_pretty_string())
if board.terminal:
break

def win_combos():
combos=[]
for start in range(0, 9, 3):  # three in a row
combos.append([start, start + 1, start + 2])
for start in range(3):  # three in a column
combos.append([start, start + 3, start + 6])
combos.append([0, 4, 8])
combos.append([2, 4, 6])
return(combos)

def find_winner(board_state):
win_combo= win_combos()
for combo in win_combo:
for player in [True,False]:
a, b ,c = combo
if board_state[a] == board_state[b] == board_state[c] and board_state[a] is player:
return player
return None

if __name__ == "__main__":
play_game()
< /code>
Я пытался использовать node.turn вместо maxi (максимизация игрока), но мне трудно понять, как я должен его использовать. Спасибо за помощь и хорошего дня!  

Подробнее здесь: [url]https://stackoverflow.com/questions/79478383/trying-to-implement-tic-tac-toe-using-minimax-algortighm-but-getting-not-optima[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

C # - Tic Tac Toe Minimax не приводит к непобедимой игре

Последнее сообщение Anonymous « 25 янв 2025, 04:17
Добавлено в форуме C#

Anonymous » 25 янв 2025, 04:17 » в форуме C#

Я изучал, как кодировать алгоритм минимакса, который делает его так, что игра Tic-Tac-Toe может заканчиваться только в розыгрыше или потере, однако всякий раз, когда я играю против компьютера, я все еще могу выиграть, Поскольку компьютер не выбирает...

0 Ответы

21 Просмотры

Последнее сообщение Anonymous
25 янв 2025, 04:17
Python - Как напечатать игровой доску Tic Tac Tac Toe с помощью Loop

Последнее сообщение Anonymous « 02 апр 2025, 23:27
Добавлено в форуме Python

Anonymous » 02 апр 2025, 23:27 » в форуме Python

Я новичок в Python. Хотел бы распечатать игровой доску для Tic Tac Toe. Могу я узнать, как печатать с помощью цикла? board = {
1: ' ', 2: ' ', 3: ' ',
4: ' ', 5: ' ', 6: ' ',
7: ' ', 8: ' ', 9: ' '
}
def printBoard():
print(board + '|'+ board...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
02 апр 2025, 23:27
Мне нужна помощь в создании этой игры Tic-Tac-Toe с помощью PHP

Последнее сообщение Anonymous « 08 июн 2025, 22:03
Добавлено в форуме Html

Anonymous » 08 июн 2025, 22:03 » в форуме Html

Мне нужно создать игру Tic-tac-toe с помощью PHP. Вот мой начальный код, однако, щелкнув плитку в таблице, только обновляет страницу, и он не регистрирует мой вход в плату. Как я могу заставить этот код работать?

Tic Tac Toe

/* Styling for the...

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
08 июн 2025, 22:03
Мне нужна помощь в создании этой игры Tic-Tac-Toe с помощью PHP

Последнее сообщение Anonymous « 08 июн 2025, 22:03
Добавлено в форуме CSS

Anonymous » 08 июн 2025, 22:03 » в форуме CSS

Мне нужно создать игру Tic-tac-toe с помощью PHP. Вот мой начальный код, однако, щелкнув плитку в таблице, только обновляет страницу, и он не регистрирует мой вход в плату. Как я могу заставить этот код работать?

Tic Tac Toe

/* Styling for the...

0 Ответы

13 Просмотры

Последнее сообщение Anonymous
08 июн 2025, 22:03
Проверка победителя TIC TAC TOE Java [закрыто]

Последнее сообщение Anonymous « 29 дек 2023, 20:44
Добавлено в форуме JAVA

Anonymous » 29 дек 2023, 20:44 » в форуме JAVA

Какова была бы идеальная логика для проверки условия победителя в крестиках-тактиках? По некоторым причинам мне не разрешено использовать циклы, переключатели, массивы и тройные числа, разрешено использовать только if else, и все должно быть в одной...

0 Ответы

26 Просмотры

Последнее сообщение Anonymous
29 дек 2023, 20:44

Вернуться в «Python»