게임 탐색 알고리즘: 미니맥스와 알파-베타 가지치기

탐색 방법 개요

탐색

맹목적 탐색
정보이용 탐색
게임에서의 탐색 → 적대적탐색(두개의 에이전트가 적대적 관계를 가질 때)

게임에서의 탐색 알고리즘

minimax 알고리즘
알파 — 베타 가지치기
몬테카를로 시뮬레이션
몬테카를로 트리 탐색

minimax 알고리즘

두 사람이 번갈아 수를 두고 승패를 겨루는 게임으로 확장
체스와 바둑 등
새로운 탐색 알고리즘 필요
인공지능은 어떤 전략을 구사해 상대를 이길 수 있을까?
미니맥스 전략
내가 둘차례에서는 MAX
상대 차례에서는 min을 적용(상대의 최적의 수는 나에게 최악의 수이므로 min 적용.)

alpha−Beta 가지치기

Minimax을 개선한 적대적 탐색방법으로써, MAX가 찾아 놓은 최선값인 알파값을 유지하여 후보 노드의 좋은 정도가 알파값 보다작을 경우 가지치기를 함으로써 보다 효율적인 탐색 수행

인공지능과 관련된 흥미로운 문제들

제약조건 만족 문제

인공지능 문제 해결을 위한 중요 단계

문제를 명확하게 정의
문제에 대한 철저한 분석
정해진 제약 조건이나 규칙이 있는 경우 규칙의 적용에 대한 검증
최적의 기법 선택
결과가 나오면 과정에 문제점이 없는지 분석 검토

초기의 인공지능 적용 문제 ‘상자 쌓기’

일정한 규칙과 목표 상태가 주어진 경우
인공지능을 이용하여 해결하는 방법의 예

tic-tae-toe 문제

from math import sqrt,log
import random

n=3
start='-'*(n*n)
class Node():
    def __init__(self,state,player=None,pos=None,parent=None):
        self.state=state
        self.player=player
        self.pos=pos
        self.parent=parent
        self.nwin=0
        self.nvisit=0
        self.untried=get_empty(state)
        self.children=[]
    def UCTselect(self):
        s=sorted(self.children, key=lambda c: c.nwin/c.nvisit+sqrt(log(self.nvisit)/c.nvisit))
        return s[-1]
    def makeChild(self,state,pos,player):
        node=Node(state,player,pos,parent=self)
        self.untried.remove(pos)
        self.children.append(node)
        return node
    def update(self,winner):
        self.nvisit+=1
        if winner=='T': # 비긴 경우
            self.nwin+=0.5
        elif winner==self.player:
            self.nwin+=1
    def __repr__(self):
        return str(self.state)+" "+str(self.nwin)+"/"+str(self.nvisit)
def Move(state,pos,player):
    return state[:pos]+player+state[pos+1:]
def switch_player(player):
    return 'X' if player=='O' else 'O'
def print_board(state):
    print('  0123456789012345'[:n+2])
    for i in range(n):
        print(str(i%10)+':'+state[n*i:n*(i+1)])
def get_empty(state):
    if decide_winner(state) in ['O','X','T']: # 승자가 정해지면
        return []
    empty=[]
    for i in range(len(start)):
        if state[i]=='-':
            empty.append(i)
    return empty
def decide_winner(state):
    for (a,b,c) in [(0,1,2),(3,4,5),(6,7,8),(0,3,6),(1,4,7),(2,5,8),(0,4,8),(2,4,6)]:
        if state[a]==state[b]==state[c]:
            if state[a]=='O': return 'O'
            elif state[a]=='X': return 'X'
    if [i for i in range(n*n) if state[i]=='-']==[]: return 'T' # Tie (비김)
    return 'N' # 아직 승자 정해지지 않음
def mcts(state,player):
    root=Node(state)
    for i in range(10000):
        node=root
        state=node.state
        roll_player=player
        while node.untried==[] and node.children!=[]: # 선택
            node = node.UCTselect()
            state=Move(state,node.pos,roll_player)
            roll_player=switch_player(roll_player)
        if node.untried!=[]: # 확장
            pos=random.choice(node.untried)
            state=Move(state,pos,roll_player)
            node=node.makeChild(state,pos,roll_player)
            roll_player=switch_player(roll_player)
        while True: # 시뮬레이션
            e=get_empty(state)
            if e==[]: break
            state=Move(state,random.choice(e),roll_player)
            roll_player=switch_player(roll_player)
        winner=decide_winner(state) # 백트랙킹
        while node!=None:
            node.update(winner);
            node = node.parent
    return sorted(root.children,key=lambda c:c.nwin/c.nvisit)[-1].pos
def tictactoe_play(first_mover):
    state=start
    player=first_mover
    print_board(state)
    while True:
        if player=='X':
            print("컴퓨터 차례입니다.")
            pos=mcts(state,player)
        elif player=='O':
            x,y=input("사람 차례입니다. (x와 y를 공백 구분하여 입력하세요.)").split()
            pos=int(y)*n+int(x)
            if state[pos]!='-':
                print("둘 수 없는 곳입니다.")
                continue
        state=Move(state,pos,player)
        print_board(state)
        winner=decide_winner(state)
        if winner in ['O','X','T']:
            if winner=='T': print('비겼습니다.')
            else: print(winner,'가 이겼습니다.')
            break
        player=switch_player(player)
# 틱택토를 시작하는 main
tictactoe_play('O')

저작자표시 비영리 변경금지 (새창열림)

'🧑🏽‍💻Dev:Lang > Python' 카테고리의 다른 글

Python: Matplotlib을 활용한 데이터 시각화 (0)	2026.03.23
Python: DFS 및 BFS, A* 알고리즘 설명 (0)	2026.03.23
Python: 고급 NumPy 기능으로 데이터 분석하기 (0)	2026.03.23
Python: Streamlit을 이용한 관광지 데이터 분석 (0)	2026.03.20
Python: 회귀분석과 KNN 패키지부터 모형화까지 (0)	2026.03.20

탐색 방법 개요

탐색

게임에서의 탐색 알고리즘

minimax 알고리즘

alpha−Beta 가지치기

인공지능과 관련된 흥미로운 문제들

제약조건 만족 문제

인공지능 문제 해결을 위한 중요 단계

초기의 인공지능 적용 문제 ‘상자 쌓기’

tic-tae-toe 문제

'🧑🏽‍💻Dev:Lang > Python' 카테고리의 다른 글

티스토리툴바