왜 MCTS가 더 강한가 — 알고리즘 본질
같은 시간에 왜 MCTS가 minimax를 압도하는지, 본질적 이유 4가지:
📖 이유 1: 평가 함수 불필요
Minimax는 끝까지 못 가니까 중간에서 heuristic으로 점수 매김. 바둑의 좋은 heuristic이 어려워서 부정확 → 잘못된 선택.
MCTS는 끝까지 무작위로 두고 결과를 보니까 "진짜 결과 분포"를 직접 측정. heuristic 필요 없음.
📖 이유 2: 비대칭 탐색
Minimax는 모든 가지를 같은 깊이로 탐색 — b^d 노드 모두. 깊이 한계가 분명.
MCTS는 UCB1로 좋은 가지에 집중 → 같은 시간에 좋은 가지를 훨씬 깊이 봄. 한 핵심 수순을 50수까지 봐서 함정/실수를 찾아냄.
📖 이유 3: 시간 가변
Minimax는 깊이 5에서 6으로 가려면 분기 인자만큼 시간이 폭발. 부드럽게 시간 늘릴 수 없음.
MCTS는 iteration 수가 곧 시간 → 1초든 1분이든 부드럽게. 더 주면 더 강해짐. "anytime 알고리즘".
📖 이유 4: 도메인 독립
Minimax는 게임마다 heuristic 새로 설계해야. 체스 heuristic, 바둑 heuristic, 쇼기 heuristic... 각 분야 전문가가 필요.
MCTS는 게임 규칙만 알면 동작. 어떤 새 게임에도 즉시 적용. AlphaZero(2017)가 체스, 쇼기, 바둑을 같은 알고리즘으로 처리한 비결.
🎯 정리 — MCTS의 4대 장점
- 평가 함수 무관 — 시뮬레이션이 직접 평가
- 비대칭 탐색 — 좋은 가지에 깊이
- Anytime — 시간만큼 강해짐
- 도메인 독립 — 게임 규칙만 알면 동작
이 4가지가 합쳐져서 2006년 컴퓨터 바둑이 도약. 그리고 2016년 알파고가 이세돌을 이기는 기반.
그러나 MCTS도 만능은 아니야. 19x19에서는 여전히 약점이 있어. 그게 신경망 도입의 이유. 다음 챕터.