챕터 3 정리
📌 챕터 3에서 만든 것
- MCTS 4단계: Select → Expand → Simulate → Backup
- Node 클래스 — visits, wins, ucb1() 메서드
- mcts_best_move 함수 — N번 iteration 후 최선의 수
- 틱택토 빈 보드에서 (1,1) 358회 방문 — 정답
- 응징 시나리오에서 (1,1) 988회 방문, 78% 승률 — minimax와 일치
- 비대칭 트리 — 좋은 가지로 깊게, 안 좋은 가지는 얕게
🏆 우리가 가진 것
이제 MCTS를 완전히 구현했어. 평가 함수 없이, 모든 수를 다 보지 않고, 통계로 좋은 수를 찾는 알고리즘. minimax의 두 약점을 모두 우회.
다음 챕터에서 이걸로 PART 2 Ch 6의 실패를 응징.
➡️ 다음 챕터 — 정면 대결
PART 2 Ch 6에서 7x7 바둑에 minimax 적용 → 깊이 4가 한계, 모든 자리 (0,0) 추천이었어. 같은 7x7 보드에 MCTS를 적용해 직접 비교.
결과는 — MCTS 압승. 코드와 시간 측정으로 직접 보자. 2006년 컴퓨터 바둑이 도약한 그 순간의 재현.