챕터 4 정리
📌 챕터 4에서 직접 확인한 것
- 같은 7x7 보드, 같은 시간 → minimax는 (0,0) / MCTS는 중앙 부근
- Iteration 늘릴수록 MCTS 정확도 ↑ (anytime 알고리즘)
- 5000 iter면 (5,4) 안정적 선택, 승률 74%
- minimax vs MCTS 직접 대국 (단순화 코드)
- MCTS의 4대 장점: 평가 무관, 비대칭, anytime, 도메인 독립
🏆 알고리즘이 만든 차이
2006년 이전: 30년의 정체 (아마추어 9급)
2006년 MCTS 도입: 단번에 아마추어 5단 (1300 ELO 도약)
2010년대 MCTS 정교화: 아마추어 7~8단
알고리즘 하나가 30년의 정체를 뚫음. 우리가 만든 코드의 본질이 같음.
➡️ 다음 챕터 — MCTS의 한계
MCTS도 결국 19x19에서는 사람 프로한테 못 이김 (2010~2014 시기). 왜?
핵심 약점: 무작위 rollout의 품질. 19x19에서는 한 게임에 250수, 그 중 200수가 무작위면 너무 노이즈. 통계 신호가 잠겨.
다음 챕터에서 MCTS의 한계를 보고, PART 4 신경망의 출발점을 짚는다.