시즌 1 · 알파고편 / PART 3 · PART 3 · 무작위의 힘: MCTS / Ch 4 · 순수 MCTS로 7x7 바둑

챕터 4 정리

📌 챕터 4에서 직접 확인한 것

  • 같은 7x7 보드, 같은 시간 → minimax는 (0,0) / MCTS는 중앙 부근
  • Iteration 늘릴수록 MCTS 정확도 ↑ (anytime 알고리즘)
  • 5000 iter면 (5,4) 안정적 선택, 승률 74%
  • minimax vs MCTS 직접 대국 (단순화 코드)
  • MCTS의 4대 장점: 평가 무관, 비대칭, anytime, 도메인 독립
🏆 알고리즘이 만든 차이

2006년 이전: 30년의 정체 (아마추어 9급)

2006년 MCTS 도입: 단번에 아마추어 5단 (1300 ELO 도약)

2010년대 MCTS 정교화: 아마추어 7~8단

알고리즘 하나가 30년의 정체를 뚫음. 우리가 만든 코드의 본질이 같음.

➡️ 다음 챕터 — MCTS의 한계

MCTS도 결국 19x19에서는 사람 프로한테 못 이김 (2010~2014 시기). 왜?

핵심 약점: 무작위 rollout의 품질. 19x19에서는 한 게임에 250수, 그 중 200수가 무작위면 너무 노이즈. 통계 신호가 잠겨.

다음 챕터에서 MCTS의 한계를 보고, PART 4 신경망의 출발점을 짚는다.