시즌 1 · 알파고편 / PART 3 · PART 3 · 무작위의 힘: MCTS / Ch 3 · MCTS 4단계

챕터 3 정리

📌 챕터 3에서 만든 것

  • MCTS 4단계: Select → Expand → Simulate → Backup
  • Node 클래스 — visits, wins, ucb1() 메서드
  • mcts_best_move 함수 — N번 iteration 후 최선의 수
  • 틱택토 빈 보드에서 (1,1) 358회 방문 — 정답
  • 응징 시나리오에서 (1,1) 988회 방문, 78% 승률 — minimax와 일치
  • 비대칭 트리 — 좋은 가지로 깊게, 안 좋은 가지는 얕게
🏆 우리가 가진 것

이제 MCTS를 완전히 구현했어. 평가 함수 없이, 모든 수를 다 보지 않고, 통계로 좋은 수를 찾는 알고리즘. minimax의 두 약점을 모두 우회.

다음 챕터에서 이걸로 PART 2 Ch 6의 실패를 응징.

➡️ 다음 챕터 — 정면 대결

PART 2 Ch 6에서 7x7 바둑에 minimax 적용 → 깊이 4가 한계, 모든 자리 (0,0) 추천이었어. 같은 7x7 보드에 MCTS를 적용해 직접 비교.

결과는 — MCTS 압승. 코드와 시간 측정으로 직접 보자. 2006년 컴퓨터 바둑이 도약한 그 순간의 재현.