챕터 6 & PART 2 정리
📌 챕터 6에서 직접 체험한 것
- 같은 minimax + 알파-베타로 7x7 바둑 → 실패
- 평가 함수 단순 (돌 수, 영역) → 사람 직관과 다른 결과
- 분기 인자 ~35로 깊이 4~5가 한계
- 실측: 7x7 빈 보드 깊이 4가 0.14초, 깊이 5는 수 초~수십 초
- 두 가지 실패가 동시에 발생 — 속도 + 평가
🎯 PART 2 전체 정리
- Ch 1: 게임 트리 — 모든 미래를 트리로 표현, b^d 폭발
- Ch 2: Minimax — "내가 최선, 상대도 최선"의 클래식 알고리즘
- Ch 3: 알파-베타 — minimax와 결과 같고 속도만 30배 빠름
- Ch 4: 탐색 공간 폭발 — 10^170, 알파-베타로도 부족
- Ch 5: 틱택토 완벽 AI — 작은 게임에서는 성공
- Ch 6: 7x7 바둑 minimax 실패 — 같은 알고리즘 다른 결과
🏆 우리가 만든 것
PART 2가 끝났어. 만든 것들:
- 게임 트리 표현 + DFS 탐색
- Minimax 알고리즘 (10줄 재귀)
- 알파-베타 가지치기 (4줄 추가, 30배 가속)
- 틱택토 완벽 AI
- 7x7 바둑 minimax (한계 직접 측정)
이게 1980~2005년 컴퓨터 바둑이 가졌던 모든 도구. 이걸로 사람한테 못 이긴 게 30년의 정체.
➡️ PART 3 예고: 무작위의 힘 — MCTS
2006년 컴퓨터 바둑이 한 단계 도약함. 그 비결은 의외로 무작위야.
"모든 수를 다 정확히 평가하지 말고, 여러 수에 대해 끝까지 무작위로 두어보는 시뮬레이션을 많이 돌려서, 통계적으로 좋은 수를 찾는다."
처음 들으면 황당해. 무작위가 어떻게 똑똑한 결정을? 그런데 동작해. 1만 번의 무작위 게임 끝까지 가서 평균 결과를 보면, 그게 사람의 직관보다 정확.
PART 3에서 MCTS를 직접 구현해. 그리고 같은 7x7 보드에 적용해서 minimax와 비교. 결과는 — minimax 압승. 시즌 1의 다음 거대한 발걸음.