같은 알고리즘, 다른 게임
👋 이 챕터에서 다룰 것
지금까지 본 알파고 알고리즘을 틱택토와 커넥트포에 적용. "정말 같은 코드로 다른 게임?" — 직접 확인.
📖 두 게임 비교
| 속성 | 틱택토 | 커넥트포 | 바둑 7x7 |
|---|---|---|---|
| 보드 | 3x3 | 7x6 | 7x7 |
| 가능한 수 | 9 | 7 (열) | 49 |
| 게임 길이 | ~9수 | ~42수 | ~80수 |
| 상태 수 | ~5,000 | ~10^14 | ~10^30 |
| 완전분석 | 풀림 | 풀림 (1988) | 대략적 |
🎯 PART 2 틱택토 minimax vs PART 7 틱택토 AlphaZero
PART 2에서 우리는 틱택토를 minimax + 알파-베타로 풀었어. 완전탐색으로 가능.
이번에는 AlphaZero 스타일로 풀음. 더 복잡한 알고리즘이지만 같은 코드가 더 어려운 게임도 가능.
💡 왜 틱택토에 AlphaZero가 과한가
틱택토는 minimax로 충분히 풀림. AlphaZero를 쓰는 이유:
- 알고리즘이 정말 일반인지 검증
- 같은 코드가 큰 게임에도 적용됨을 보여줌
- "학습"이 결정적 알고리즘과 다른 방식임을 확인