시즌 1 · 알파고편 / PART 7 · PART 7 · AlphaZero (2017) / Ch 3 · 틱택토/커넥트포 학습

같은 알고리즘, 다른 게임

👋 이 챕터에서 다룰 것

지금까지 본 알파고 알고리즘을 틱택토와 커넥트포에 적용. "정말 같은 코드로 다른 게임?" — 직접 확인.

📖 두 게임 비교
속성 틱택토 커넥트포 바둑 7x7
보드3x37x67x7
가능한 수97 (열)49
게임 길이~9수~42수~80수
상태 수~5,000~10^14~10^30
완전분석풀림풀림 (1988)대략적
🎯 PART 2 틱택토 minimax vs PART 7 틱택토 AlphaZero

PART 2에서 우리는 틱택토를 minimax + 알파-베타로 풀었어. 완전탐색으로 가능.

이번에는 AlphaZero 스타일로 풀음. 더 복잡한 알고리즘이지만 같은 코드가 더 어려운 게임도 가능.

💡 왜 틱택토에 AlphaZero가 과한가

틱택토는 minimax로 충분히 풀림. AlphaZero를 쓰는 이유:

  • 알고리즘이 정말 일반인지 검증
  • 같은 코드가 큰 게임에도 적용됨을 보여줌
  • "학습"이 결정적 알고리즘과 다른 방식임을 확인