시즌 1 · 알파고편 / PART 6 · PART 6 · AlphaGo Zero (2017) / Ch 5 · 학습 곡선 실험

PART 7 예고 — AlphaZero (체스, 쇼기까지)

➡️ PART 7 — AlphaZero (2017 12월)

AlphaGo Zero 발표 2개월 후. "같은 알고리즘으로 체스, 쇼기, 바둑 모두 학습".

변화:

  • 알파고 Zero의 알고리즘을 완전히 일반화
  • 도메인 지식 (대칭, 정석) 모두 제거
  • 같은 코드로 3 게임 학습
  • 각 게임의 최강 AI를 짧은 시간에 격파
📊 AlphaZero의 성과 (2017 12월 논문)
  • 체스: 4시간에 Stockfish 격파 (당시 최강 체스 AI)
  • 쇼기: 2시간에 Elmo 격파 (당시 최강 쇼기 AI)
  • 바둑: 8시간에 AlphaGo Zero 격파

같은 알고리즘 + 같은 코드 + 다른 게임 입력. 단지 시간만 다름. "진짜 일반 알고리즘".

🎯 시즌 1 마지막 PART

PART 7 (4 챕터):

  • Ch 1 · 같은 코드로 여러 게임
  • Ch 2 · 도메인 지식 제거
  • Ch 3 · 틱택토/커넥트포 학습
  • Ch 4 · 일반화의 의미

마지막엔 시즌 1 알파고편 완결. 그리고 시즌 2 (알파폴드) 예고.