PART 7 예고 — AlphaZero (체스, 쇼기까지)
➡️ PART 7 — AlphaZero (2017 12월)
AlphaGo Zero 발표 2개월 후. "같은 알고리즘으로 체스, 쇼기, 바둑 모두 학습".
변화:
- 알파고 Zero의 알고리즘을 완전히 일반화
- 도메인 지식 (대칭, 정석) 모두 제거
- 같은 코드로 3 게임 학습
- 각 게임의 최강 AI를 짧은 시간에 격파
📊 AlphaZero의 성과 (2017 12월 논문)
- 체스: 4시간에 Stockfish 격파 (당시 최강 체스 AI)
- 쇼기: 2시간에 Elmo 격파 (당시 최강 쇼기 AI)
- 바둑: 8시간에 AlphaGo Zero 격파
같은 알고리즘 + 같은 코드 + 다른 게임 입력. 단지 시간만 다름. "진짜 일반 알고리즘".
🎯 시즌 1 마지막 PART
PART 7 (4 챕터):
- Ch 1 · 같은 코드로 여러 게임
- Ch 2 · 도메인 지식 제거
- Ch 3 · 틱택토/커넥트포 학습
- Ch 4 · 일반화의 의미
마지막엔 시즌 1 알파고편 완결. 그리고 시즌 2 (알파폴드) 예고.