AlphaZero (2017 12월) — 일반화의 시대

🚀 2017년 12월 — 또 한 번의 충격

AlphaGo Zero 발표 2개월 후, DeepMind 새 논문:

"Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm"

핵심: "같은 알고리즘, 같은 코드. 체스, 쇼기, 바둑 모두 마스터."

📖 AlphaGo Zero vs AlphaZero

또 다른 단순화 — 도메인 지식 + 평가 단계 제거. 더 강해짐.

📊 AlphaZero 성과 (논문 Table 1)

같은 알고리즘, 같은 코드. 시간만 다름. "각 게임의 최강 AI를 짧은 시간에 격파".

이 PART (4 챕터, 시즌 1 마지막):