시즌 2 · 알파폴드편/PART 8 · PART 8 · MuZero (2019)/Ch 5 · Atari + 바둑 + 체스 = 같은 알고리즘
확인 퀴즈
MuZero가 보드 게임뿐 아니라 아타리에서도 작동했다는 사실이 가장 강하게 시사하는 것은?
해설
핵심 메시지는 "알고리즘 본체(h, g, f + MCTS)는 변하지 않고, 도메인 명세(입력 형태, 행동 수, 할인율 등)만 환경에 맞게 조정하면 보드 게임처럼 결정론적·이산 환경도, 아타리처럼 픽셀·확률적 환경도 모두 처리 가능하다는 것"이다. 이게 PART 9 이후 AlphaFold로 가는 일반화의 정당화다. 다른 보기들은 너무 과장된 결론(model-free 무용지물) 또는 잘못된 추론(아타리 = 보드).