시즌 2 · 알파폴드편/PART 8 · PART 8 · MuZero (2019)/Ch 1 · AlphaZero의 한계 — 규칙이 있어야 한다
확인 퀴즈
AlphaZero가 MCTS의 Expand 단계에서 next_state(s, a) 함수를 호출하는 이유는?
해설
Expand 단계는 현재 노드의 자식 노드(가능한 다음 상태)를 만드는 단계다. 이를 위해 게임 규칙 함수 next_state(s, a)가 필수적으로 필요하다. 이 함수가 없으면 트리를 키울 수 없고, MCTS도 작동하지 않는다. AlphaZero가 "perfect simulator를 가정한다"는 표현이 바로 이걸 가리킨다.