확인 퀴즈

MuZero의 MCTS 한 번 시뮬레이션에서 신경망 g와 f는 각각 어떤 단계에서 호출되는가?

← 이전 왜 이게 작동하는가 — 잠재 공간의 자유도 다음 → 챕터 4 정리 — MuZero의 전체 그림