챕터 3 정리

🏆 우리가 본 것

"다음 수 어디?"라는 단순한 질문에 신경망으로 답. 사람의 직관을 학습. 16만 프로 게임에서 다음 수를 맞추는 과제로 훈련하면, 신경망이 사람 같은 패턴 인식을 갖춤.

➡️ 다음 챕터에서는

두 번째 신경망 — Value Network (가치망). "이 보드 누구한테 좋은가?"라는 질문. 출력은 단 하나의 숫자 (-1~+1).

이게 MCTS의 ③ Simulate를 대체. rollout 안 가도 즉시 평가 가능. 시간 절약 + 정확도 향상.