코드: 완성된 7x7 CNN Policy Network
완성된 7x7 CNN! 2,913 가중치로 49 자리 확률 출력.
🎯 결과 분석
빈 보드에서 모든 자리 0.0204 ≈ 1/49 — 완전 균등. 왜?
- 입력이 균등 (모든 자리가 빈자리, 채널 2가 1)
- 가중치 무작위라 위치 특화 신호 없음
- 합성곱이라 모든 위치에 같은 가중치 적용 → 같은 출력
이게 정상. 빈 보드에서 차이가 나려면 학습이 필요.
💡 가중치 수 비교
| 모델 | 가중치 수 | 크기 비교 |
|---|---|---|
| 우리 7x7 CNN | 2,913 | 기준 |
| 19x19 MLP (가상) | ~250,000 | 85배 |
| 알파고 13층 CNN | ~3,500,000 | 1,200배 |
| 알파고 Zero 40 잔차 | ~21,000,000 | 7,200배 |
모델이 클수록 더 복잡한 패턴 학습. 우리 7x7은 작아도 핵심 알고리즘은 동일.
📖 빈 보드에서 학습된 모델이 출력하는 것
충분히 학습된 모델이라면 빈 보드에 다음 같은 분포:
- 중앙 화점 (3,3) ≈ 0.15 (가장 강함)
- 3-3 자리들 → 0.08~0.12
- 변 가운데 → 0.03
- 1선/2선 가장자리 → 0.001
학습이 곧 "균등에서 의미 있는 분포로의 전환". 다음 챕터에서 직접.
PYTHON