7x7 미니 알파고 — 우리가 알파고를 만든다
🏆 시즌 1 클라이맥스
드디어 알파고를 만든다. 7x7 보드에 맞는 미니 알파고. 지금까지 만든 모든 부품 통합.
최종 코드 구조:
📖 미니 알파고의 부품
- Board 클래스 (PART 1) — 7x7 게임 규칙
- Policy Network (PART 4 Ch 5) — 학습된 정책
- Value Network (PART 4 Ch 4) — 학습된 가치
- MCTS with PUCT (PART 3 + PART 5 Ch 4) — 트리 탐색
- 통합 함수: alphago_move(board) → 다음 수
🎯 알파고와의 차이 — 축소판
| 속성 | 알파고 | 우리 미니 알파고 |
|---|---|---|
| 보드 | 19x19 | 7x7 |
| 입력 채널 | 48 | 3 (흑/백/빈) |
| CNN 깊이 | 13층 | 3층 |
| 필터 수 | 192 | 16 |
| 가중치 수 | 350만 | 3,000 정도 |
| MCTS iter | 50,000 | 500 |
| 학습 데이터 | 3000만 | 합성 1000개 (시범) |
스케일은 다르지만 알고리즘은 동일.
이 챕터의 코드는 길어 (이 책의 가장 큰 코드 섹션). 그래도 본질은 우리가 PART 1~4에서 만든 것들의 결합.