대칭은 안 써도 학습되나?
"대칭이 8배 데이터인데 안 쓰면 학습 효율 1/8?"
📖 답: 데이터가 충분히 많으면 OK
AlphaZero가 보여준 것:
- 충분한 자가 대국 (수천만 게임)이 있으면 자연히 대칭이 학습됨
- 같은 모양이 회전된 위치에서도 자주 등장 → 신경망이 자동으로 대칭 인식
- 대칭 augmentation은 학습 가속이지 필수가 아님
🎯 학습 시간 vs 데이터 효율
- 대칭 사용 (AlphaGo Zero): 데이터 효율 8배 → 적은 게임으로 빠른 학습
- 대칭 미사용 (AlphaZero): 데이터 8배 더 필요 → 게임을 8배 더 두면 됨
- 결과: 학습 시간 비슷, 최종 성능 비슷 또는 더 좋음
현대 AI 학습의 일반 원칙: "데이터 부족하면 augmentation. 충분하면 그냥 학습."
💡 깊은 통찰 — 일반화의 비용
도메인 지식 제거의 트레이드오프:
- 제거 비용: 학습이 약간 느려질 수 있음 (게임에 따라 다름)
- 제거 이득: 같은 코드가 모든 게임에 동작
충분한 자원이 있다면 도메인 지식을 빼고 일반 알고리즘을 만드는 게 더 좋음.
현재 큰 언어 모델(LLM)의 학습도 비슷 — 도메인 지식 별로 안 넣고 막대한 데이터로 학습.