시즌 1 · 알파고편 / PART 7 · PART 7 · AlphaZero (2017) / Ch 2 · 도메인 지식 제거

대칭은 안 써도 학습되나?

"대칭이 8배 데이터인데 안 쓰면 학습 효율 1/8?"

📖 답: 데이터가 충분히 많으면 OK

AlphaZero가 보여준 것:

  • 충분한 자가 대국 (수천만 게임)이 있으면 자연히 대칭이 학습됨
  • 같은 모양이 회전된 위치에서도 자주 등장 → 신경망이 자동으로 대칭 인식
  • 대칭 augmentation은 학습 가속이지 필수가 아님
🎯 학습 시간 vs 데이터 효율
  • 대칭 사용 (AlphaGo Zero): 데이터 효율 8배 → 적은 게임으로 빠른 학습
  • 대칭 미사용 (AlphaZero): 데이터 8배 더 필요 → 게임을 8배 더 두면 됨
  • 결과: 학습 시간 비슷, 최종 성능 비슷 또는 더 좋음

현대 AI 학습의 일반 원칙: "데이터 부족하면 augmentation. 충분하면 그냥 학습."

💡 깊은 통찰 — 일반화의 비용

도메인 지식 제거의 트레이드오프:

  • 제거 비용: 학습이 약간 느려질 수 있음 (게임에 따라 다름)
  • 제거 이득: 같은 코드가 모든 게임에 동작

충분한 자원이 있다면 도메인 지식을 빼고 일반 알고리즘을 만드는 게 더 좋음.

현재 큰 언어 모델(LLM)의 학습도 비슷 — 도메인 지식 별로 안 넣고 막대한 데이터로 학습.