퍼셉트론의 해부
퍼셉트론은 4개 부품으로 구성:
📖 퍼셉트론의 4 부품
- 입력 x₁, x₂, ..., xₙ — 숫자들. 예: 키, 몸무게, 나이.
- 가중치 w₁, w₂, ..., wₙ — 각 입력의 중요도. 학습으로 정해짐.
- 편향 b (bias) — 출발선 보정. 학습으로 정해짐.
- 활성화 함수 f — 출력 모양을 정함. step, sigmoid, ReLU 등.
수식:
y = f(w₁·x₁ + w₂·x₂ + ... + wₙ·xₙ + b)
벡터 표기로 더 간단:
y = f(w · x + b)
🎯 직관적 예시 — 이메일 스팸 분류
입력: x = [메일에 "광고"가 들어간 횟수, 발신자 평판, 첨부 파일 크기 MB]
학습으로 가중치 = [+2.0, -3.0, +0.5] 가 찾아진다고 하자:
- "광고"가 많으면 → 가중치 +2.0 → 스팸 점수 ↑
- 발신자 평판이 좋으면 → 가중치 -3.0 → 스팸 점수 ↓
- 첨부 파일이 크면 → 가중치 +0.5 → 스팸 점수 약간 ↑
합계 + 편향 → 활성화 함수 통과 → 스팸 / 정상 분류.
💡 활성화 함수가 왜 필요한가
w·x + b는 선형 함수. 선형만 쌓으면 여전히 선형이라 복잡한 패턴을 못 잡음.
비선형 활성화 함수(sigmoid, ReLU)가 비선형성을 더해줌. 이게 신경망이 복잡한 패턴을 학습하는 비결.
가장 단순한 활성화 함수 3가지:
- Step (계단): x ≥ 0이면 1, 아니면 0. 1957 원본 퍼셉트론.
- Sigmoid: 1/(1 + e^(-x)). 0~1 사이 부드러운 곡선. 확률 출력에 좋음.
- ReLU: max(0, x). 음수면 0, 양수면 그대로. 알파고도 사용.
이제 코드로!