CHAPTER 10 실전 ⏱ 약 12분

🌐 Robetta 웹서버로 첫 예측 돌리기

가장 쉬운 길 — 시퀀스 붙여넣고 메일로 결과 받기

📋이전 챕터에서 뭐 했죠?

제9장 — 돌리기 전에 — 준비물 체크

실전 준비물 정리했어요. 구글 계정, 연습용 시퀀스(Ubiquitin 추천), 이메일 주소, 기다릴 마음의 준비. 그리고 다시 한 번: GPU 없어도 OK입니다.

드디어 진짜 첫 예측을 돌립니다. 가장 쉬운 길인 Robetta 웹서버로요. 이건 Baker Lab(로제타폴드 만든 곳)이 운영하는 무료 단백질 구조 예측 서비스예요. 시퀀스만 붙여넣고 메일 주소만 입력하면, 알아서 계산해서 메일로 결과를 보내줍니다. 끝.

🌐
Robetta: robetta.bakerlab.org
운영: University of Washington, Baker Lab (로제타폴드 만든 그 연구실)
비용: 완전 무료 (학술/비영리 용도)
가입: 처음 사용 시 이메일로 간단 등록만

STEP 1. Robetta 사이트 들어가기

브라우저에서 robetta.bakerlab.org 를 엽니다. 화면 상단에 메뉴가 있고, 한가운데에 "Submit New Job" 또는 "Get Started" 같은 버튼이 보일 거예요.

처음이시면 먼저 등록을 해야 해요. 화면 어딘가에 Register 또는 Sign Up 링크가 있습니다.

등록 절차

  1. 이름, 이메일 주소, (선택) 소속 입력
  2. 입력한 이메일로 확인 메일 옴 → 클릭으로 인증
  3. 이게 끝. 비밀번호 설정 같은 거 없음.

이메일이 곧 사용자 ID 역할을 합니다. 다음부터는 메일 주소만 적으면 본인이라고 인식해요.

STEP 2. 새 작업(New Job) 제출하기

Submit New Job 화면에 들어가면 다음과 같은 입력 칸들이 있습니다.

┌──────────────────────────────────────────────────┐
Robetta — Submit Structure Prediction Job
├──────────────────────────────────────────────────┤
Email: [email protected]____________________]
Target: [ubiquitin_test_001__________]
Method: ⦿ RoseTTAFold
│ ○ AlphaFold2 (옵션, 있을 수 있음) │
│ │
Sequence (FASTA format):
│ ┌──────────────────────────────────────────────┐ │
│ │ >ubiquitin_test │ │
│ │ MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGI │ │
│ │ PPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLR │ │
│ │ LRGG │ │
│ └──────────────────────────────────────────────┘ │
│ │
Advanced options (Optional):
[ ] Symmetry / [ ] Constraints / ...
│ │
Submit Job
└──────────────────────────────────────────────────┘
Robetta Submit New Job 화면의 모습 (개념도)

각 칸 채우기 가이드

  • Email: 등록 시 사용한 이메일 — 결과 받을 주소
  • Target name: 본인이 알아볼 이름 (예: ubiquitin_test_001) — 영문/숫자/언더스코어로
  • Method: "RoseTTAFold" 선택 (기본값일 가능성 큼)
  • Sequence: 9장에서 복사한 Ubiquitin FASTA 시퀀스를 통째로 붙여넣기
  • Advanced options: 첫 실습에는 건드릴 필요 없음. 비워두기.
📋
Ubiquitin 시퀀스 한 번 더 (복붙용):
>ubiquitin_test
MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGG

STEP 3. Submit 클릭 → 큐 대기

Submit Job 버튼을 누르면 작업이 Robetta 큐에 등록됩니다. 화면에 작업 ID가 뜨고, 큐에서 몇 번째인지도 보여줍니다.

대기 시간: 큐 상황에 따라 다릅니다.
  • 한산할 때: 1~3시간
  • 평균: 6~12시간
  • 혼잡할 때 (예: 학회 직전, 미국 평일 낮): 24~72시간

조급해하지 마세요. 메일이 알아서 옵니다. 그동안 다음 챕터 공부하고 계세요.

작업 상태 확인하는 법

Robetta 사이트에서 "Queue" 또는 "Jobs" 메뉴에 가면 본인 작업 현재 상태를 확인할 수 있어요.

상태 의미
QUEUED 큐에서 대기 중 — 앞에 작업이 끝나기를 기다리는 중
RUNNING 계산 진행 중 — 보통 10분 ~ 1시간 (단백질 크기에 따라)
COMPLETE 완료! 결과 메일 확인하세요
FAILED 실패 (드물지만 있음) — 시퀀스 형식 다시 확인

STEP 4. 결과 메일 받기

작업이 완료되면 등록한 이메일로 자동으로 메일이 옵니다. 메일 내용은 보통 이런 식이에요.

📧
발신: robetta@uw.edu (이런 비슷한 주소)
제목: Robetta job <ubiquitin_test_001> complete
본문: "Your job has been completed. Results available at [링크]"

메일에 적힌 링크를 클릭하면 결과 페이지로 이동합니다. 거기서 다운로드받을 게 몇 가지 있어요.

STEP 5. 결과 페이지에서 받을 것들

결과 페이지에는 보통 다음 파일들이 있습니다.

  • model_1.pdb ~ model_5.pdb — 5개 후보 구조. AI가 만든 5가지 약간 다른 예측이에요. 보통 model_1이 가장 신뢰도 높음.
  • plddt.json / plddt.txt — 잔기마다 pLDDT 점수 (얼마나 자신 있는지)
  • (웹 미니뷰어) — 페이지 안에서 바로 3D로 돌려볼 수 있는 뷰어가 있는 경우가 많아요

웹 뷰어로 즉시 확인

Robetta 결과 페이지에는 대개 NGL 뷰어 같은 3D 뷰어가 내장되어 있습니다. 마우스로 단백질을 돌려보고, 색깔(pLDDT)을 보고 — 아주 첫 인상을 잡을 수 있어요.

🎨 뷰어에서 처음 봐야 할 것

  1. 전체 모양: α-나선이 많은지 (스프링 모양), β-병풍이 많은지 (납작한 화살표)
  2. 색깔 분포: 대부분 파랑/시안이면 자신 있는 예측, 노랑/주황이 많으면 자신 없음
  3. "바깥쪽" 부분: 단백질 끝(N-말단, C-말단)이 노랑/주황으로 흐트러져 있어도 정상 — 단백질의 진짜 끝 부분은 원래 유연해요

STEP 6. 정답과 비교 (선택)

Ubiquitin은 PDB에 정답 구조(1UBQ)가 있어요. 우리 예측이 그 정답과 얼마나 비슷한지 확인하면 재밌습니다.

  1. rcsb.org/structure/1UBQ 들어가서 PDB 파일 다운로드
  2. 두 파일(우리 예측 vs 1UBQ) 모두 PyMOL이나 ChimeraX 같은 무료 뷰어에 띄움 (또는 다음 차수에 다룰 3Dmol.js 임베드 뷰어)
  3. 두 구조를 겹쳐서 비교 (alignment)
🎯
Ubiquitin 예상 결과: AI 예측과 PDB 정답이 거의 똑같이 겹쳐야 정상이에요. RMSD(Root Mean Square Deviation)가 2Å 이하면 매우 잘 맞은 거고, Ubiquitin 같은 작은 단백질에서는 1Å 이하도 흔합니다. "와 진짜 맞췄네"라는 인상을 받으실 거예요.

흔히 나오는 문제 & 대처

"메일이 안 와요"

  • 스팸 폴더 확인 (Robetta 메일이 가끔 스팸으로 분류됨)
  • Robetta 사이트 Queue 페이지에서 상태 직접 확인
  • 24시간 넘게 RUNNING이면 작업이 죽었을 수도 — 다시 제출

"FAILED 상태가 나왔어요"

  • 시퀀스에 알 수 없는 문자가 섞였나 확인 (B, J, O, U, X, Z 등은 표준 아미노산이 아님)
  • 시퀀스가 너무 긴 경우 (1000 잔기 넘으면 실패하기도)
  • 다른 시퀀스로 다시 시도

"결과가 이상하게 나왔어요 (pLDDT 50 이하)"

  • MSA가 빈약한 단백질일 수 있음 (신규 단백질, 인공 디자인 단백질)
  • 단백질이 원래 구조가 없는 IDP(Intrinsically Disordered Protein)일 수 있음 — 이건 AI 잘못이 아님
  • 다음 차수에서 ColabFold로 다시 시도 (다른 MSA 검색을 함)

여기까지 한 일 정리

🏆
축하합니다. 본인이 직접:
  1. Baker Lab(로제타폴드 만든 곳)의 무료 웹서버에 작업을 제출했고,
  2. RoseTTAFold가 본인이 준 시퀀스의 3D 구조를 예측했고,
  3. 그 결과를 받아서 처음으로 본인 손으로 만든 단백질 3D 구조를 봤어요.

60년 전엔 같은 일을 하는 데 박사 학위 한 편이 필요했습니다. 지금은 클릭 몇 번.

한 번 체크하고 가요

체크 1/3 Q1.

Robetta 웹서버는 무엇일까요?

체크 2/3 Q2.

Robetta 작업이 끝나면 결과를 어떻게 받을까요?

체크 3/3 Q3.

Robetta에 작업을 제출하고 결과를 받기까지 일반적으로 얼마나 걸릴까요?

🎉1차 공개분 끝!

여기까지 따라오느라 고생했어요

나머지 챕터(MSA, 로제타폴드 아키텍처, ColabFold 실전)는 곧 추가될 예정입니다. 이 챕터를 완료 표시하시고, 대시보드에서 진도를 확인해보세요.

내 진도 보기