드디어 진짜 첫 예측을 돌립니다. 가장 쉬운 길인 Robetta 웹서버로요. 이건 Baker Lab(로제타폴드 만든 곳)이 운영하는 무료 단백질 구조 예측 서비스예요. 시퀀스만 붙여넣고 메일 주소만 입력하면, 알아서 계산해서 메일로 결과를 보내줍니다. 끝.
운영: University of Washington, Baker Lab (로제타폴드 만든 그 연구실)
비용: 완전 무료 (학술/비영리 용도)
가입: 처음 사용 시 이메일로 간단 등록만
STEP 1. Robetta 사이트 들어가기
브라우저에서 robetta.bakerlab.org 를 엽니다. 화면 상단에 메뉴가 있고, 한가운데에 "Submit New Job" 또는 "Get Started" 같은 버튼이 보일 거예요.
처음이시면 먼저 등록을 해야 해요. 화면 어딘가에 Register 또는 Sign Up 링크가 있습니다.
등록 절차
- 이름, 이메일 주소, (선택) 소속 입력
- 입력한 이메일로 확인 메일 옴 → 클릭으로 인증
- 이게 끝. 비밀번호 설정 같은 거 없음.
이메일이 곧 사용자 ID 역할을 합니다. 다음부터는 메일 주소만 적으면 본인이라고 인식해요.
STEP 2. 새 작업(New Job) 제출하기
Submit New Job 화면에 들어가면 다음과 같은 입력 칸들이 있습니다.
각 칸 채우기 가이드
- Email: 등록 시 사용한 이메일 — 결과 받을 주소
- Target name: 본인이 알아볼 이름 (예:
ubiquitin_test_001) — 영문/숫자/언더스코어로 - Method: "RoseTTAFold" 선택 (기본값일 가능성 큼)
- Sequence: 9장에서 복사한 Ubiquitin FASTA 시퀀스를 통째로 붙여넣기
- Advanced options: 첫 실습에는 건드릴 필요 없음. 비워두기.
STEP 3. Submit 클릭 → 큐 대기
Submit Job 버튼을 누르면 작업이 Robetta 큐에 등록됩니다. 화면에 작업 ID가 뜨고, 큐에서 몇 번째인지도 보여줍니다.
- 한산할 때: 1~3시간
- 평균: 6~12시간
- 혼잡할 때 (예: 학회 직전, 미국 평일 낮): 24~72시간
조급해하지 마세요. 메일이 알아서 옵니다. 그동안 다음 챕터 공부하고 계세요.
작업 상태 확인하는 법
Robetta 사이트에서 "Queue" 또는 "Jobs" 메뉴에 가면 본인 작업 현재 상태를 확인할 수 있어요.
| 상태 | 의미 |
|---|---|
QUEUED |
큐에서 대기 중 — 앞에 작업이 끝나기를 기다리는 중 |
RUNNING |
계산 진행 중 — 보통 10분 ~ 1시간 (단백질 크기에 따라) |
COMPLETE |
완료! 결과 메일 확인하세요 |
FAILED |
실패 (드물지만 있음) — 시퀀스 형식 다시 확인 |
STEP 4. 결과 메일 받기
작업이 완료되면 등록한 이메일로 자동으로 메일이 옵니다. 메일 내용은 보통 이런 식이에요.
제목: Robetta job <ubiquitin_test_001> complete
본문: "Your job has been completed. Results available at [링크]"
메일에 적힌 링크를 클릭하면 결과 페이지로 이동합니다. 거기서 다운로드받을 게 몇 가지 있어요.
STEP 5. 결과 페이지에서 받을 것들
결과 페이지에는 보통 다음 파일들이 있습니다.
- model_1.pdb ~ model_5.pdb — 5개 후보 구조. AI가 만든 5가지 약간 다른 예측이에요. 보통 model_1이 가장 신뢰도 높음.
- plddt.json / plddt.txt — 잔기마다 pLDDT 점수 (얼마나 자신 있는지)
- (웹 미니뷰어) — 페이지 안에서 바로 3D로 돌려볼 수 있는 뷰어가 있는 경우가 많아요
웹 뷰어로 즉시 확인
Robetta 결과 페이지에는 대개 NGL 뷰어 같은 3D 뷰어가 내장되어 있습니다. 마우스로 단백질을 돌려보고, 색깔(pLDDT)을 보고 — 아주 첫 인상을 잡을 수 있어요.
🎨 뷰어에서 처음 봐야 할 것
- 전체 모양: α-나선이 많은지 (스프링 모양), β-병풍이 많은지 (납작한 화살표)
- 색깔 분포: 대부분 파랑/시안이면 자신 있는 예측, 노랑/주황이 많으면 자신 없음
- "바깥쪽" 부분: 단백질 끝(N-말단, C-말단)이 노랑/주황으로 흐트러져 있어도 정상 — 단백질의 진짜 끝 부분은 원래 유연해요
STEP 6. 정답과 비교 (선택)
Ubiquitin은 PDB에 정답 구조(1UBQ)가 있어요. 우리 예측이 그 정답과 얼마나 비슷한지 확인하면 재밌습니다.
- rcsb.org/structure/1UBQ 들어가서 PDB 파일 다운로드
- 두 파일(우리 예측 vs 1UBQ) 모두 PyMOL이나 ChimeraX 같은 무료 뷰어에 띄움 (또는 다음 차수에 다룰 3Dmol.js 임베드 뷰어)
- 두 구조를 겹쳐서 비교 (alignment)
흔히 나오는 문제 & 대처
"메일이 안 와요"
- 스팸 폴더 확인 (Robetta 메일이 가끔 스팸으로 분류됨)
- Robetta 사이트 Queue 페이지에서 상태 직접 확인
- 24시간 넘게 RUNNING이면 작업이 죽었을 수도 — 다시 제출
"FAILED 상태가 나왔어요"
- 시퀀스에 알 수 없는 문자가 섞였나 확인 (B, J, O, U, X, Z 등은 표준 아미노산이 아님)
- 시퀀스가 너무 긴 경우 (1000 잔기 넘으면 실패하기도)
- 다른 시퀀스로 다시 시도
"결과가 이상하게 나왔어요 (pLDDT 50 이하)"
- MSA가 빈약한 단백질일 수 있음 (신규 단백질, 인공 디자인 단백질)
- 단백질이 원래 구조가 없는 IDP(Intrinsically Disordered Protein)일 수 있음 — 이건 AI 잘못이 아님
- 다음 차수에서 ColabFold로 다시 시도 (다른 MSA 검색을 함)
여기까지 한 일 정리
- Baker Lab(로제타폴드 만든 곳)의 무료 웹서버에 작업을 제출했고,
- RoseTTAFold가 본인이 준 시퀀스의 3D 구조를 예측했고,
- 그 결과를 받아서 처음으로 본인 손으로 만든 단백질 3D 구조를 봤어요.
60년 전엔 같은 일을 하는 데 박사 학위 한 편이 필요했습니다. 지금은 클릭 몇 번.
한 번 체크하고 가요
Robetta 웹서버는 무엇일까요?
Robetta 작업이 끝나면 결과를 어떻게 받을까요?
Robetta에 작업을 제출하고 결과를 받기까지 일반적으로 얼마나 걸릴까요?