TTN (titin) 유전자 이야기

bio
ngs

#1

TTN (titin)이라는 유전자가 있습니다. 엑솜시퀀싱이 등장하자, base pair resolution으로 유전체를 해독하게 되었고. 그 당시 질병 엑솜시퀀싱에서 가장 많이 candidate으로 등장한 유전자입니다.

TTN이 정말로 중요해서 그렇게 많은 연구를 했을까요? 이 유전자가 candidate으로 많이 밝혀진 이유는 단순히 유전자의 사이즈가 크기 때문입니다. 타이탄이 생각나는 이 티틴 유전자는 대략 300kb 정도의 길이를 갖고 있죠.

참조: http://www.nature.com/nrg/journal/v12/n9/full/nrg3046.html

이 네이쳐 코멘터리는 엑솜 시퀀싱 시대에 유전학 연구들이 범하지 말아야할 실수들을 언급합니다. 그 중 하나가, genome-wide null model이 없는 연구들을 경계하라는 것입니다. 그 중하나가 TTN에 대한 언급이죠.

만약 TTN을 후보 유전자로 찾은 연구들이 gene length를 그들의 검정 모델에 적용하여 변이의 빈도수를 조절했다면, 이와 같은 참사는 일어나지 않았을 겁니다.

이 말은 역설적으로 많은 후보 유전자 연구들이, genome-wide null 모델을 사용하지 않는다는 것이 되겠지요.

이런 식입니다.

  1. 엑솜시퀀싱 .

  2. 100x depth.

  3. SIFT, PolyPhen2로 filtering (어차피 coding nucleotide가 많아서, "damaging missense"도 많이 나옴)

  4. super high risk variant가 환자군에서 XX개 나왔네요

  5. OR1234, TTN 등을 논문으로 낸다.

사실 유전체 연구들이 항상 유전학 저널에 가는게 아니고, 이런 techinical detail을 아는 영가이들이 항상 리뷰를 하는게 아니므로 저널의 동료 평가를 통과해, 이런 유전자들이 질병의 후보유전자로 등극하게 됩니다. 그걸 data mining의 정신을 가지고 systems biology로 네트워크 하고 데이터베이스 만들고 그걸 또 누가 인용하고 아 와장창창창…

사실 TTN은 cardiomyopathies,나 여러 muscular dystrophies등에서 많이 연구된 논문입니다. 실제 이 질병들이 얼마만큼의 유병률, 그리고 selection에 영향을 미치는지를 고려해서, ExAC 등의 genome-wide null model이 가능한 연구에서 penetrance를 계산해볼수 있습니다. 혹은 다른 genome-wide null model을 이용한 연구에서 재현이 가능한지를 뽑아보는것도 재미난 일일거구요.

이런 사례들을 통해, 우리는 genome-wide null 모델이 얼마나 중요한 것인지를 다시 생각해보게 됩니다. 이건 단순히 시퀀싱을 얼마나 잘하느냐? 아니면 몇명을 모았느냐?에 관한 문제가 아닙니다.

아래 리뷰에서 study design의 세부 항목들을 잘 고려하는 것이 필요한데, 사실상 이런 지점을 모두 신경쓰려면, 해당 질병이나 비슷한 유전적 모델을 오랜동안 연구한 사람들이 필요합니다 (e.g. 발달성 질환 + 가계도 연구, 퇴행성 질환 - 대조군/common variant). 우리가 여러 모델들을 공부하고, 오랜 시간 동안 논의된 것들을 다시 들어다봐야하는거나 검정 모델에 대한 power calculation이 필요합니다. 아래 논문은 그에 대한 예를 몇가지 소개했습니다. . 아무튼 지금도 구글 스콜라에 "Exome TTN"으로 검색하면… 2017년에도 논문을 위한 논문이 등장합니다…