현존하는 DB 중 가장 많은 protein-coding genetic variation을 보유한 DB는 ExAC (Exome Aggregation Consortium) 으로 20개 이상의 연구로 부터 나온 60,706 개의 exome data를 가지고 있다.
ExAC의 분석 결과
- Variants ("Analysis of protein-coding genetic variation in 60,706 humans" Nature 2016)
- 7.4M 개의 high-confidence genetic variants (평균적으로 8bp(base pair)당 1개의 bp에 해당)를 확인.
- 이 중 72%는 그 어떤 다른 DB 에서도 발견되지 않은 variant였고,
- 99%의 variant가 frequency < 1%.
- 54%는 오직 한번만 발견된 variant.
- Effected gene by variants
- 3,230 gene이 highly loss-of-function-intolerant.
- 대부분의 haploinsufficient disease gene이 이 3,230에 포함.
- 그러나 72%는 여전히 관련 phenotype을 모름.
- CNV ("Patterns of genie intolerance of rare copy number variation in 59,898 human exome" Nat.Genet 2016)
- rare copy number variation (CNV) 분석 결과 70% 정도 사람들이 하나 이상의 rare CNV를 가지고 있고
- 이로 인해 평균적으로 0.81개의 deleted gene과
- 1.75개의 duplicated gene을 가지고 있음.
이 ExAC DB는 rare disease의 variant를 이해하는데 이용될 수 있다. ExAC의 분석결과 DB에 있는 사람들이 평균적으로 54개의 이전에 질병 원인이라고 알려진 variant를 가지고 있는 것으로 확인 되었다. 곧 misclassification을 correcting하는데 사용할 수 있음. 실제 ExAC에서 높은 비율로 나타난 pathogenic variant 라 분류된 192개를 확인해 본 결과 9개만 pathogenicity 의 충분한 근거를 가지고 있었다.
이러한 ExAC DB의 가능성을 보여주는 논문 2편이 ExAC 프로젝트에서 추가로 나왔다.
하나는 cardiomyopathies 에 관련된 논문 ("Reassessment of Mendelian gene pathogenicity using 7,855 cardiomyopathy cases and 60,706 reference samples" Genet.Med. 2016 )
- 7,855 명의 심장근육관련 질병을 진단받은 환자와 ExAC의 normal reference 비교
- 상당수의 pathogenic variant 혹은 gene이라고 알려져 있는 것들이 그렇지 않았다는 것을 보임(심지어 gene panel에 표함되어 있는 것도 있음).
다른 하나는 prion disease랑 관련된 논문 ("Quantifying prion disease penetrance using large population control cohorts" Sci.Trans.Med. 2016l)
- 16,025 명의 prion disease 환자(10-15% 의 환자는 PRNP 유전자의 변이로 인한 것으로 추정)와 ExAC비교
- 실제로 상당 수의 PRNP 유전자의 pathogenic and highly penetrant variant가 likely benign 이었다는 확인
ExAC은 2017년까지 120,000개의 exome데이터와 20,000개의 whole-genome data 확보하려 한다고 함.
이 글은 Evernote에서 작성되었습니다. Evernote는 하나의 업무 공간입니다. Evernote를 다운로드하세요. |