Monday, March 6, 2017

ExAC boosts clinical variant interpretation in rare diseases


현존하는 DB 중 가장 많은 protein-coding genetic variation을 보유한 DB는 ExAC (Exome Aggregation Consortium) 으로 20개 이상의 연구로 부터 나온 60,706 개의 exome data를 가지고 있다.

ExAC의 분석 결과 
- Variants ("Analysis of protein-coding genetic variation in 60,706 humans" Nature 2016)
  • 7.4M 개의 high-confidence genetic variants (평균적으로 8bp(base pair)당 1개의 bp에 해당)를 확인.
  • 이 중 72%는 그 어떤 다른 DB 에서도 발견되지 않은 variant였고, 
  • 99%의 variant가  frequency < 1%.
  • 54%는 오직 한번만 발견된 variant.
    
- Effected gene by variants
  • 3,230 gene이 highly loss-of-function-intolerant.
  • 대부분의 haploinsufficient disease gene이 이 3,230에 포함. 
  • 그러나 72%는 여전히 관련 phenotype을 모름.

- CNV ("Patterns of genie intolerance of rare copy number variation in 59,898 human exome" Nat.Genet 2016)
  • rare copy number variation (CNV) 분석 결과 70% 정도 사람들이 하나 이상의 rare CNV를 가지고 있고
  • 이로 인해 평균적으로 0.81개의 deleted gene과 
  • 1.75개의 duplicated gene을 가지고 있음.

이 ExAC DB는 rare disease의 variant를 이해하는데 이용될 수 있다. ExAC의 분석결과 DB에 있는 사람들이 평균적으로 54개의 이전에 질병 원인이라고 알려진 variant를 가지고 있는 것으로 확인 되었다. 곧 misclassification을 correcting하는데 사용할 수 있음. 실제 ExAC에서 높은 비율로 나타난 pathogenic variant 라 분류된 192개를 확인해 본 결과 9개만 pathogenicity 의 충분한 근거를 가지고 있었다. 

이러한 ExAC DB의 가능성을 보여주는 논문 2편이 ExAC 프로젝트에서 추가로 나왔다. 

하나는 cardiomyopathies 에 관련된 논문 ("Reassessment of Mendelian gene pathogenicity using 7,855 cardiomyopathy cases and 60,706 reference samples" Genet.Med. 2016 )
  • 7,855 명의 심장근육관련 질병을 진단받은 환자와 ExAC의 normal reference 비교
  • 상당수의 pathogenic variant 혹은 gene이라고 알려져 있는 것들이 그렇지 않았다는 것을 보임(심지어 gene panel에 표함되어 있는 것도 있음).

다른 하나는 prion disease랑 관련된 논문 ("Quantifying prion disease penetrance using large population control cohorts" Sci.Trans.Med. 2016l)
  • 16,025 명의 prion disease 환자(10-15% 의 환자는 PRNP 유전자의 변이로 인한 것으로 추정)와 ExAC비교
  • 실제로 상당 수의 PRNP 유전자의 pathogenic and highly penetrant variant가 likely benign 이었다는 확인


ExAC은 2017년까지 120,000개의 exome데이터와 20,000개의 whole-genome data 확보하려 한다고 함.

이 글은 Evernote에서 작성되었습니다. Evernote는 하나의 업무 공간입니다. Evernote를 다운로드하세요.

Monday, February 13, 2017

OMIM.org


OMIM (Online Medelian Inheritance) 은 의사인 Victor A. McKusick에 의해 1966년에 출판되기 시작한  유전자와 유전적 표현형의 정보와 그 사이의 관계를 정리한 내용의 MIM (Mendelian Inheritance in Man) 이 시초로 1987년 검색 가능하도록 온라인화 된 것이다. 다른 데이터베이스와는 다르게 OMIM 은 전문가들에 의한 생명과학 및 의학 관련 문서의 리뷰를 바탕으로 정보를 제공한다.  

2014년 10월 30일 기준으로 14,831개의 유전자와 7,894의 표현형의 정보를 담고 있다. (https://omim.org/static/omim/data/mim2gene.txt 를 보면 OMIM의 담고 있는 유전자와 phenotype의 갯수를 파악할 수 있다)





OMIM SOURCE MATERIAL
45개 이상의 저널, PubMed의 타겟 검색, Current Contents, 그리고 저자 기반의 전체 논문을 리뷰한다. 유전자와 표현형의 관계에 대한 통찰력을 줄수 있는 인간 생물학, 또는 질병에 대한 임상적 특성, 질병의 발생 원인에 관한 내용의 논문을 우선시 한다.



OMIM STRUCTURE
OMIM의 구조는 아래 그림과 같다. OMIM에서 하나의 유전자에서의 각각의 변이(variant)는 서로 다른 표현형과 연관되어 있을 수 있기 때문에 유전자와 표현형은 분리 시켰다. 그리고 변이 관한 정보는 유전자에 포함되고 임상적 개요나 임상적 묘사는 표현형에 포함시켰다. 
OMIM의 식별자인 MIM number는 6자리 숫자로 되어 있으며 첫번째 숫자가 1,2,6일 경우에는 Autosomal entry, 3으로 시작하면 X-linked entry, 4로 시작하면 Y-linked entry, 5로 시작하면 mitochondrial entry 이며 소숫자리 4자리는 variant 의 식별자로 사용된다.


MIM number (OMIM의 일련 번호) 앞에 붙어 있는 심볼은 아래의 분류에 따라 붙이게 된다.
  • asterisk (*) : 유전자를 의미, mim2gene.txt 파일에서 "gene"이라고 분류되어 있음

  • number symbol (#) : 표현형을 의미. molecular basis known. 하나의 유일한 locus 에 의한 표현형이 아니라 여러 유전자 혹은 하나의 유전자에 의한 것이라도 발병의 원인이 다양한 경우(homozygous or compound heterozygous mutation)의 표현형. mim2gene.txt 파일에서 "phenotype"이라고 분류되어 있음

  • plus sign (+) : 유전자 이자 표현형. mim2gene.txt 에서 "gene / phenotype"으로 분류되어 있음

  • percent sign (%) : 확인된 mendelian phenotype 혹은 phenotypic locus이긴 하나 정확한 기작은 모르는 경우(원인 variant까지는 모르는 경우). no known inheritance pattern or molecular basis.  mim2gene.txt 파일에서 "phenotype"이라고 분류되어 있음

  • No symbol ( ) : mendelian 기반의 phenotype으로 보이나 의심스럽거나 다른 entry와의 구분이 명확해보이지 않은 표현형. mim2gene.txt 파일에서 "predominantly phenotype"이라고 분류되어 있음

  • caret (^) : legacy, 곧 다른 mim number로 바뀐 entry


OMIM의 entry는 gene 과 phenotype로 구분되어 있다.
  • gene 은 위 심볼에서 "*" 과 "+" 를 갖는 entry 이다. 
  • gene은 아래의 것들을 포함한다. 
    • protein-coding gene
    • regulatory elements
    • micro-RNA
    • non-coding RNA
    • 그 밖의 functional element 들이다.

  • phenotype 은 MIM number 앞에 "#", "%", no symbol 의 심볼이 붙는 entry이다. 
  • phenotype은 아래의 것들을 포함한다.
    • single gene mendelian disorder, 
    • phenotypic traits (머리색같은 것들), 
    • susceptibility to drug reaction (와파린에 대한 감수성 같은 것), 
    • reaction to infection (HIV 의 감염에 따른 AIDS의 발병과 같은 것), 
    • germline susceptibility to cancer(BRCA1/2 같은 것),  
    •  recurrent deletion and duplication syndromes



CLINICAL SYNOPSES
clinical synopses (임상 개요)라는 것은 문헌으로 부터 뽑아낸 phenotypic feature를 semi-controlled vocabulary 로 정리한 것. 이는 HPO, SNOMED CT, UMLS 등의 vocabulary DB에 mapping되어 있다.



THE GENE, MORBID AND SYNIOSIS MAPS

  • Gene Map : 유전자의 cytogenetic location
  • Morbid Map : disorder(phenotype)의 cytogenetic location

OMIM에서 gene map table 로 검색을 하게 되면 정보를 유전자, locus와 그것에 관련된 phenotype정보를 테이블 형식으로 나타낸다. 곧 gene, phenotype, 그리고 게놈상의 위치 정보를 정리된 표로 나타낸다. 
이 표에 phenotype column에서 사용되는 기호의 의미는 아래와 같다.
  • brackets [] : non-diseases. 질병이 아님. 실험실에서  비정상적인 테스트 값을 나타내는 유전 변이.
  • braces {} : 천식이나 당뇨병과 같은 multifactorial disorder (다원인 질병, complex disease) 나 감염에 대한 감수성과 관련된 phenotype
  • question mark ? : phenotype과 gene과의 관계가 잠정적인 경우를 의미. comment 부분에 더 자세한 설명이 되어 있다.

또한 표의 pheno map key에 컬럼의 숫자의 의미는 아래와 같다.
  • 1 : The disorder was positioned by mapping of the wild type gene.
  • 2 : The disease phenotype itself was mapped (The disorder was placed on the map by statistical method).
  • 3 : The molecular basis of the disorder is known.
  • 4 : The disorder is a chromosome deletion or duplication syndrome.



REPRESENTATION OF GENE-PHENOTYPE RELATIONSHIPS
AV (Allelic Variant)는 OMIM의 gene-phenotype 관계에서 핵심이 되는 부분으로 아래의 기준으로 선별된 변이들이다.
  • The first mutation to be discovered
  • high population frequency
  • distinctive phenotype
  • historic significance
  • unusual mechanism of mutation
  • unusual pathogenetic mechanism or distinctive inheritance

NGS의 기술로 인해 variant가 급격하게 밝혀짐에 따라 2013년 1월 부터 OMIM은 gene-phenotype 관계가 성립되기 위한 아래의 기준들을 마련하였다.
  • 동일한 유전자의 pathogenic variant를 가진 서로 관계가 없는 다수의 개인들이 존재할 경우
  • multiplex family(질환을 있는 환자의 1 또는 2촌 가족 구성원이 같은 유전 질환을 갖는 가족) 에서 variant가 phenotype에 따라 segregation될 경우
  • variant가 통계적으로 유의한 숫자의 개인에게서 de novo로 발생할 경우

qualified gene-phenotype relationship을  위한 기준은 아래와 같다.
"variant에 대해 오직 하나의 multiplex family 의 경우만 밝혀진 경우" AND "supportive functional data가 있는 경우 (in vitro, in vivo 의 유전자 활성 실험이라던지 모델 생물체에서의 비교할만한 phenotype 데이터가 있다던지)" 



OMIM PHENOTYPIC SERIES
비슷한 phenotype들의 genetic heterogeneity (하나의 phenotype 가 여러 개의 원인, 곧 allelic variant나 non-allelic variant에 의한 것)를 표의 형태로 나타낸 것. 정의가 잘 된 phenotype의 새로운 원인 유전자가 발견되거나 different mapping (genome상의 다른 위치에 관련이 있게 된다거나)이 될 때 series('PS'로 시작되는 identifier)를 생성하여 관련 phenotype을 연결시켜 놓는다. 현재 387 개의  series가 있다.


이 글은 Evernote에서 작성되었습니다. Evernote는 하나의 업무 공간입니다. Evernote를 다운로드하세요.

Monday, February 6, 2017

Regulation of Genetic Tests


아래 글은 위 링크의 미국에서의 유전 검사의 규제에 대한 정리 번역이다.

유전 검사 (Genetic Testing) : 사람의 DNA, RNA, 단백질, 분석을 포함한 일련의 기술들을 의미한다.



Federal Regulation of Genetic Tests
위 그림과 같이 3개의 연방 기관이 유전 검사에 대해 관리한다. 


  • CMA : CLIA 를 제대로 준수하는지 clinical laboratory를 감시하는 역할을 한다. CLIA의 목적은 테스트의 과정 검증, 기술자의 숙련도등의 자격을 포함한 임상 테스트의 질을 보장하기 위함이다.

  • FDA : FDA 가 유전 검사의 규제에 대한 가장 포괄적인 권한을 가지고 있다. 이는 연방 식품, 의약품, 화장품 법 하에 유전 검사의 안정성과 효용성을 규제하는 것이다. 유전검사는 두가지로 나눠 볼수 있는데 한가지가 'kit' 로 유전 샘플을 처리하는 일련의 시약들을 묶어서 여러 실험실에 판매하는 제품과 오직 한곳의 실험실에서만 개발되고 수행되어지는 LTD (Laboratory-developed test)로 유전 검사를 받을 샘플들이 테스트를 개발한 실험실로 보내지는 제품으로 나눠진다. 현재 kit에 대해서는 규제를 하고 있으며 LDT에 대해서는 'enforcement discretion'(언제 규제를 적용하는지 그리고 규제를 강제할지를 그때 그때 FDA가 판단) 을 시행하고 있다. FDA의 유전 검사에 대한 관리 감독의 정도는 유전 검사의 사용 목적과 얼마나 부정확한 결과를 내포하고 있는지에 따라 달렸다. FDA는 유전 검사를 포함한 의료 장치를 'class 1'에서 'class 3'까지 3단계로 구분한다(class 3이 가장 엄격한 감독하에 놓은 품목을 의미). 또한 약효에 대해 유전 정보를 이용하는 pharmacogenomics 도 FDA의 감독하에 있다.

  • FTC : CMA, FDA 와는 달리 FTC 의 권한은 상당히 제한적인데 어떻게 유전 검사를 홍보하는 가를 감시하는 역할을 한다. 




FDA Regulation and Genomics Research
FDA는 1976년 의료기기개정안으로 의회로 부터 상업적으로 판매되는 의료 기기에 대해 시판 전 검토에 대한 권한을 부여받음과 동시에 임상 연구에서 사용되는 의료 기기에 대해 관리 감독할 권한도 부여 받았다. 'kit'와 'LDT'로 구분되어 제한하는 상업적으로 판매되는 유전 검사와는 달리 임상연구에서는 구분없이 FDA의 관리 대상이다. 

게놈, 엑솜, 타겟 시퀀싱과 같은 기술을 이용한 임상 연구에서는 연구 참가자의 등록 전에 FDA로 부터 IDE (Investigational Device Exemptions)을 받아야 한다. 이는 IND (Investigational New Drug application)과 비슷한 것으로 이는 FDA로 부터 승인되지 않은 의료 기기의 연구 사용에 대한 적절한 감시가 이루어짐을 보장하기 위한 것으로 연구에 사용되어지는 의료 기기에 대한 효용성을 포함한 정보를 FDA에 제공해야 한다는 것이다. 



FDA Plans to Regulate LDTs
2010년, FDA는 검사를 수행하는 실험실과 검사를 주문하는 의사와의 커져가는 괴리와 유전 검사의 복잡성 증대와 같은 시장의 변화를 인용하며 LDT를 규제할 계획이라고 발표했다. 이는 수년 간의 LDT를 규제하기 위한 자문위원들의 요구에 의한 것이다. 

2014년 7월 31일, FDA는 60일 이내에 LDT를 규제하기 위한 가이드라인 초안을 발표하겠다고 의회에 전했다.

그러나 아직까지 모든 유전 검사에 대해 규제를 확대하겠다는 FDA의 계획은 실현되고 있지 않으며 여전히 'kit'에 대한 규제를 지속하고 있을 뿐이다.



이 글은 Evernote에서 작성되었습니다. Evernote는 하나의 업무 공간입니다. Evernote를 다운로드하세요.

Tuesday, January 31, 2017

Mother's Negligence Suit Against Quest's Athena


현재 진행되고 있는 유전자 검사 관련 소송이 있어 어떠한 내용이가를 소개해 본다. 아래 글은 위 링크의 번역이다. 

이 사건을 보면서 유전자 분석 및 검사 서비스를 위해서는 제공하고자 하는 정보의 정확한 기준 필요하며 정해진 기준의 준수가 반드시 필요하다는 것이라 생각된다. 또한 직접적으로 환자에게 정보를 제공하는 유전자 검사 서비스가 필요하다는 것과 설령 현재는 VUS(variant of unknown significance) 라 할지라도 정보의 불확실성과 불완전성을 몇번이고 사용자에게 숙지시켜야 함을 느끼게 된다.


원고: Amy Williams
피고: Athena Diagnostics 와 모기업인 Quest Diagnostics
혐의: Athena DNA 검사의 유전변이의 잘못된 분류가 William의 아들을 죽음으로 이끈 의사의 위험한 처방을 야기했다는 것.

현재 판결의 주된 쟁점은 실제로 이번 사건이 보통의 관습법의 태만이나 부주의가 아닌 의료과실 치사인가라는 점이다. 이 사건은 연방 법원의 판결을 기다리고 있는 상황이다. 이 판결에 따라 소송이 배심재판을 받을지가 결정이 된다.



Case History
2005년 8월 태어난 Christian Millare 는 태어난지 4개월째부터 발작 증상이 나타나기 시작했다. 그의 의사는 Dravet syndrome(이 질환을 가진 환자의 80%는 SCN1A 유전자에 변이가 있는것으로 알려짐)이 아닌 간질성발작으로 판단하고 sodium channel inhibitor medication 을 처방하였다. 2007년 1월 SCN1A 유전자를 검사하기 위해 Christian의 DNA가 Athena Diagnostics로 보내졌다. 만약 SCN1A 유전자에 변이가 있는 Dravet syndrome이라면 나트륨 채널 억제 약물 처방은 피해야 했다. 2007년 5월에 DNA sequencing이 진행되었으며 6월에 이 테스트를 의뢰한 의사에게로 결과가 전달되었다. DNA 검사 결과에는 Christian이 SCN1A에 유전자 변이가 있지만 이는 VUS (variant of unknown significance), 즉 질병의 원인이 된다고는 밝혀지지 않은 유전변이라는 것이라 서술되어 있었다. Christian의 담당의는 이 결과를 바탕으로 계속적으로 나트륨 채널 억제 약물을 처방했다. Athena 는 환자나 환자의 가족에게는 유전자 검사 결과를 발행하지 않았다. 결국 Christian는 2008년 1월 사망하게 되었다.

The Complaint - March 2016 : 보호자로 부터의 소송
Christian의 엄마인 Amy Williams 는 Athena for 2016년 5월 사우스 캘리포니아 주 법원에 고소하게 된다. 고소 내용은 Athena가 'Christian이 Dravet syndrome 을 가지고 있다는 것을 확인하는데 실패'했고 'DNA 변이 분류 기준을 준수하지 못함'이라는 2가지로 치료 기준을 위반했다는 것이다. 
2007년 Athena 의 유전변이 분류의 정의에 따르면 특정 변이가 'known disease-associated mutation' 으로 분류되기 위해서는 질병과 관련이 있다는 문헌이 있어햐 한다는 것이다. 그런데 2006년과 2007년 두차례에 걸쳐 관련 논문이 출판되었었다. 그렇기 때문에 Christian의 유전변이를 VUS로 분류한 것은  Athena의 잘못이라는 것이다. 2007년 검사 결과에서는 2005년 출판된 논문을 '계류 중' 이라고 표시한것으로 보아 Athena의 문헌 통합이 2년 정도 뒤쳐져 있었다고 판단된다는 것이다.

Hearing on Defendant's Motion to Dismiss - January 4, 2017 : 피고인의 항변
Athena측은 William이 제기한 과실에 대한 혐의는 의료 과실에 대한 것으로 혐의를 제기할 시간 제한이 있는 사항이라는 것이다. 사우스 켈리포니아에서는 원고가 healthcare provider(의료 공급자)에게 의료과실에 대해 소송을 걸수 있는 기간은 과실을 발견한 시점으로 부터 3년이다. 그러나 6년이 지난후에는 완전히 그 권리를 잃게 되는데 이 6년을 'statute of repose'라 한다. William의 변호인측은 이는 의료과실법이 아닌 일반의 관습법에 관한 것이라 주장하고 있다. 

결국 재판관이 이 문제를 어떻게 판결하는 가는 CLIA-certified clinical laboratory 를 사우스 캘리포니아 주법하에 licensed healthcare provider 로 보는가에 달려 있다. 특히 환자가 직접적으로 거래하지 않는 실험실에서 의료 과실 기준이 적용되는 환자와의 전문적 수탁 관계를 갖을 수 있을 것인가 하는 것이다. 

이는 사우스 캘리포나아 주 대법원에서 Athena를 healthcare provider로 인정해줄 것인가에 달렸다. 소송은 사우스 캘리포니아 주법원에서 시작되었고 피고인들이 이를 연방 법원으로 넘겼으나(피고와 원고가 서로 다른 주에 소속되었기에) 결국은 사우스 캘리포니아 주법에 따라 Athena가 healthcare provider임을 certification 되는 문제가 되어 이는 사우스 캘리포니아 주 대법원의 판결에 영향을 받게 된다.




  

이 글은 Evernote에서 작성되었습니다. Evernote는 하나의 업무 공간입니다. Evernote를 다운로드하세요.

Monday, January 2, 2017

Molecular diagnostic experience of whole-exome sequencing in adult patients



성인(18세 이상)에서의 WES의 결과의 특성과 진단에 대한 것을 정리한다. 이 논문은 계속적으로 2014년에 JAMA에 출판한 소아 대상 WES 의 결과들의 분석 과 비교함.

WES를 통해 소아의 경우 25% 정도 진단이 되는것에 비해 성인의 경우 17.5% (85/486) 의 비율로 진단이 됨. 18-30세의 경우 23.9% 진단이 되고 30세 이상의 경우 10.4% 진단이 됨. 두개의 질병이 진단된 경우는 7%. 신경계, 골격계, 머리, 목, 성장에 장애가 있는 경우에 진단이 되는 빈도가 높음. 진단 비율은 가족력의 정보의 유무와 상관없고 autosomal dominant 의 61.4% 는 de novo mutation에 의한것.

여기서는 WES 를 통한 exotic deletion, duplication 의 detection은 진단에 포함되지 않았음. 단 SNP array 를 QC로 했기에 3명의 환자에서 large deletion, CNV가 발견할 수 있었다. 또한 mitochondria 역시 sequencing을 했기에 2명의 환자에게서 causal variant를 찾을 수 있었다.

분자 진단은 관측되는 phenotype, 예상되는 inheritance와 일관성이 있는 Mendelian disease gene의 pathogenic 혹은 likely pathogenic 만을 포함한다.

각 환자들에게 하나 이상의 HPO를 할당. 그래서 이 HPO를 이용해서 phenotype class 별 진단 비율 확인.
아래 표는 환자의 나이별 분포 및 진단 비율

486명의 환자의 WES 결과 중 85명의 환자에게 분자 진단이 내려졌고 진단이 내려진 환자 중 2 환자는 mitochondria에의 deletion(mitochondria sequencing을 통해 확인), mutation에 의한 것이였고 3환자의 경우 CNV, large deletion에 의한 것(SNP array를 통해 확인). 나머지 환자 80명들의 진단은 WES 에 의한 것으로 111개의 distinct variant가 원인으로 밝혀짐.

111개의 variant중 SNV가 84개(75.7%), indel 이 26(23.4%)개, 나머지 한개는 double mutation variant. 84개의 SNV중 57개가 missens, 16개가 nonsense, 10개가 splice site, 1개가 initiation codon mutation.

아래는 inheritance pattern의 비율.  JAMA의 것(신생들의 분석 결과)과 비슷.

아래 표가 사용된 HPO term의 빈도수



 위 표는 환자들에게 할당된 HPO term들의 빈도를 의미한다.
환자당 평균 10개의 HPO term이 할당. HPO term을 바탕으로 환자에게 하나 이상의 HPO phenotype class 부여. 아래 그림에서 볼수 있드시 신경계, 근육 조직, 골격계의 비정상이 가장 많은 class 이다.

아래 그림 b 에서 볼수 있듯 진단은 phenotype에 dependent 하다. 머리/목, 성장, 근육 조직, 신경계 등의 문제가 있는 경우 진단이 더 잘 되고 가슴, 종양등과 관련된 phenotype 의 경우 진단이 잘 안되었다.



이 글은 Evernote에서 작성되었습니다. Evernote는 하나의 업무 공간입니다. Evernote를 다운로드하세요.