You are on page 1of 9

Subscribe to DeepL Pro to translate larger documents.

De La Vega ve diğerleri Genom Tıbbı Visit13:153


(2021) www.DeepL.com/pro for more information.

https://doi.org/10.1186/s13073-021-00965-0

ARAŞTIRMA
Açık Erişim

Yapay zeka, nadir genetik hastalıklar için


kapsamlı genom yorumlamasına ve aday
tanıların belirlenmesine olanak sağlıyor
Francisco M. De La Vega1,2,3 , Shimul Chowdhury4 , Barry Moore5 , Erwin Frise1 , Jeanette McCarthy1 ,
Edgar Javier Hernandez5 , Terence Wong4 , Kiely James4 , Lucia Guidugli4 , Pankaj B. Agrawal6,7 , Casie A. Genetti6 ,
Catherine A. Brownstein6 , Alan H. Beggs6 , Britt-Sabina Löscher8 , Andre Franke8 , Braden Boone9 , Shawn E. Levy9
, Katrin Õunap10,11 , Sander Pajusalu10,11 , Matt Huentelman12 , Keri Ramsey12 , Marcus Naymik12 , Vinodh Narayanan12
, Narayanan Veeraraghavan4 , Paul Billings1 , Martin G. Reese1* , Mark Yandell1,5* ve Stephen F. Kingsmore4

Özet
Arka plan: Genetik varyantların hastanın fenotipi bağlamında klinik olarak yorumlanması, nadir genetik hastalıkların
genom temelli teşhisi için maliyet ve zaman harcamalarının en büyük bileşeni haline gelmektedir. Yapay zeka (AI),
tahmin yöntemlerini artan genetik hastalık bilgisi ile entegre ederek genom yorumlamasını büyük ölçüde
basitleştirme ve hızlandırma vaadinde bulunmaktadır. Burada, genom yorumlamasını hızlandırmak için yeni, yapay
zeka tabanlı bir klinik karar destek aracı olan Fabric GEM'in tanısal performansını değerlendiriyoruz.
Yöntemler: GEM'i, tüm genom veya tüm ekzom dizilemesi (WGS, WES) yapılan ve nadir genetik hastalık tanısı
konan, çoğu YYBÜ bebeği olan 119 probanddan oluşan retrospektif bir kohortta karşılaştırdık. Analizlerimizi beş
akademik tıp merkezinden toplanan 60 vakadan oluşan ayrı bir kohortta tekrarladık. Karşılaştırma için, bu vakaları
güncel son teknoloji varyant önceliklendirme araçlarıyla da analiz ettik. Karşılaştırmalara trio, duo ve singleton vakalar
dahil edilmiştir. Tanıların temelini oluşturan varyantlar, yapısal varyantlar (SV'ler) da dahil olmak üzere çeşitli kalıtım
modlarını ve türlerini kapsamaktadır. Hasta fenotipleri klinik notlardan iki yolla çıkarılmıştır: manuel olarak ve
otomatik bir klinik doğal dil işleme (CNLP) aracı kullanılarak. Son olarak, daha önce çözülmemiş 14 vaka yeniden analiz
edilmiştir.

* Yazışmalar: mreese@fabricgenomics.com; myandell@genetics.utah.edu


1
Fabric Genomics Inc., Oakland, CA, ABD
Yazar bilgilerinin tam listesi makalenin sonunda mevcuttur

© Yazar(lar). 2021 Açık Erişim Bu makale Creative Commons Attribution 4.0 Uluslararası Lisansı altında lisanslanmıştır, orijinal
yazar(lar)a ve kaynağa uygun şekilde atıfta bulunduğunuz, Creative Commons lisansına bir bağlantı verdiğiniz ve değişiklik
yapılıp yapılmadığını belirttiğiniz sürece herhangi bir ortam veya formatta kullanım, paylaşım, uyarlama, dağıtım ve
çoğaltmaya izin verir. Bu makalede yer alan görseller veya diğer üçüncü taraf materyalleri, aksi belirtilmediği sürece,
makalenin Creative Commons l i s a n s ı n a dahildir. Materyal, makalenin Creative Commons l i s a n s ı n a d a h i l
d e ğ i l s e ve kullanım amacınız yasal düzenlemeler tarafından izin verilmiyorsa veya izin verilen kullanımı aşıyorsa, doğrudan
telif hakkı sahibinden izin almanız gerekecektir. Bu lisansın bir kopyasını görüntülemek için şu adresi ziyaret edin:
http://creativecommons.org/licenses/by/4.0/. Creative Commons Public Domain Dedication feragatnamesi
(http://creativecommons.org/publicdomain/zero/1.0/), verilere ilişkin bir kredi satırında aksi belirtilmedikçe, bu makalede
kullanıma sunulan v e r i l e r için geçerlidir.
De La Vega ve diğerleri Genom Tıbbı (2021) 13:153 Sayfa 2
19'un

Sonuçlar: GEM, nedensel genlerin %90'ından fazlasını birinci veya ikinci adaylar arasında sıraladı ve manuel olarak
küratörlüğünü yapılan veya CNLP'den türetilen fenotip açıklamalarını kullanarak vaka başına ortalama 3 aday geni
inceleme için önceliklendirdi.
Üçlü ve ikili sıralaması tekli olarak analiz edildiğinde değişmemiştir. Tanısal SV'leri olan 20 vakanın 17'sinde GEM, SV
çağrılarının sağlanıp sağlanmadığına veya GEM tarafından kendi dahili SV tespit algoritması kullanılarak ab initio
olarak çıkarılıp çıkarılmadığına bakılmaksızın, nedensel SV'leri en iyi aday olarak ve 19/20'sinde ilk beş içinde
tanımlamıştır. GEM, ebeveyn genotiplerinin yokluğunda da benzer performans göstermiştir. Daha önce çözülmemiş
14 vakanın analizi, bir vaka için yeni bir bulguyla sonuçlanmış, 3 vaka için manuel inceleme sonucunda adaylar
ilerletilmemiş ve 10 vaka için yeni bulgu elde edilmemiştir.
Sonuçlar: GEM, son inceleme ve raporlama için çok kısa bir aday gen ve bozukluk listesinin otomatik olarak aday
gösterilmesi yoluyla tüm varyant türlerini içeren tanısal yorumlamayı mümkün kılmıştır. CNLP ile derin fenotipleme
ile birlikte GEM, genetik hastalık tanısının önemli ölçüde otomasyonunu sağlayarak potansiyel olarak maliyeti
düşürür ve vaka incelemesini hızlandırır.

Arka plan Genom yorumlama süreci, hastalığa neden olan aday


Genomik tıbbın temel ilkelerinden biri, semptomlara varyantların kanıta dayalı incelemesi ile birlikte iteratif
dayalı teşhis ve tedavilerin genetik teşhisler ve genotip varyant filtrelemesinden oluşur [12]. Bu süreç, Annovar
farklılaştırılmış tedavilerle desteklendiğinde sonuçların [13] ve VAAST [14] gibi varyant önceliklendirme
iyileştiğidir. Dünya çapında her yıl tahminen 7 milyon algoritmaları ortaya çıkana kadar neredeyse tamamen
bebek ciddi genetik bozukluklarla doğmaktadır [1]. Son on manueldi ve daha sonra Phevor [15], Exo- miser [16],
yılda Mendel koşullarıyla ilişkili genlerin kataloğunda Phen-Gen [17], Phenolyzer [18] ve son zamanlarda Amelie
büyük bir artış yaşanmıştır. 2010 yılında yaklaşık 2300 olan [19] gibi analizlere hasta fenotiplerinin entegre edilmesiyle
bu sayı [2], 2020 yılı sonunda 6700'ün üzerine çıkmıştır [3]. geliştirildi. Bu araçlar inceleme sürelerini hızlandırsa da,
Bu bilginin WES ve WGS'deki büyük gelişmeler ve aşağı kısmen yapısal değişkenleri (SV'ler) uygun şekilde
akış analitik boru hatlarıyla birlikte tercüme edilmesi, tek yorumlayamamaları nedeniyle, tek başlarına
gen testleriyle yaklaşık %10 olan tanı oranlarının %50'nin performansları yaygın klinik benimseme için yeterli
üzerine çıkmasını sağlamıştır [4]. Okuma hizalama ve olmamıştır. SV'ler Mendel hastalıklarının
varyant arama sınırlamaları, WES ve WGS'nin ilk klinik %10'undan fazlasını [20, 21] ve rutin yenidoğan yoğun
uygulamalarında büyük engeller oluştururken [5], bakım ünitesi (NICU) [22] ve pediatrik hastalardaki
algoritmik gelişmeler, donanım hızlandırma ve bulut tanıların yaklaşık %20'sini [23] oluşturmaktadır. SV'lerin,
bilişim yoluyla paralelleştirme ile büyük ölçüde ortadan SNV'lerin ve küçük indellerin önceliklendirilmesi için
kaldırılmıştır [6, 7]. Bununla birlikte, genetik varyantların birleştirilmiş yöntemler, genom yorumlamasının daha fazla
hastanın fenotipi bağlamında klinik olarak yorumlanması otomasyonu için temel bir gerekliliktir.
büyük ölçüde manuel ve son derece emek yoğun olmaya Yapay zeka (AI) kullanımı sağlık hizmetlerinde önemli
devam etmekte ve yüksek eğitimli uzman girdisi ilerlemeler kaydetmiştir [24] ve yeni bir genetik yorumlama
gerektirmektedir. Bu durum, yaygın olarak yöntemleri sınıfı [19, 25-28], elektronik klinik karar destek
b e n i m s e n m e s i n i n önünde büyük bir engel sistemleri (eCDSS) aracılığıyla nadir genetik hastalık teşhisi
olmaya devam etmekte ve tanısal ve klinik fayda v e için yorumlama darboğazını ortadan kaldırma vaadiyle
maliyet etkinliğine ilişkin güçlü kanıtlara rağmen genetik geliştirilmektedir [29]. Yorumlama hızı ve doğruluğu,
bozukluk şüphesi olan hastalarda genomik test oranlarının yaşamın ilk 24-48 saatinde teşhisin sağlık sonuçlarını en
düşük kalmasına katkıda bulunmaktadır [8]. üst düzeyde iyileştirdiği gösterilen [27] YYBÜ'deki ağır
Nadir genetik hastalıkların genom temelli teşhisi için en hasta çocuklar için özellikle önemlidir [30]. YZ'nin hangi
büyük zorluk, her genomda yaklaşık dört milyon iyi huylu ortamlarda ve ne ölçüde tanıyı kolaylaştırdığı halen
varyant arasında hastalığa neden olduğu varsayılan bir araştırılmaktadır [27, 28]. Sorunlar arasında ne tür YZ
varyantı tanımlamaktır; bu, samanlıkta iğne aramaya yöntemlerinin en uygun olduğu (örneğin Bayesian ağları,
benzer bir sorundur [9]. Klinik genom yorumlaması, karar ağaçları, sinir ağları [31]); doğruluk açısından mevcut
zorunlu olarak, yüksek eğitimli, az sayıda gen analisti, varyant önceliklendirme yaklaşımlarıyla nasıl
genetik danışman ve laboratuvar direktörü tarafından karşılaştırıldıkları; farklı klinik senaryolar ve varyant türleri
gerçekleştirilmektedir [10]. Vaka başına incelene c e k arasında tanı performansları; yeni karar desteği biçimleri
ortalama 100 varyant için [11] bu, hasta başına 50-100 sunma potansiyelleri ve otomatik hasta fenotipleme ve
saatlik uzman incelemesi anlamına gelir [10]. Pratikte bu, klinik karar verme ile ne kadar iyi entegre oldukları yer
vaka başına yalnızca yaklaşık 10 varyantın incelenmesine almaktadır [27, 28, 32].
yol açmıştır ki bu da genom çapında dizilemenin amacını
bir şekilde boşa ç ı k a r m a k t a d ı r .
De La Vega ve diğerleri Genom Tıbbı (2021) 13:153 Sayfa 3
19'un

Bu alanda algoritmik kıyaslama yapmak basit bir iş Rady Çocuk Hastanesi Klinik Genom Merkezi'ndeki hızlı-
değildir. Şimdiye kadarki girişimlerin çoğunda simüle WGS (rWGS) dizileme programı. Bu vakalar, 26 Temmuz
edilmiş vakalar (referans ekzomlara ve genomlara bilinen 2016 ile 25 Eylül 2018 tarihleri arasında Rady Çocuk
hastalığa neden olan varyantlar eklenerek oluşturulmuş) Hastanesi, San Diego, ABD'de rWGS'nin tanı oranını,
kullanılmış, sadece birkaç vaka dahil edilmiş, tek bir tanıya kadar geçen süreyi, tanının klinik faydasını,
merkezden elde edilmiş veya belirli varyant türleriyle sınırlı sonuçlarını ve sağlık hizmeti kullanımını inceleyen daha
kalmıştır [17, 33, 34]. Bu tür kıyaslamalar, genetik önce yayınlanmış dört çalışmaya kaydolan ilk semptomatik
hastalıkların ve varyant türlerinin gerçek çeşitliliğini temsil çocuklardan alınan uygun bir örneklemdir. Çalışmalardan
etmediğinden (örneğin, nedensel SV'lere sahip vakaları biri genom ve ekzom sekanslama ile ilgili kontrollü bir
hariç tutarak) ve farklı dizileme ve v a r y a n t arama çalışmaydı (ClinicalTrials.gov tanımlayıcı: NCT03211039)
işlem hatlarının performans üzerindeki etkisini [30]; diğerleri ise kohort çalışmalarıydı (ClinicalTrials.gov
değerlendirmek için hiçbir yol sağlamadığından, doğası tanımlayıcılar: NCT02917460 ve NCT03385876) [35-40].
gereği sınırlıdır. Tümü
Burada, yeni bir yapay zeka tabanlı eCDSS olan Fabric Denekler, genetik bir bozukluktan şüphelenilen, Rady
GEM'in (bundan sonra "GEM" olarak anılacaktır) tanısal Çocuk Hastanesi Epic EHR'ye sahip olan ve hem
performansını tanımlıyor ve Rady Çocuk Genomik Tıp klinisyenler tarafından manuel olarak küratörlüğünü
Enstitüsü'nden (RCIGM) çeşitli retrospektif pediatrik vaka yapılan hem de CNLP tarafından otomatik olarak çıkarılan
kohortu kullanarak mevcut varyant önceliklendirme insan fenotipi ontoloji terimleri olarak ifade edilen klinik
yaklaşımlarıyla karşılaştırıyoruz. Bu vakalar büyük ölçüde fenotip tanımlarına sahip olan, etiyolojisi bilinmeyen
ağır hasta YYBÜ bebeklerinden oluşmaktadır; hepsine semptomatik bir hastalığa sahipti (Ek dosya 1: Tablo S1).
WGS (veya birkaç vakada WES) sonrasında, filtreleme ve WGS (veya birkaç örnekte WES) daha önce açıklandığı
varyant önceliklendirme yaklaşımlarının bir kombinasyonu gibi gerçekleştirilmiştir [35, 40]. Kısaca, PCR içermeyen
kullanılarak Mendel koşulları teşhisi konulmuştur. Bu WGS, Illu- mina HiSeq 2000, HiSeq 4000 ve NovaSeq 6000
gerçek dünya vakaları, patojenik SV'ler de dahil olmak sekanslayıcılarında ortalama 40× kapsama alanına kadar
üzere fenotiplerin ve hastalığa neden olan varyantların gerçekleştirilmiştir. Hizalama ve dizi varyantı arama
genişliğini kapsamaktadır. Daha sonra GEM'in diyagnostik Illumina DRAGEN yazılımı kullanılarak gerçekleştirilirken,
performansını, YYBÜ dışındaki etkilenmiş, tanı konmuş ve kopya sayısı varyasyonu Manta [41] ve CNVna- tor [42]
tanı konmamış çocuklardan oluşan ikinci bir grupta araçlarını entegre eden bir yaklaşımla tanımlanmıştır.
tekrarlamaya çalıştık. GEM'in tanısal performansının diğer Yapısal varyantlar daha sonra önceki etkilenmemiş
dizileme, varyant arama hatları ve klinik ortamlara vakalarda gözlemlenen tekrarlayan artefaktlar için
genellenebilirliğini incelemek i ç i n , çoğu WES'ten oluşan filtrelenmiş ve yalnızca bilinen bir hastalık geniyle (OMIM)
beş farklı akademik t ı p merkezinden toplandılar. Son örtüşmeleri halinde girdi VCF dosyasına dahil edilmiştir.
olarak, GEM'in zaman alıcı vaka incelemelerine yol açacak Birincil bulgu olarak yeniden port edilen tüm varyantlar
çok sayıda yanlış pozitif önermeden yeni tanıları belirleme Sanger sekanslama ile ortogonal olarak doğrulanmıştır.
yeteneğini değerlendirmek için daha önce n e g a t i f olan Üçlü vakalarda, bildirilen varyantların de novo ori- ginliği
bir dizi RCIGM vakasını yeniden analiz ettik. Sonuçlarımız, ebeveynlerinin verileriyle karşılaştırılarak belirlenmiştir.
yeni veri modalitelerinin yapay zekanın mümkün kıldığı Bazı eski vakalarda SV araması yapılmamıştır; buradaki
algoritmik yeniliklerle entegrasyonu sayesinde hızlı, doğru herhangi b i r nedensel SV, ortogonal CGH mikro dizisi
ve kapsamlı WGS ve WES tabanlı tanının mümkün veya hizalamaların manuel olarak incelenmesi ile
olduğunu göstermektedir. tanımlanmıştır. Aşağıda, birincil bulguları olan bu 119
vakadan Kıyaslama kohortu, 14 negatif vakadan ise
Yöntemler Çözülmemiş kohort olarak bahsedeceğiz.
Hasta seçimi, fenotipleme ve numune dizileme Bu
retrospektif çalışma, GEM eCDSS'yi test etmek i ç i n Boston Çocuk Hastanesi
kıyaslama verileri sağlamak üzere tasarlanmıştır. Rady Beggs Laboratuvarı, Konjenital Miyopati Araştırma
Çocuk Hastanesi'nden (Kıyaslama kohortu) çoğunlukla Programı laboratuvarı ve Boston Çocuk Hastanesi Manton
YYBÜ başvurularından oluşan 119 vaka ve beş akademik Yetim Hastalıkları Araştırma Merkezi'nden on bir vaka
tıp merkezinden (Doğrulama kohortu) çoğunlukla genetik (hepsi tek proband) analize dahil edilmiştir [43- 48].
kliniklerden gelen başvurulardan oluşan ve hiçbiri aşağıda Kütüphaneler (TruSeq DNA v2 Örnek Hazırlama kiti;
açıklandığı gibi nedensel yapısal varyantlar içermeyen 60 Illumina, San Diego, CA) ve tüm ekzom yakalama (EZ
ek vaka derledik. Exome 2.0, Roche), kan örneklerinden çıkarılan DNA'dan
üretici protokollerine göre gerçekleştirilmiştir. WES bir
Rady Çocuk Hastanesi Illumina HiSeq 2000 üzerinde gerçekleştirilmiştir.
Toplamda, daha önce yayınlanmış yöntemler [27, 30, 35] Okumalar GRCh37/hg19 insan genomuna hizalandı
kullanılarak kesin olarak çözüldüğü düşünülen birincil
bulgulara sahip 119 vaka ve 14 negatif vaka, bu çalışmanın
bir parçası olarak dizilenmiştir.
De La Vega ve diğerleri Genom Tıbbı (2021) 13:153 Sayfa 4
19'un

kurum içi bir birleştirici kullanılarak birleştirilmiştir. Varyant ek açıklaması ve veri kaynakları
Varyantlar Gen Analiz Araç Seti (GATK) sürüm 3.1 veya Tüm analizler GRCh37 insan genomu derlemesine dayalı
üstü (Broad Institute, Cambridge, MA) kullanılarak olarak gerçekleştirilmiştir. Varyant sonuçları ve
çağrılmış ve Boston Çocuk Hastanesi IDDRC Moleküler açıklamaları VEP v.95 [65] ile ENSEMBL transkript sürüm
Genetik Çekirdek Tesisi tarafından Sanger ile 95 (kodlamayan transkriptler hariç) kullanılarak ve analiz
doğrulanmıştır. için kanonik transkript seçilerek elde edilmiştir. Varyant
deleteriousness'ı değerlendirmek için transkripte özgü
Kiel Christian-Albrechts Üniversitesi tahmin VVP [66] ile hesaplandı ve bunlar VAAST [14] için
Klinik Moleküler Biyoloji Enstitüsü'nden (IKMB) on iki girdi olarak da kullanıldı. Varyantlar ClinVar (sürüm
vaka (hepsi tek proband) analize dahil edilmiştir [49-55]. 20200419) [67] ile tam konum ve baz eşleşmesi sağlanarak
Illumina'nın Nextera/TruSeq whole-exome target cap- açıklanmıştır. Gen koşulları OMIM (sürüm 2020_07) [68]
ture yöntemi uygulanmıştır. WES Illumina HiSeq/NovaSeq ve HPO'dan ( 2020-08-11 tarihli obo dosyası) [69]
platformlarında gerçekleştirilmiştir. Okumalar BWA- çıkarılmıştır. Gen sembolleri, ENSEMBL ve HGNC veri
MEM sürüm 0.7.17 kullanılarak GRCh37/hg19 insan tabanları kullanılarak eşanlamlı gen sembolleri kontrol
genomu derlemesine hizalanmış ve varyantlar GATK edilerek uyumlu hale getirilmiştir.
sürüm 4.1.6.0 (Broad Institute, Cambridge, MA)
kullanılarak çağrılmıştır. Yapay zeka tabanlı hastalık geni ve durum önceliklendirmesi
Aday hastalık genlerinin ve teşhis koşullarının yapay zeka
tabanlı önceliklendirilmesi ve puanlanması, Fabric
HudsonAlpha Biyoteknoloji Enstitüsü
Enterprise platformunun (Fabric Genomics, Oakland, CA)
HudsonAlpha Biyoteknoloji Enstitüsü Klinik Hizmetler
ticari olarak temin edilebilen bir eCDSS parçası olan Fabric
Laboratuvarından üç vaka (iki üçlü ve tek bir proband),
GEM [70] kullanılarak gerçekleştirilmiştir. GEM girdileri,
Klinik Se- quencing Kanıt Oluşturan Araştırma (CSER)
VCF formatındaki genetik değişken çağrıları ve (isteğe
konsorsiyumundan vakalar da dahil olmak üzere analize
bağlı) ebeveyn sevgi durumu ve İnsan Fenotip Ontolojisi
dahil edilmiştir [56-59].
(HPO) terimleri biçimindeki hasta (pro- band) fenotipleri
WGS bir Illumina HiSeq X üzerinde gerçekleştirilmiştir.
dahil olmak üzere vaka meta verileridir. VCF dosyaları
Okumalar GRCh37/hg19 insan genomuna as- sembly
"küçük varyantları" (tek nükleotid, çoklu nükleotid ve
hizalanmış ve ardından Illumina DRAGEN yazılımı sürüm
küçük ekleme/silme varyantları) ve (isteğe bağlı olarak)
3.2.8 (Illumina, Inc. San Diego, CA) kullanılarak varyant
yapısal varyantları (50 bp'den fazla ekleme/silme, inver-
çağrısı yapılmıştır.
siyonlar ve/veya kesin olmayan uçlara sahip kopya sayısı
varyantları) içerebilir. Bu bilgiler bir uygulama
Translasyonel Genomik Araştırma Enstitüsü programlama arayüzü aracılığıyla veya kullanıcı
Translasyonel Genomik Araştırma Enstitüsü'ndeki (TGen) arayüzünde manuel olarak sağlanabilir. Veri analizi,
Nadir Çocukluk Çağı Hastalıkları Merkezi'nden yirmi üç girdilere bağlı olarak tipik olarak dakikalar içinde
vaka (tekli, ikili, üçlü ve dörtlü dahil) analize dahil gerçekleştirilir. GEM çıktıları, GEM gen skoruna göre
edilmiştir [60, 61]. sıralanmış aday genlerin bir listesini (aşağıya bakınız), her
WES veya WGS sekanslama Illu- mina HiSeq 2000, aday gende bulunan hasta v a r y a n t l a r ı n ı n
HiSeq 2500, HiSeq 4000 veya Nova- Seq6000 üzerinde ayrıntılı bilgilerini ve GEM'in koşul eşleşme (CM) skoruna
gerçekleştirilmiştir. WES için Agilent SureSelect Human göre sıralanmış her aday genle ilişkili koşulları (aşağıda
All Exon V6 veya CRE V2 hedef yakalama yöntemi açıklanmıştır) içeren etkileşimli bir raporda (Ek dosya 2:
uygulanmıştır. Okumalar GRCh37 versiyonu hs37d5 Şekil S1) görüntülenir.
referansına hizalanmış ve varyantlar GATK Haplotype GEM, potansiyel olarak hasar görmüş genleri ve aday
caller versiyon 3.3-0-g37228af (Broad Institute, Cambridge, hastalıkları puanlamak ve önceliklendirmek için Bayesian
MA) kullanılarak çağrılmıştır. yöntemlerini kullanarak genomik ve klinik veri tabanı ek
açıklamaları ile çoklu varyant önceliklendirme
Tartu Üniversite Hastanesi algoritmalarından gelen girdileri bir araya getirir. Kısaca,
Estonya'daki Tartu Üniversite Hastanesi'nden WES algoritma, probandın çağrılan varyantlarını tek seferlik,
uygulanan on bir vaka analize dahil edilmiştir [62-64]. çalışma zamanı eğitim verisi olarak kullanarak kendini
Nextera Rapid Capture Exome Kit-i (Illumina Inc.) tar- parametrize e d e r v e birden fazla değişkenin durumunu
get yakalama yöntemi uygulanmıştır. WES Illumina doğrudan girdi varyant dağılımından (örneğin cinsiyet)
HiSeq2500 sekanslayıcıda gerçekleştirilmiştir. Okumalar çıkarır. Ek statik eğitim parametreleri 1000 Genom Projesi
BWA-MEM sürüm 0.5.9 kullanılarak GRCh37/hg19 insan [71] ve CEPH [72] genom veri setlerinden elde edilmiştir.
genomu derlemesine hizalanmış ve varyantlar GATK GEM, genotip çağrılarını ve kalite puanlarını okuma
Haplotype caller sürüm 3.4 (Broad Institute, Cambridge, desteği, genomik konum, proband cinsiyeti ve potansiyel
MA) kullanılarak çağrılmıştır. olarak örtüşen SV'leri göz önünde bulundurarak yeniden
değerlendirir ve genotip çağrılarını daha incelikli posterior
olasılıklarla artırır,
De La Vega ve diğerleri Genom Tıbbı (2021) 13:153 Sayfa 5
19'un

her varyant için ploidi hesaplar. GEM ayrıca, gnomAD alt GEM'in Bayes faktörüne dayalı puanlama sistemi,
popülasyon varyant frekans verileriyle birlikte girdi açıklama kolaylığı ve yorumlamayı hızlandırmak için
genotiplerini kullanarak probandın birkaç farklı soy tasarlanmıştır. GEM skorlarının kesin olması
grubundan herhangi birine ait olma olasılığını hesaplar amaçlanmamıştır, daha ziyade klinik genetikçiler
[73]. Her bir duruma (cinsiyet ve soy, vb.) koşullanan diğer tarafından yürütülen kısa ve öz vaka incelemeleri için
iç değişkenlerin olasılıkları daha sonra naif Bayes rehberlik sağlamak üzere tasarlanmıştır. Bu nedenle, GEM
kullanılarak elde edilir ve probandın verileri kullanılarak çıktıları ek rehberlik sağlayan ve açıklanabilirliği artıran
çalışma zamanında bir korelasyon matrisi hesaplanarak birkaç ek puan da içerir. Örneğin, GEM gen skorlarına
değişkenlerin bağımsızlığı kontrol edilir. Örneğin, varyant VAAST [14], VVP [66] ve Phevor [15] posterior prob-
skorlarını soy, söz konusu gen için bilinen kalıtım modeli, yetenekleri eşlik etmekte, proband cinsiyeti, gen konumu
gen konumu ve proband cinsiyeti üzerine ve soy gibi potansiyel olarak kafa karıştırıcı değişkenlere
koşullandırdıktan sonra, GEM, de novo bir varyantın, bağlı olarak, ortak varyant genomik ve klinik anno-
yüksek oranda zarar verici olduğu tahmin edilse bile, tasyonlarla birlikte koşullandırılmaktadır (Ek dosya 2: Şekil
hastalığa neden olan bir genotipe katılma ihtimalinin S1). Bu s k o r l a r , kullanıcıların bir GEM skorunun
düşük olduğu sonucuna varabilir. Dolayısıyla, yüksek başlıca etkenlerini ve bunların skora olan göreceli
oranda zarar verici ve de novo varyantlar, hatta çerçeve katkılarını değerlendirmelerine olanak tanıdığından
değiştirenler bile, otomatik olarak yüksek GEM puanları yorumlamayı daha da kolaylaştırmaktadır.
almaz. GEM, bilinen ve yeni hastalık geni adayları için GEM ayrıca, hastalığa neden olduğu varsayılan genlerle
biallelic ge- notipleri değerlendirmek ve puanlamak için ilişkili Mendel koşullarını, koşul eşleşme (CM) puanları
aynı prosedürü kullanır. Tek fark, yeni gen adaylarındaki aracılığıyla olası teşhisler olarak değerlendirmek için
olası biallel vakaları değerlendirmek için o lokustaki belirli araçlar sağlar. Gen skorları gibi, CM skorları da Bayes
bir kalıtım modeli için OMIM ve HPO desteği yerine faktörleridir ve belirli bir Mendel koşulunun HPO'su için
global önceliğin (örneğin, otozomal resesif ve otozomal HPO fenotip ilişkilerinin, karşıt hipoteze karşı pro- bandın
dominant kalıtım modellerine sahip bilinen hastalık fenotipi ile tutarlı olduğu posterior olasılığın log10
genlerinin göreceli oranı) kullanılmasıdır. oranından türetilir. Bu hesaplamalar için verilerin olasılığı,
GEM'in gen skorları Bayes faktörleridir (BF) [74]. p(D|M), her bir hastalık için probandın fenotipine b a ğ l ı
Olabilirlik oranı testine benzer şekilde, bir Bayes faktörü iki bir olasılık elde etmek üzere Phevor'un Bayesian
modelin posterior olasılıkları arasındaki log10 oranını sunar algoritması kullanılarak belirlenir. Model için önceki
ve öncelikli genotipin bulunduğu gene zarar verdiği ve olasılık, p(M), Mendel hastalığı ile ilişkili bir veya daha fazla
probandın fenotipini açıkladığı hipotezine (bu durumda) genin (OMIM ve/veya HPO'da belgelendiği gibi) GEM'in
karşı, varyantın ne gene zarar verdiği ne de probandın şiddet skorlama protokolü tarafından tespit edildiği gibi
fenotipini açıkladığı hipotezi için göreceli desteği özetler. zarar verici bir genotip içerme olasılığıdır. Durum eşleşme
Yerleşik en iyi uygulamaya [74] uygun olarak, 0 ile 0,69 puanları, inceleme için genle ilişkili her bir durumun
a r a s ı n d a bir log10 Bayes faktörü orta düzeyde yanında görüntülenir (Ek dosya 2: Şekil S7).
destek, 0 , 69 ile 1,0 arasında önemli düzeyde destek, 1,0 ile
2.0 güçlü destek ve 2.0'ın üzerinde kesin destek. 0'dan GEM tarafından yapısal varyant puanlaması ve ab initio
küçük bir puan, karşı hipotezin daha olası olduğunu çıkarımı Çalışma zamanında, GEM SNV'leri, sıralama indel
gösterir. Bayes posterior p(M|D)'yi hesaplamak için, bir çağrılarını, okuma derinliklerini, zigosite ve gnomAD
model (pD|M) verilen verilerin olasılığı, VAAST ve VVP frekans verilerini kullanarak SV'lerin varlığını,
algoritmalarından gelen girdileri ve Clin- Var koordinatlarını ve kopya sayılarını (ploidy) olasılıksal bir
veritabanından mevcut önceki varyant sınıflandırmalarını şekilde ab initio olarak çıkarır. GEM, probandın
içeren GEM'in ciddiyet puanlama protokolünden elde genotiplerinde üç tür SV kanıtı arar: delesyonlar,
edilir. Bu model cinsiyet, an- cestry, uygulanabilir kalıtım duplikasyonlar ve CNV'ler. Örneğin heterozigotluk kaybı
modeli, gen konumu ve sağlanan hasta HPO terimlerinin (LOH) sergileyen bölgeler, heterozigot delesyonlar için
HPO ontoloji grafiğine tohumlanması ve Phevor'un kanıt olarak kullanılır. Homo- zigot delesyonların imzası
önceden tanımlanmış Bayesian ağ tabanlı algoritması [15] olan beklenen varyantlardan yoksun genomik alanlar,
kullanılarak inanç yayılımı yoluyla HPO ve GO gnomAD popülasyon frekansları [73] kullanılarak, belirli
ontolojilerindeki tüm genler için alt sıralı olarak elde edilen bir gnomAD varyantının popülasyon frekansı göz önüne
gen-fenotip öncelleri üzerine koşullandırılmıştır. Model alındığında tespit edileceği veya edilmeyeceği nokta
için öncelikli olasılık (pM), söz konusu gen ile OMIM tahminlerini türetmek i ç i n tanımlanır. İkilemeler ve
ve/veya HPO Mendel kon- disyonları veri tabanlarında silmeler için daha fazla kanıt okuma desteğinden elde
bilinen hastalık ilişkilerine dayanmaktadır. edilir, örneğin, bir bölge boyunca derinlikteki yaklaşık
tamsayı artışlar veya azalmalar kopya sayısı varyasyonu için
destek sağlar. Küçük bir varyantın her bir bölgesinde nokta
tahminleri
De La Vega ve diğerleri Genom Tıbbı (2021) 13:153 Sayfa 6
19'un

Çağrılar, daha rafine tahminler elde etmek için genotip PHEVOR). Aday genlerin birleştirilmiş listesindeki
nitelikleri gibi sağlanan değişkenlere ve cinsiyet ve soy sıralamalar, Exomiser combinedScore üzerindeki tüm
g i b i çıkarılan değişkenlere daha fazla koşullandırılır. kalıtım modlarından gen düzeyindeki aday genlerin azalan
Yüksek puan alan segmentler ve bunların maksimum sırada sıralanmasıyla oluşturulmuş ve her aday gen yalnızca
olasılık başlangıç ve bitiş koordinatları bir Markov modeli ilk, en yüksek puanlı oluşumunda listeye eklenmiştir.
kullanılarak belirlenir [75]. Sonuçlar, harici SV çağrıları Exomiser varyant seviyesi puanlaması, adayların
için destek derecesini belirlemek i ç i n ve GEM'in kendi belirlenmesi veya sıralama için dikkate alınmamıştır.
SV çağrılarının temeli olarak kullanılır. Raporlama kolaylığı Kıyaslama kohortu üzerindeki tüm Exo- miser analizleri
için, harici bir SV çağrısı ile örtüşen ab initio SV tamamlanmış ve başarılı bir şekilde çıktı üretmiştir; ancak
ç a ğ r ı l a r ı (varsayılan minimum karşılıklı örtüşme %33), 18 vakada Exomiser gerçek pozitif tanı genini puanlanmış
hala serbest puanlanan genlerle örtüştüğü sürece çıktıda bir aday olarak tanımlamamıştır (yani, çıktıda yer
harici SV çağrısı ile değiştirilir. almamıştır). VAAST kullanılan 4 vakada d a benzer bir
durum gözlenmiştir. Her iki araç için de bu vakalar yanlış
VAAST, Phevor ve Exomiser ile varyant negatif olarak değerlendirilmiştir.
önceliklendirmesinin kıyaslanması
Vakaları VAAST, Phevor ve Exomiser algoritmalarıyla Klinik NLP'den elde edilen derin fenotiplerin etkisi
analiz eden bir iş akışı oluşturmak için Snakemake HPO terimlerinin faydası, kıyaslama kohortundaki tüm
yazılımını [76] kullandık. Bu iş akışı, dört genom analizlerin üç set HPO terimi ile yeniden çalıştırılmasıyla
yorumlama aracının performansını tamamen aynı girdiler araştırılmıştır. Bu analizlerin amacı ilk olarak GEM'in
ve ek açıklamalarla karşılaştırmamızı sağlamak için fenotipleme hatalarına karşı ne kadar hassas olduğunu
yalnızca kıyaslama kohortuna uygulandı. İş akışı bir VCF belirlemek; ikinci olarak da CNLP tarafından türetilen
dosyası, aile yapısı, sevgi durumu ve HPO terimleriyle açıklamaların faydasını manuel olanlarla karşılaştırmaktı.
başlar ve her b i r algoritma için çıktılarla sonlanır. VVP Her vaka için, vaka orijinal olarak çözüldüğünde analiz
skorları yukarıda açıklandığı şekilde elde edilmiş ve ekibi tarafından manuel olarak küratörlüğünü yapılan HPO
VAAST'a girdi olarak sağlanmıştır. VAAST'a soyağacı terimlerini içeren bir HPO terimleri listesi sağlanmıştır.
bilgileri ve sevgi durumu sağlanmış v e sonuçlar CLiX ENRICH yazılımı (Clinithink, Alpharetta, GA)
toplanarak hem baskın hem de çekinik modlarda kullanılarak vakayla ilgili klinik notların NLP analizinden
çalıştırılmıştır. VAAST için gen sıralamaları, birleştirilmiş ikinci bir HPO terimleri seti oluşturulmuştur [28]. Her
çıktılardan genin en yüksek puan alan oluşumu için rapor vaka için rastgele bir HPO terim seti oluşturulmuş,
edilmiştir. Phevor'a girdi olarak HPO terimleri ve VAAST CliniThink analiz vakasındaki HPO terimlerinin sayısı sabit
puanları sağlanmıştır. Sıralamalar VAAST için belirtildiği tutulmuş ve alternatif terimler tüm örneklerdeki HPO
gibi seçilmiştir. terimleri k ü l l i y a t ı n d a n rastgele seçilmiştir ve
Exomiser [16] kıyaslama analizleri, 100.000 Genom her seçim olasılığı o terimin külliyatta kaç kez geçtiğine
Projesinde [77] kullanılan aynı konfigürasyonla, özellikle g ö r e belirlenmiştir.
(1) GRCh37 genom assem- bly kullanılarak; (2) otozomal
ve X'e bağlı dom- inant ve resesif kalıtım formları analiz Sonuçlar ve tartışma
edilerek; (3) 1000 Genom Projesi [78], TopMed [79], GEM AI, değişken önceliklendirme yaklaşımlarından daha iyi
UK10K [80], ESP, ExAC [81] ve gnomAD [73] alel frekans performans gösteriyor
kaynakları kullanılarak gerçekleştirilmiştir. Yapay zeka tabanlı bir eCDSS olan GEM'i, Rady Chil-
( Aşkenaz Yahudileri hariç); (4) REVEL [82] ve MVP [83] dren's Institute for Genomic Medicine'dan (RCIGM;
patojenite kaynakları; ve (5) failedVariantFilter, kıyaslama kohortu) 119 pediatrik retrospektif vakadan
variantEffectFilter ( kodlamayan varyantları kaldır), oluşan bir kohort kullanarak kıyasladık. Bunların çoğu,
frequencyFilter with maxFre- quency = 2.0, genetik hastalıkların teşhisi için genomik dizileme yapılan
pathogenicityFilter with keepNonPatho- genic = true, kritik durumdaki YYBÜ bebekleriydi. Hepsine manuel
inheritanceFilter, omimPrioritiser ve hiPhivePrioritiser filtreleme ve varyant önceliklendirme yaklaşımlarının bir
adımları dahil. kombinasyonu kullanılarak bir veya daha fazla Mendel
Exomiser, kullanılan kalıtım modlarından herhangi biri durumu teşhisi konmuştur ("Yöntemler"). Performansı
için aday olarak puanlandığında teşhis edilen geni daha da doğrulamak için, beş farklı akademik tıp
tanımlamış olarak kabul edilmiştir. Bu analizdeki araçların merkezinden (doğrulama kohortu) 60 YYBÜ dışı, nadir
hiçbirine bir hedef kalıtım modu verilmemiştir (bilinmediği hastalık hastasından oluşan ikinci bir kohortu da analiz
için) ve bu nedenle Exomiser için tanısal gen sıralaması, e t t i k . Son olarak, daha önce analiz edilmiş ve WGS
tüm kalıtım modlarından gelen birleşik gen aday ile tanı konulmamış 14 probanddan oluşan bir grubu
listesindeki sıralamasından belirlenmiştir (yani, VAAST yeniden a n a l i z e t t i k . Amacımız, GEM'in daha önce
için kullanılan aynı prosedür ve çözülmemiş bu vakalarda, zaman alıcı vakalara neden olacak
yanlış pozitif bulgular sağlamadan yeni tanıları belirleme
yeteneğini d e ğ e r l e n d i r m e k t i .
De La Vega ve diğerleri Genom Tıbbı (2021) 13:153 Sayfa 7
19'un

incelemeler. Performans kıyaslamalarımız için bağlam Bu meta veriler, uzman kullanıcıların nihai GEM puanını
sağlamak amacıyla, yaygın olarak kullanılan üç varyant destekleyen ana katkıları gözden geçirmelerini sağlar.
önceliklendirme aracını da çalıştırdık: VAAST [14], Phevor Dahası, GEM varyantlardan ziyade diplotiplere öncelik
[15] ve Exo- miser [16]. verir, bu da resesif hastalıklarda bileşik heterozigot
Karşılaştırma ve doğrulama kohortları tekil probandları, varyantların yorumlanmasını hızlandırır (Ek dosya 2: Şekil
ebeveyn-çocuk üçlülerini, farklı kalıtım modlarını ve hem S1B). GEM'in tanısal performansının varyant
küçük nedensel varyantları (SNV'ler ve küçük eklemeler önceliklendirme yöntemleriyle karşılaştırılmasında doğru
veya silmeler, indeller; Tablo 1; Ek dosya 1: Tablo S1) hem tanısal genin sıralaması kullanılmıştır. Bileşik
de bazıları nedensel olan büyük yapısal varyantları (SV) heterozigotlar söz konusu olduğunda, Exomiser gibi
içeriyordu (Tablo 2). Bu retrospektif analizlerde, klinik varyant önceliklendirme yöntemlerinin çiftin bir varyantını
raporda birincil bulgu olarak yer alan varyantları, hastalık yüksek oranda sıralayarak diğerinin manuel incelemeyle
genlerini ve koşulları "altın standart" doğruluk seti olarak tanımlanmasına yol açacağını varsaydık ("Yöntemler").
kabul ettik. GEM, 119 kıyaslama kohort vakasında daha önce
GEM gen skorları Bayes faktörleridir ( BF) [84]; bunlar bildirilen nedensel gen(ler)in ve varyant(lar)ın %97'sini ilk
gen adaylarını sıralamak için kullanılmıştır (Ek dosya 2: 10 aday arasında sıralamıştır. Vakaların %92'sinde doğru
Şekil S1). BF'ler, çeşitli kanıtlardan elde edilen bir sonuç geni ve varyantı ilk 2'de sıralamıştır (Şekil 1A).
için destek derecesini kısaca ölçtükleri için yapay zekada Karşılaştırma yapıldığında, bir sonraki en iyi algoritma olan
yaygın olarak kullanılmaktadır. Yerleşik uygulamalara [84] Phevor, ilk 10 adaydaki nedensel varyantların %73'ünü ve
uygun olarak, 0-0.69 BF orta düzeyde destek, 0.69-1.0 ilk 2'deki varyantların %59'unu tanımlamıştır. GEM,
önemli destek, 1.0-2.0 güçlü destek ve 2.0'ın üzerinde kesin Phevor ve Exomiser, varyant patojenitesine ek olarak hasta
destek olarak kabul edilmiştir [84]. 0'dan düşük puanlar, fenotiplerine (HPO terimleri olarak sağlanır) göre
karşı hipotezin desteklendiğini, yani o gendeki varyantların sonuçları önceliklendirirken, VAAST yalnızca genotip
probandın hastalığı için nedensel olmadığını göstermiştir. verilerini kullanır ve bu da daha düşük performansını
GEM çıktıları ayrıca, sonraki uzman vaka incelemesi için açıklar. Dolayısıyla, bu veriler hasta fenotiplerinin otomatik
ek, destekleyici rehberlik sağlayan çeşitli ek açıklamalar ve inter- pretasyon araçlarının tanısal performansını
ölçütler içerir (Ek dosya 2: Şekil S1). Deneyimler, bu tür bir artırdığını da vurgulamaktadır.
rehberliğin otomatik değişken iddialarını destekleyen Karşılaştırma kohortu, iki genin hasta fenotipine katkıda
kanıtları gözden geçirmek isteyen uzmanlar tarafından bulunduğu bildirilen 3 vakayı içermektedir. Bu oran (%2,5)
benimsenmesi için kritik öneme s a h i p o l d u ğ u n u digenik kalıtım için önceki raporlarla tutarlıdır [85].
göstermiştir. Bunlar arasında VAAST, VVP ve Phevor Yukarıdaki istatistikler bu vakalarda en üst sırada yer alan
posterior olasılıkları, proband cinsiyeti, gen konumu ve genleri kullanmaktadır, ancak Ek dosya 1: Tablo S3,
soyuna göre koşullandırılmıştır. Ek açıklamalar varyant GEM'in ikinci nedensel geni de en iyi adayları arasında
sonucunu, ClinVar veritabanı patojenite sıraladığını, Phevor'un bir vakada düşük sıralar bildirdiğini
değerlendirmelerini ve genlerle ilişkili OMIM koşullarını ve Exomiser'ın üç vakadan ikisinde ikinci geni kaçırdığını
içerir. göstermektedir.

Tablo 1 Vaka kohortlarının özellikleri. Benchmark kohortu, toplam 119 vaka. Doğrulama kohortu, toplam 60 vaka. Genel toplam, 179
vaka
Test türü Varyant tipi Proband seks Soyağacı Türü
Kalıtım şekli WGS WES SNV/Indel SV Erkek Kadın Tek kişilik İkili Üçlül
er
Benchmark kohortu
Otozomal dominant 70 11 66 15 36 45 35 6 40
Otozomal resesif 27 - 23 4 14 13 9 1 17
X'e bağlı baskın 6 - 5 1 1 5 2 - 4
X'e bağlı resesif 5 - 5 - 5 - 2 1 2
Alt toplamlar 108 11 99 20 56 63 48 8 63
Doğrulama kohortu
Otozomal dominant 3 34 37 - 10 27 15 2 20
Otozomal resesif 1 14 15 - 5 10 9 - 6
X'e bağlı baskın 1 5 6 - 3 3 1 3 2
X'e bağlı resesif - 2 2 - 2 - 1 - 1
Alt toplamlar 5 55 60 0 20 40 26 5 29
De La Vega ve diğerleri Genom Tıbbı (2021) 13:153 Sayfa 8
19'un

Tablo 2 Kıyaslama kohortunda GEM tarafından tanımlanan tanısal yapısal varyantlar (119 vakadan 20'si). Yapısal varyantlar, varyantın
barındırdığı genlere göre GEM tarafından sıralanmış ve en yüksek puan alan gene göre SNV'leri veya küçük indelleri kodlayan diğer
sıralı genlerle birlikte sunulmuştur. Yıldız işareti, literatürde tanısal hastalığın/sendromun fenotipi için aday olan genleri gösterir
(OMIM'de açıklandığı gibi). Sonuçlar, GEM'in 4 kb kadar küçük boyutlarda ve tüm kromozom kollarına kadar hem delesyonları (del)
hem de duplikasyonları (dup), çeşitli kalıtım modlarını, soyağacı yapısını ve WGS veya WES test verilerinden analiz edebildiğini
göstermektedir. GEM ayrıca SV'ler ve SNV/indeller arasındaki bileşik heterozigotları otomatik olarak tanımlamıştır (vaka 1, 2 ve 8). Girdi
SV çağrıları, kesme noktası tabanlı çağrıları (burada "SV") veya okuma derinliği analizine dayalı kesin olmayan CNV çağrılarını içerebilir.
Özellikle GEM, harici SV çağrıları sağlanmadığında (vaka 2, 10, 15 ve 17) SV'leri doğrudan küçük varyant verilerinden de çıkarabilir ve
bunları uygun şekilde puanlayarak orijinal vakalarda dizileme ile değil mikro dizilerle bulunan tanısal varyantları tanımlayabilir
Dava En Gen GEM Varyant(lar) pozisyonu SV Uzunlu Kalıtım Soyağacı Test Girişte Teşhis
no. yüksek sırala Skor tip k (kb) Şekli türü türü SV
puanlı ması çağrıları
gen(ler)
252268 FANCA* 1 2.28 chr16:89847864-89863349; Del 15 Çekinik Trio WGS SV Fanconi anemisi
FANCA: c.3788_
3790delTCT
223449 TANGO2* 1 2.13 chr22:20028937-20057143; Del 28 Çekinik Trio WGS Hiçbiri MECRCN
TANGO2: c.605+1G>A
266523 BTRC* 1 2.05 chr10:102941001- Dup 490 Baskın Duo WGS SV Ayrık el/ayak
103430600 malformasyonu tip 3
267392 HIRA, 1 2.05 chr22:18893883-21562619 Del 2669 Baskın Tek kişilik WES CNV DiGeorge sendromu;
TBX1* velokardiyofasiyal
sendrom
267148 KMT2A 1 1.87 chr11:116691508- Dup 9741; Baskın Trio WES CNV Emanuel sendromu
126432828; chr22: 3269
17038511-20307516
253691 HIRA, 1 1.73 chr22:18893883-20307516 Del 1414 Baskın Tek kişilik WES CNV DiGeorge sendromu;
TBX1* velokardiyofasiyal
Sendrom
256943 MAGEL2* 1 1.64 chr15:22833478-28566610 Del 5733 Baskın Tek kişilik WES CNV Prader Willi sendromu
254012 NDUFS3* 1 1.56 chr11:47605229-47609177; Del 4 Çekinik Trio WGS SV Leigh sendromu
NDUFS3: c.374G>A
254728 EPHA4 2 1.46 chr2:220309089- Del 4272 Baskın Tek kişilik WGS SV 2q35q36.1'de
224580863 patojenik delesyon
44671 NPAP1 1 1.42 chr15 tetrasomi (çoklu Dup 4542; Baskın Trio WGS Hiçbiri İzodisentrik kromozom
ç i f t l e r d e kırık) 991; 358; 15 sendromu
158
360547 FREM1 1 1.33 chr9:1-18477200 Del 18,437 Baskın Trio WGS SV Kromozom 9p
delesyon sendromu
259685 TYROBP 1 1.31 chr19:23158251-33502767 Dup 10,345 Baskın Trio WES SV Kısmi trizomi
19p12.q13.11
266700 TAB2 1 1.31 chr6:144951601- Del 5309 Baskın Trio WGS SV Kromozom 6q24-q25
150260400 Sendromu
244102 MAGEL2* 1 1.28 chr15:23684685-26108259 Del 2424 Baskın Tek kişilik WES CNV Prader Willi sendromu
204560 JAG1* 2 1.21 chr20:10471400-13459333 Del 44 Baskın Trio WGS Hiçbiri Alagille sendromu
246146 HCN1 1 1.20 chr5:213101-46,270,700 Dup 44 Baskın Tek kişilik WGS SV Trizomi 5p
45020 PCDH19* 1 1.15 chrX:92925011-99669272 Del 6744 X'e bağlı Trio WGS Hiçbiri Gelişimsel ve epileptik
baskın ensefalopati 9

248678 FANCC* 1 1.14 chr9:97998556-98009092 Del 11 Çekinik Tek kişilik WGS SV Fanconi Anemisi
352726 THRA 1 1.00 chr17:32147833-79020944 Dup 46,873 Baskın Proband WGS SV Distal trizomi 17q
251355 TRIP11 4 0.58 chr14:84783523-96907490 Del 12,124 Baskın Duo WGS SV Kromozom
14q31.2q32.2
Sendrom
De La Vega ve diğerleri Genom Tıbbı (2021) 13:153 Sayfa 9
19'un

Şekil 1 GEM'in tanısal hassasiyeti Phevor, Exomiser ve VAAST varyant önceliklendirme yöntemlerinden daha yüksektir. A Gerçek nedensel genlerin
(veya nedensel SV'ler durumunda varyantların) en iyi 1., 2., 5. veya 10. gen adayları arasında tespit edildiği 119 vakadan oluşan kıyaslama kohortunun
oranı. Hasta fenotipleri klinisyenler tarafından tıbbi kayıtlardan manuel olarak çıkarılmış ve GEM, Exomiser ve Phevor'a HPO terim girdileri olarak
sağlanmıştır. VAAST yalnızca varyant bilgilerini dikkate almaktadır. GEM ve Phevor sıralamalarının bir veya iki varyant (bileşik heterozigot durumunda
ikincisi) içerebilen genlere karşılık geldiği, Exomiser ve VAAST sıralamalarının ise tek varyantlar için olduğu unutulmamalıdır. Bileşik heterozigotlar söz
konusu olduğunda, en üst sıradaki varyantın sıralaması Exomiser ve VAAST için gösterilmiştir. B Doğrulama kohortundaki (SV vakaları hariç) GEM
performansının doğrulama kohortuyla (birden fazla kaynaktan alınan 60 nadir genetik hastalık vakasından oluşan) karşılaştırılması

Daha sonra, GEM'in tanısal performansının, daha geç eCDSS kullanarak, kısa okuma hizalamaları kullanarak
hastalık başlangıcı olan hastalar, daha az şiddetli sunumlar düşük hassasiyet (yüksek yanlış pozitif, FP, oranları), tipik
veya diğer varyant arama boru hatları veya ayakta tedavi FP oranları% 20-30'dur [87, 88]. Bu durum, çok sayıda SV
genetik klinikleri tarafından üretilen veriler gibi YYBÜ için olay kalitesinin ve anlamlılığının çok fazla zaman alan
bebekleri dışındaki Mendel hastalıklarına uzanıp manuel değerlendirmesine yol açmaktadır. GEM, SV'leri
uzanmadığını araştırdık. Bu analizler için, büyük ölçüde probandın girdi VCF dosyasında sağlanan SV çağrılarıyla
beş farklı akademik tıp merkezinden gelen WES ve/veya SNV ve indel çağrılarıyla ilişkili meta verilerden
vakalarından oluşan bir doğrulama ortak grubu derledik varlıklarını ab initio çıkarsayarak puanlayarak düşük
(Tablo 1; Ek dosya 1: Tablo S2). Doğrulama kohortunda hassasiyetin etkisini minimize e t m e k t e d i r
GEM'in tanısal performansı kıyaslama kohortundakiyle ("Yöntemler"; aşağıya bakınız). Kıyaslama kohortu, gerçek
neredeyse aynıydı (Şekil 1B). Bu veriler, GEM'in tanısal dünya deneyimindekine benzer bir insidansı yansıtan
performansının hastalık şiddetine, başlangıç yaşına veya SV'lerin nedensel olduğu bildirilen 20 vakayı içeriyordu
genomik dizileme veya varyant saptama yöntemlerine bağlı (Şekil 1A, Tablo 2) [20-23]. Bunların 17'sinde etken SV
olmadığını göstermiştir. GEM tarafından birinci sırada gösterilmiştir. İkisinde ikinci
Bu bulguların bir sonucu, GEM'in 10 genin gözden sırada ve birinde dördüncü sırada yer alarak GEM'in kesin
geçirilmesiyle %97 geri çağırma (gerçek pozitif oran) elde olmayan S V çağrılarıyla yeterli tanısal performansı
ederken, diğer araçların benzer bir yeniden görünümle koruduğunu göstermiştir. Karşılaştırma setindeki hastalığa
<%78 geri çağırmaya sahip olmasıdır (Şekil 1, Ek dosya 2: neden olan SV'ler küçük (4 kb) ile çok büyük (örneğin, tüm
Şekil S2). Bu fark kısmen GEM'in SV'lere öncelik v e r m e kromozom kolları) arasında değişmektedir. Üç vakada tanı,
konusundaki benzersiz becerisini yansıtmaktadır. SV SV'n i n bir SNV/indel ile bileşik heterozigot olduğu
vakaları hariç tutulduğunda, GEM, Phevor ve Exomiser 10 otozomal resesif bir bozukluktu. Her birinde, GEM iki
genin gözden geçirilmesiyle sırasıyla %97, %83 ve %76 varyantı doğru şekilde entegre ederek nedensel diplotipleri
oranında geri çağırma elde etmiştir (Ek dosya 2: Şekil S3A). otomatik olarak tanımlamıştır (Ek dosya 2: Şekil S5).
Ayrıca, VAAST ve Exomiser sırasıyla 4 ve 18 gerçek pozitif GEM'in tanısal özgüllüğü ile ilgili olarak, BF > 0 (herhangi
varyant için sıralama sağlayamamıştır. Yanlış negatiflerin bir destek) olan bu probandlar için ortalama ve medyan
ve SV vakalarının hariç tutulması, önceki raporlarla gen adayı sayısı sırasıyla 8,7 ve 9,5'tir; bu da VCF dosyaları
uyumlu olarak Exomiser'ın ilk 10 hatırlama oranını %93'e nedensel veya başka türlü SV içermeyen probandlara
yükseltmiştir (Ek dosya 2: Şekil S3B) [86]. Bu veriler, gerçek benzerdir.
dünyadaki klinik uygulamalarda tanı performansının aşırı Büyük SV'ler sıklıkla birden fazla geni etkiler. Diğer
tahmin edilmesini önlemek için kıyaslamaya tüm vaka varyant sınıflarıyla tutarlılık için, çoklu genetik SV'lerdeki
türlerini ve nedensel varyantları dahil etmenin önemini genler, proband fenotipinin örtüşmesiyle ilişkili gen
göstermektedir. merkezli Bayes faktörü puanına ve bunlarla ilişkili bilinen
Mendel bozukluklarına (varsa) dayalı olarak GEM
Yapısal varyantların skorlanması tanı oranını artırır tarafından gruplandırılır ve sıralanır ("Yöntemler"). İçin
SV çağrılarının genom tanısal yorumlamasına dahil
edilmesinin önündeki en büyük engel, ister manuel ister

You might also like