You are on page 1of 70

育 教

教 合因
合因 教育
合因
教育
教育 因
因 育 合
合 教 育 教育
因 教
合 合因
育 合因
育 因教
因教 合
合 育
因教 育 育
合 因 教
谭灏文 育 教
合 小彩虹医学遗传学者会会员
因 教 合因
合 教育

因 教 育 育 育 合因
合 因教 教 教
合 合因 合因

教育 教
因 合因
合 育 教育
育 教
教 合因
合因 教育
合因
教育
教育 因
因 育 合
合 教 育 教育

全外显子测序变异筛选 合 合因 教
育 合因
育 教

Variant
因 教 interpretation in
合 WES

教 育

31 Jan 2021合谭灏文 教 育 教育
th
因 教 育 因
合 因 合
合 教育
教 育 因
因 育 育 育 合
合 教 教 教
合因 合因
合因

教 育 教

合因 育 合 教育
育 教
教 合因
合因 教育
合因
教 育
育 因

CONTENT
致病变异与VUS变异的特征
因 育 01 合
合 教 育 教育
合因 因 教变异筛选原则
合因
合02 育
育 因 教
因教 合
变异过滤策略
合 育 03
因 教 育 育
合 因教 案例讨论 育 因 教
合 04 因 教 合
合 教育
教育 05
总结

因 育 育 育 合
合 教 教 教
合因 合因
合 因

教育 教

合因 育 合 教育
致病变异与VUS变异的特征
要出色的完成变异筛选工作,我们需要了解致病变异与VUS变异的特征
我们试图从ClinVar上提交的13万条变异记录上去寻找两者之间的特征
教育
教育 因
因 合
合 教育
人类基因组的变异

合 育 千人基因组变


个人基因组的变异分布

合因
肿瘤细胞的变异 异的分布

合因 教 育 育 教育
Origin 合
因 因 教 因
of Variants

Class of Variants
育 合
育 Coding Non- SNP 3.5 – 4.3M
教SNP 84.7M
教 合因 Indel
coding

合因 Indel 550 – 625K 3.6M


Germ- 22K 4.1 – 5M
SV 2.1 – 2.5K SV 60K

line

因 教 育 (20Mb)
Total 88.3M
教育

Somatic ~50 5K

因 Total 4.1 – 5M
教育 因
合 Prevalence of Variants 因 合

Common
Common
教育

Passenger

教 合因
因 教育 育 育
合 教 教
合因 Driver (~0.1%)
合因 Rare* (1-4%)
合因 Rare (~75%)

教 育* Variants with allele frequency < 0.5% are considered as rare variants in 1000 genomes project.

合因
The 1000 Genomes Project Consortium, Nature. 2015. 526:68-74

Khurana E. et al. Nat. Rev. Genet. 2016. 17:93-108
合因 育
ClinVar中,SNV收录最多,大部分是VUS

https://towardsdatascience.com/an-exploration-of-human-genetic-variants-in-the-clinvar-database-fa50bcd87dea
ClinVar中,SNV收录最多,大部分是VUS SNV虽然最多,但是P/LP的SNV比例不足20%

https://towardsdatascience.com/an-exploration-of-human-genetic-variants-in-the-clinvar-database-fa50bcd87dea
致病性变异中,大部分由预期LOF变异组成(移码+无义突变)
非无义突变的致病性SNV,也包括很大一部分是LOF
致病性变异数量上,LOF >> GOF/DN

https://towardsdatascience.com/an-exploration-of-human-genetic-variants-in-the-clinvar-database-fa50bcd87dea
http://simple-clinvar.broadinstitute.org/

ClinVar已知致病变异加起来有131932个,其中Small Variant(SNV, InDel)有107171(81%)


大部分致病变异都是在编码区
Intronic变异主要是指非经典+-20的剪切位点变异,很少deep intron 变异
一共2225内含子变异(去掉33个非经典剪切)
落在+-10范围外的变异为852(0.65%), 落在+-20范围外的变异为686(0.52%),
教育

因教 合因
合 育
2万个编码基因中,只有15%是目前与单基因遗传病明确关联,30%基因的是胚胎

合因
致死性(在罕见病遗传中可能观察不到表型)
教 育
教育 因
因 育 合
合 教 育 教育
合因 因教 因
合 育 合
育 因 教
因 教 合
合 育
因 教 育 育
合 因教 育 因 教
合 因 教 合
合 教育
教 育 因
因 育 育 育 合
合 教 教 教
合因 合因
合因

教 育 教

合因 育 合 教育
育 教
教 合因
合因 育
致病变异 vs
合因 教 意义不明
教育
教育 因
因 育 合

P/LP 教 育VUS 教育
合因 因教 因
• Rare -
对照人群中罕见的 合 • Rare 合
- 对照人群中罕见的

•教 育 LOF – 绝大部分为功能丧
Mostly Mostly 因
• 教– 功能未明
SNV

合因失 育 • Everywhere – 散在分布
• CDS only - 因教
绝大部分位于编码区育 育
合 教 • 错义突变 >> 移码突变+无义突变教

• 移码突变/无义突变 > 错义突变合因 教
• Everywhere
因 – 散在分布 合 因
• 绝大部分位于~3000个OMIM基因, 合 教育

因 教其中超过10个致病变异报告的只有
育 育 育 合因

合 1280个基因,超过100个致病变异报 教 教
合因
告的,只有170个基因 合因 合因

教育 教
因 合因
合 育 教育
变异筛选原则
变异筛选是全外显子测序的关键流程
变异过滤逻辑
功能丧失变异的准确判断
特殊致病变异的处理
都是难点
教育
育 因
寻找致病位点的过程如同大海捞针
因 教


合 教
合因 育 detected:
平均每个全外显子测序可以发现 育 因 教
All variants

因 教 合 ~60,000’s of Variants

约6万个变异,但是绝大部分变 教 育 育 育
因 教 因 教
异都是多态,要找出明确的致病 合 合 因 Initial Filters:
合 Quality
教 育
Minimum Variant
教 育
变异需要精细化的策略: 因 Population Freq
因 合 1000’s
合 变异注释
1. 育
教 育 育
2. 变异筛选合因 因 教 育 因 教
合 因 教 AD 合 AR XL
3. 变异解读 合 6 育
育 Inheritance Pattern 100 585
因教
因 教 育 育
173 197 合
1

Phenotypically Associated
合 因 教 教 教 0
合 合 因 Protein Function Impacting

0 4

育 合 育
教 因 教
合 因 合 育
ACMG 2017 The Data Behind The Results Bioinfo for

Clinicians,Erica Ramos et.al
育 教
教 合因
合因 育
变异筛选原则 合因教
教育
教 育 因

• Rarity 合
合 罕见性 教育 育 教育
合因
• Gene list 候选基因集
合因 教
合因

• Transcription
育 isoform selection 转录本选择因教
因 教 合
合 • LOF prediction 丧失功能变异的预测

因 教 育 育
• Known pathogenic
合 variants 教
已知致病变异的有效筛选
育 教
合 因 教 合因
合因
• Knowledge for exceptional rules 容易造成漏点的特殊变异 育
育 因教
因 教 育 育 合
合 教 教 教育
合因 合 因
合因

教 育 教

合因 育 合 教育
育 教
教 合因
合因 育
变异筛选原则 合因教
教育
教 育 因

• Rarity 合
合 罕见性 教育 育 教育
合因
• Gene list 候选基因集
合因 教
合因

• Transcription
育 isoform selection 转录本选择因教
因 教 合
合 • LOF prediction 丧失功能变异的预测

因 教 育 育
• Known pathogenic
合 variants 教
已知致病变异的有效筛选
育 教
合 因 教 合因
合因
• Knowledge for exceptional rules 容易造成漏点的特殊变异 育
育 因教
因 教 育 育 合
合 教 教 教育
合因 合 因
合因

教 育 教

合因 育 合 教育
教育
教育 因
因 合
合 教育
合因 育
育 教
教 合因
合因 教育 育 教育
合因 合因教
合因
教育

因教 合因
合 育
教 育 育
合因 因 教 育
Most of variants are singleton!
因 教
合 因 教
绝大部分的候选变异(P/LP+VUS)都是只出现一次! 合

基于哈佛医学院15000个先证者的回顾分析
教育
教育 因
因 育 育 育 合
合 教 教 教
合因 合 因
合 因

教育 教
因 合 因 育
合 育Clinical Genome Resource. NEJM. May 27 , 2015
Rehm et al. ClinGen – The th
以人群频率过滤变异

根据每个基因对应的发病率来选择不同的阈
经验阈值 值:
• 1%常染色体隐性遗传
致病变异在人群中的频率(MAF)不会高于
• 0.1%常染色体显性遗传 该疾病在该人群中的发病率
• 这样会导致每个WES有超过500
假设一个单基因遗传病(AD)发病率为
个候选变异要看
1/10000,那么致病位点的人群携带率不会
高于0.01% (0.0001)
教 育
教 育 因
当选用的人群频率数据库个体
East Asian 育 合
合因
South 合因教 增长10倍,过滤后的候选变异
# variants remaining

教 育 Asian 因 教
降低为1/5
因 合
after filtering
合 教 Latino
育 育 教 育
合 因 African合因教 因
育 合
教 育 European # 过滤指的是根据人群频率数据库
因 教
因 合
过滤总体携带率高于0.1%(0.001)的
合 育
因 教 育 变异 育
合 因 教 育 因 教
合 因 教 合
合 教 育
育 更多的人群数据库样本数,以及更 因
因 教 育 育 多的人种参与,能显著的提高过滤 合
合 教 教 教 育
合因 合 因 效果 合因
教育 6K 60K 教 育

合因 育 合 教育
Lek et al., Nature, 2016
教 育

可以公开获取的人群频率公共数据集在不断增长,目前使用最
教 因
因 合

多是gnomAD 教育
合因
教 育
教育 因
因 育 合
合 教 育 教 育
合因 因教 因 个体数据
gnomAD: >140,000

合 育
育 因 教125,748 全外显子测序 15,708 深度全基因组测序

因教 合
合 育
因 教 育 数据来自 >100 PIs, 育 都是来自统
合 因教 育 因 教
合 因 教 一的数据分析流程,以及QC环

合 节,去除重复样本,去除已知的 教 育
教 育 因
因 育 育 早发致病变异(joint合 calling)
合 教 教 教 育
合因 合因
合因

教 育 教

合因 育 合 教育
育 因教

1000G,
合因 ExAC, gnomAD变异过滤应该选
教育

哪个?育 合因
教 育
教 合因
合 因
• 我们需要对每个注释数据都过滤一遍吗?
育 育
教 育 教
合因 合 因教
合因
教育
教育 因
因 合
合 育
因 教 育 育
合 因教 育 因 教
合 因 教 合
合 教育
教 育 因
因 育 育 育 合
合 教 教 教
合因 合因
合因

教 育 教

合因 育 合 教育
育 教
教 合因
合因 教育
合因
教育
教育 因
因 育 合
合 教 育 教育
因 教
合 合因
育 合因
育 因教
因教 合
合 育
因教 育 育
合 教 育 教
合因 因教 合因
合 教育

因 教 育 育 育 合因
合 因教 教 教
合 合因 合因

教育 教
因 合因
合 育 教育
育 因教

1000G,
合因 ExAC, gnomAD变异过滤应该选
教育

哪个?育 合因
教 育
教 合因
合 因
• 我们需要对每个注释数据都过滤一遍吗?
育 育
教 育 教
合因 教
• 不需要,建议只用gnomAD做硬过滤,其他数据集仅做标记/软过滤
合 因 合因
教育
教 育 因
因 合
合 育
因 教 育 育
合 因教 育 因 教
合 因 教 合
合 教育
教 育 因
因 育 育 育 合
合 教 教 教
合因 合因
合因

教 育 教

合因 育 合 教育
育 因教

1000G,
合因 ExAC, gnomAD变异过滤应该选
教育

哪个?育 合因
教 育
教 合因
合 因
• 我们需要对每个注释数据都过滤一遍吗?
育 育
教 育 教
合因 教
• 不需要,建议只用gnomAD做硬过滤,其他数据集仅做标记/软过滤
合 因 合因
• 不同数据库,选用的过滤条件是不是一样? 教育
教 育 因
因 合
合 育
因 教
• 我们需要针对分析的个体的人种来做基于种族的单独过滤吗?
育 育
合 因教 育 因 教
合 因 教 合
合 教育
教 育 因
因 育 育 育 合
合 教 教 教
合因 合因
合因

教 育 教

合因 育 合 教育
育 教
教 合因
合因 教育
合因
教育
教育 因
因 育 合
合 教 育 教育
因 教
合 合因 合因

育 因 教
教 合
ACMG指南对人群多态的定义:任何包含大于2000个单倍体(对于常染色体的变异,相当于1000个个体)

合 育
人群数据集(包括子集),大于5%的携带率的变异即可定义为多态,可以过滤掉
因 教 育 育
合 因 教 育 因教
合 因 教 合
合 教育
教 育 因
因 育 育 育 合
合 教 教 教
合因 合 因
合 因

教 育 比如这个位点,gnomAD总体MAF为0.96%, 教

合因 但是在拉丁美洲中携带率超过5%,也属于多
态 育 合 教育

ClinGen教育VCEP SOP ClinGen VCEP对于PM2, BA1与BS1的阈值修正,过滤条件可以更严格
合因
合因 教育
合因
教育
教育 因
因 育 合
合 教 育 教育
因 教
合 合因
育 合因
育 因教
因教 合
合 育
因教 育 育
• PM2 合 教 育 教
• Absent/extremely rare 合因 from large
(<0.004%) population教
因 studies 合因
• BS1 合 教育
•育
因 教 Allele frequency ≥0.02% based on the filtering allele frequency (FAF) in ExAc

there is no conflicting information 育
育 合因
provided
合 • BA1 因 教 教 教

• Allele frequency ≥0.1% 合
因 因
育 based on the filtering allele 合frequency (FAF) in ExAc育
教 因 教
合因 育 合
https://clinicalgenome.org/site/assets/files/3978/fda_decision_summary_clin-gen-expert-curated-human-variant-data.pdf
教育
育 因 教
教 合
合因 教育 ClinGen对于血小板减少症的BA1与BS1

合因 的阈值修正,对于表型更轻的发病率更高

的出凝血障碍,过滤条件要适当宽松

教育 因
因 育 合
合 教 育 教育
因 教
合 合因
育 合因
育 因教
因教 合
合 育
因教 育 育
合 教 育 教
合因 因教 合因
合 教育

因 教 育 育 育 合因
合 因教 教 教
合 合因 合因

教育 教
因 合因
合 育 教育
育 因 教

1000G,
合因 ExAC, gnomAD变异过滤应该选
教育

哪个?育 合因
教 育
教 合因
合 因
• 我们需要对每个注释数据都过滤一遍吗?
育 育
教 育 教
合因 教
• 不需要,建议只用gnomAD做硬过滤,其他数据集仅做标记/软过滤
合 因 合 因
• 不同数据库,选用的过滤条件是不是一样? 教育

教• 不一样,样本数量越多,过滤条件可以越严 因
因 合
合 育
因教
• 我们需要针对分析的个体的人种,来做基于gnomAD
育 EAS的单独

过滤吗?合 因教 育 因 教
合 因 教 合
• 硬过滤不需要,仅做标记/软过滤 合 育
育 因教
因 教 育 育 合
合 教 教 教 育
合因 合因
合因

教 育 教

合因 育 合 教育
育 因 教

1000G,
合因 ExAC, gnomAD变异过滤应该选
教育

哪个?育 合 因
教 育
教 合 因
合 因
• 我们需要对每个注释数据都过滤一遍吗?
育 育
教 育 教
合因 合因 教
• 不需要,建议只用gnomAD做硬过滤,其他数据集仅做标记/软过滤
合 因
• 不同数据库,选用的过滤条件是不是一样? 教 育
教 育
• 不一样,样本数量越多,过滤条件可以越严 因
因 合
合 • 我们需要针对分析的个体的人种,来做基于gnomAD
育 EAS的单独
过滤吗?合因
教 育 育
因 教 育 因 教
• 硬过滤不需要,仅做标记/软过滤
合 因 教 合
• 对于其他来源的人群数据应该如何使用? 合 教育
教 育 因
因 育 育 育 合

合 • 需要针对gnomAD的genome与exome
教 dataset各过滤一遍吗?

合因 合因
合 因

教 育 教

合因 育 合 教育
育 因教
因 教
WES datasets are biased 合

全外显子测序数据集与选用的试因教 育
剂高度相关 育 合 育
因 教
因 教 合
合 教 育 育 育

合因 合 因教
合因
教育
教 育 因
因 合
合 育
因 教 育 育
合 因教 育 因 教
合 因 教 合
合 教育
教 育 因
因 育 育 育 合
合 教 教 教
合因 合 因
合因

教 育 教

合因 育 合 教育
Comparison of Whole Exome Capture Products – Coverage & Quality vs
Cost
WGS
教育datasets
are biased…too 合因

合因 育
早期的WGS项目受限于成本,深度会更浅
合 因教
教育
教育 因
因 育 合
合 教 育 教育
因 教
合 合因
育 合因
育 因教
因教 合
合 育
因教 育 育
合 教 育 教
合因 因教 合因
合 教育

因 教 育 育 育 合因
合 因教 教 教
合 合因 合因

教育 教
因 合因
合 育 教育

gnomAD的数据集,根据不同的数据来源,进行了严格的QC,保证位点的真实性 教
教 合因
合因
从另一个角度考虑,由于这个数据集做了减法,我们用于过滤的自己的数据,要用自己的流程来做qc,
自己保证自己的变异数据的真实性
教育
gnomAD的数据集,不能用于过滤全外显子结果的假阳性位点!
合因
教育
教育 因
因 育 合
合 教 育 教育
因 教
合 合因
育 合因
育 因教
因教 合
合 育
因教 育 育
合 教 育 教
合因 因教 合因
合 教育

因 教 育 育 育 合因
合 教 教 教
合因 合 因
合 因

教 育 教
因 合 因
合 育 教育
https://gnomad.broadinstitute.org/faq#why-is-a-particular-variant-found-in-some-versions-of-exac-gnomad-but-
育 教
教 合因
合因 教育
合因
教育
教育 因
因 育 合
合 教 育 教 育
合因 因教 因
合 育 合
在使用gnomAD作为PM2的证据前,
需要确保查询的变异所在的位置满
育 因教
因教 合 求
足gnomAD数据集20X覆盖最低要

合 育
因教 育 育
在特殊情况下,假如查询的位点在
合 教 育 教
合因 合因
gnomAD数据集中覆盖不好,那么
因教 很可能这个位点被gnomAD数据集
合 过滤掉,这个变异不是真正的罕见
教育

合因
的变异
因 教 育 育
合 教 教 教育
合因 合因 合因

教 育 教
因 合因
合 General Sequence Variant Curation Process 育
ClinGen 教育
育 因 教

1000G,
合因 ExAC, gnomAD变异过滤应该选
教 育

哪个?育 合 因
教 育
教 合 因
合 因
• 我们需要对每个注释数据都过滤一遍吗?
育 育
教 育 教
合因 合因 教
• 不需要,建议只用gnomAD做硬过滤,其他数据集仅做标记/软过滤
合 因
• 不同数据库,选用的过滤条件是不是一样? 教 育

教• 不一样,样本数量越多,过滤条件可以越严 合 因

合 • 我们需要针对分析的个体的人种,来做基于gnomAD
教育 EAS的单独过滤
吗? 因 教 育 教 育
合 因 育 因

• 硬过滤不需要,仅做标记/软过滤 因教 合
• 对于其他来源的人群数据应该如何使用?
合 教育
教 育 因
因 育
• 需要做严格的数据清洗,不建议用于硬过滤,仅做标记/软过滤
育 育 合
合 教 教 教
合因 因
• 需要针对gnomAD的genome与exome
合 dataset各过滤一遍吗?
合 因

教• 育
不需要,WES数据直接用gnomAD exome all做过滤 教

合因 育 合 教育
育 教
教 合因
合因 育
变异筛选原则 合因教
教育
教 育 因

• Rarity

合 罕见性 教育 育 教育
合因
• Gene list 候选基因集
合 因教
合因
教 育
•教Transcription
育 isoform selection 转录本选择因
因 合
合 • LOF prediction育 丧失功能变异的预测
因 教 育 育
• Known pathogenic
合 variants
因 教 已知致病变异的有效筛选
育 因 教
合 因 教 合
• Knowledge for exceptional rules 容易造成漏点的特殊变异
合 育
育 因教
因 教 育 育 合
合 教 教 教 育
合因 合 因
合因

教 育 教

合因 育 合 教育
育 教
The合ClinGen
因 教 Knowledgebase 合因
教 育
合因
教育
教育 因
因 育 合
合 教 育 教育
因 教
合 合因
育 合因
育 因教
因教 合
合 育
因教 育 育
合 教 育 教
合因 因教 合因
合 教育

因 教 育 育 育 合因
合 因教 教 教
合 合因 合因

教育 教
因 合因
合 育 教育
育 教
教 合因
合因 育
变异筛选原则 合因教
教育
教 育 因

• Rarity

合 罕见性 教育 育 教育
合因
• Gene list 候选基因集
合 因 教
合因
教 育
•教Transcription
育 isoform selection 转录本选择

因 合
合 • LOF prediction育丧失功能变异的预测
因 教 育 育
• Known pathogenic
合 variants
因 教 已知致病变异的有效筛选育 因 教
合 因 教 合
• Knowledge for exceptional rules 容易造成漏点的特殊变异
合 育
育 因教
因 教 育 育 合
合 教 教 教 育
合因 合 因
合因

教 育 教

合因 育 合 教育
育 教
同一个变异,可以注释到不同的转录本,导致不同的LOF预测,甚至是注释到不同

的基因!
因教 合
合 教育
合因
教育
教育 因
因 育 合
合 教 育 教育
因 教
合 合因
育 合因
育 因教
因教 合
合 育
因教 育 育
合 教 育 教
合因 因教 合因
合 教育

因 教 育 育 育 合因
合 教 教 教
合因 合因 合因

教 育 教
因 合因

Aaron Quinlan, CSHL Advanced Sequencing Technologies,
育 教育
育 教
教 合因
合因 育
变异筛选原则 合因教
教育
教 育 因

• Rarity

合 罕见性 教育 育 教育
合因
• Gene list 候选基因集
合 因教
合因
教 育
•教Transcription
育 isoform selection 转录本选择因
因 合
合 • LOF prediction育丧失功能变异的预测
因 教 育 育
• Known pathogenic
合 variants
因 教 已知致病变异的有效筛选
育 因 教
合 因 教 合
• Knowledge for exceptional rules 容易造成漏点的特殊变异
合 育
育 因教
因 教 育 育 合
合 教 教 教 育
合因 合 因
合因

教 育 教

合因 育 合 教育
Ensembl Variation - Calculated variant consequences VEP对于LOF变异的定义

启动子丢失 经典剪切位点变异
终止密码子丢失

异常剪切事件,异常转录调控

提前的终止密码子
移码突变

https://m.ensembl.org/info/genome/variation/prediction/predicted_data.html
不同的注释软件 + 选择不同的转录本 = 变异的注释结果差 教

异 因教 合因
合 教 育

AnnoVar与VEP的注释结果差异很大,特别是对于LOF的注释一致性

教 育
教育 因
因 育 合
合 教 育 教 育
合因 合 因 教
合因
教育
教 育 因
因 合
合 育
因 教 育 育
合 因 教 育 因 教
合 因 教 合
合 教育
教 育 因
因 育 育 育 合
合 教 教 教
合因 合 因
合因

教 育 教

合因 CSHL Advanced Sequencing Technologies, 2018 育
Aaron Quinlan, 合 教育
育 教
教 合因
合因 育
LOF prediction summary
合因教
教 育
教育 因

• 对于未报道过的,人群频率低的InDel,都要特别小心
育 合
合 教 育 教育
合因 教
• 变异比对是基于个基因组版本,使用的转录本是否是最通用的?
合 因 合因
教育
• InDel是否有做left-alignment再做注释?如果不是,有可能导致人
育 因
因 教 合
合 群频率过滤失效
教 育
因 教 育
• IGV确定InDel真实性,把支持的reads序列复制出来做个blast/blat教育
看看
合 因 育 因
合 因 教 合
• 对于要报出去的InDel,最好做个sanger 合 测序看看是否与NGS结果 教育
教 育 因
因 一致 育 育 育 合
合 教 教 教
合因
• HGVS命名,要手工用https://mutalyzer.nl/校验
合 因
合因

教 育 教

合因 育 合 教育
育 教
教 合因
合因 育
变异筛选原则 合因教
教育
教 育 因

• Rarity 合
合 罕见性 教育 育 教育
合因
• Gene list 候选基因集
合因 教
合因

• Transcription
育 isoform selection 转录本选择因教
因 教 合
合 • LOF prediction 丧失功能变异的预测

因 教 育 育
• Known pathogenic
合 variants 教
已知致病变异的有效筛选
育 教
合 因 教 合因
合因
• Knowledge for exceptional rules 容易造成漏点的特殊变异 育
育 因教
因 教 育 育 合
合 教 教 教育
合因 合 因
合因

教 育 教

合因 育 合 教育
育 教

MPZL2是晚发性非综合征耳聋的新基因
合因
合因 教育
合因
教育
教育 因
因 育 合
合 教 育 教育
因 教
合 合因
育 合因
育 因教
因教 合
合 育
因教 育 育
合 教 育 教
合因 因教 合因
合 教育

因 教 育 育 育 合因
合 因教 教 教
合 合因 合因

教育 教
因 合因
合 育 教育
这个致病热点,被认为是亚洲人,特别是东亚的热点,
在日本这个致病变异携带率超过1%,中国人群没有明
确数字,我们内部数据是携带率1.3%
育 教
教 合因
合因 育
变异筛选原则 合因教
教育
教 育 因

• Rarity 合
合 罕见性 教育 育 教育
合因
• Gene list 候选基因集
合因 教
合因

• Transcription
育 isoform selection 转录本选择因教
因 教 合
合 • LOF prediction 丧失功能变异的预测

因 教 育 育
• Known pathogenic
合 variants 教
已知致病变异的有效筛选
育 教
合 因 教 合因
合因
• Knowledge for exceptional rules 容易造成漏点的特殊变异 育
育 因教
因 教 育 育 合
合 教 教 教育
合因 合 因
合因

教 育 教

合因 育 合 教育
育 教
教 合因
合因 育
遗传诊断中的一些坑,需要充足的经验 合 因 教
教 育
教 育 因

• 限性遗传 育 合
合 教 育 教 育
合 因
• PCDH19女性杂合发病,男性半合子无表型
因 教 因
• 印记基因 合 育 合
育 教
• SGCE(肌阵挛性肌张力障碍11型, DYT11, AD)是印记基因,仅父源表达,母源甲基化,父亲遗传的LOF变异才有

因 教 表型

合 • 半显性表型严重化 育
因 教
• LDLR符合杂合,是造成HoFH的原因,比FH预后严重很多,是致死性疾病 育 育
合 因 教 育 因 教
• 修饰机制
合 因 教 合
的7.9~10.6% 合
• TBX6的NULL variant与risk haplotype (rs2289292 C/T同义突变)复合杂合造成先天性脊柱侧弯,约占中国人群散发CS
教育
•教
育 因
因 致病性ncRNA变异
育 育 育 合
合 教 教 教
合因
• RMRP不在WES捕获范围(只针对编码蛋白的CDS区),软骨-头发发育不全,合并原发免疫缺陷,特征是线粒体缺
陷,头发稀疏,身材矮小
合 因 因
育 合 育
教 因 教
合因 育 合 教育
变异过滤策略
全外显子的变异过滤不能简单的根据人群频率一刀切
Ambry genetics
的变异筛选流程 1. 优先把
ClinVar/HG
MD上的致
病变异筛出
来判断

Pipeline+G
2. 在过滤人 Cer)
群频率后,
根据家族史
与遗传模式
选点(PhD)

3. 对候选
位点做变异
解读,明确
其致病性
(GCer)

Christina L. Alamillo, MS, CGC


Genetic Counselor, Clinical Genomics, Ambry Genetics
育 因教
教 合
合因 变异过滤的一般步骤 教育
合 因
教 育
教 育 因
因 育 NGS variants 合
合 教 育 教 育
合因 因
search for known

教disease mutations
合因
教育
教 育 exclude polymorphisms 因
因 合
合 育
因教 育
limit to disease loci / genes

合 因 教 育 因 教
合 filter genotypes
因 教 合
合 教育
教育 filter for effect on protein 因
因 育 育 育 合
合 教 教 教
合因 合 因 prioritise genes 因
合QC质量控制,是减少假阳育
教育 教
性变异的关键步骤!因
合因
quality control
育 合 教育
育 因 教
教 合
合因 质量控制需要考虑: 教 育
合 因
教 育
教 育 因
因• is it sufficiently
育 covered? 位点的测序深度是否足够 合
合 教 育 教 育
合因
• is it (frequently)
合 因 教
found in polymorphism databases? 是否在 因

• is it reported in ClinVar / HGMD?
教 育
教 育 • do you see it in the parents? 因
因 合
合 • do you see 育 it in other samples?
因 教 育 育
合 因 教 育 因 教
Test for co-segregation 合 因 教 合

• reveals incompatibilities with the pedigree 教育
教育 因
因 • inevitable 育 for suspected compound
育 heterozygosity
育 合
合 教 教 教
合因 合 因
合 因

教育 教

合因 育 合 教育
育 教
教 合因
合因 教育
合因
教育
教育 因
因 育 合
合 教 育 教育
因 教
合 合因
育 合因
育 因教
因 教
内部频率很重要,每家测序单位都需要自己建立 合
合• 固定的湿实验条件与SOP 育
• 建库试剂 因 教 育 育
• 捕获试剂 合 因教 育 教
• 测序平台 合 因教 合因
• 数据分析流程 合 教育

合因
内部黑名单:
•因
教 育 育
QC过的位点
合• 外部频率(gnomAD因 教 教 教育
合因
exome)为0或NA

• 内部频率大于10%(内部数据大于100个时) 合因

• 内部频率大于1%(内部数据大于1000个时) 教育
因 教 因
合 育 合 教育
育 教
教 合因
合因 教育
合因
教育

内部黑名单位点多位于
教 因
• 多比对区域
因 育 合

• 高GC区域
教 育 教育
因 教
合因
• 串联重复区域
• Alu原件区域 合 合因
教育
教育 因
因 合
合 育
因教 育 育
合 教 育 教
合因 因教 合因
合 教育

因 教 育 育 育 合因
合 因教 教 教
合 合因 合因

教育 教
因 合因
合 育 教育
育 因 教

• 定义:SNV点突变,MNV多碱基连续变异,small
因 合
indel 小于50bp的变异,
合 教育

complex variant 困难变异,包括同时存在插入缺失等

教 育
教 育
• 对于测序精度,在质量控制的标签filer为PASS(即来自GATK 因 haloptype caller
因 育 合
合 教 育
产出的VCF做了质控标记后),全外显子测序对SNV,MNV,small 教 育
indel其SP
合因 合 因教
合 因
与SN都是大于99%,所以对于质控为PASS的,理论上假阳性的概率低于1%
教 育
教 育 因
因 (特别是SNV假阳性低于0.1%),此为大前提。 合
合 育
教 育
• 常见的质控标签无法过滤的假阳性,多来自比对问题,即来自参考基因组该
因 育
合 因教 育 因 教

区域有特殊的简并结构,造成的比对错误,这类可以通过内部数据统计来看
因 教 合
合 教 育
教 育
出来,策略是外源注释没有数值,而内部数据统计大于1%的频率 因
因 育 育 育 合
合 教 教 教
合因 合因
合因

教 育 教

合因 育 合 教育
育 因教

• cat0 教
定义为白名单,位点为明确已知致病突变, 合
合以及我们特色的SMN1 exon7 SNP的突变比例 教 育
合 因
(代表SMN1的拷贝数)
教 育
教育 因
• cat1 定义为ClinVar上已知的致病/疑似致病变
因 育 合
合 教
异,或者同样位置,有其他变异方向的ClinVar 育 教 育
合 因 因 教 因
已知致病/疑似致病变异
合 育 合
• cat2育 因 教
因 教 定义为已知的其他致病/疑似致病变异,

合 或者同样位置,有其他变异方向的已知致病/疑

似致病变异 因 教 育 育
合 因教 育 因 教
• cat3 定义为人群频率低的潜在LOF变异,注意是 合 因 教 合
要满足该基因致病性已知(OMIM或内部整理的 合 教育
教 育 因

基因list),包括移码突变,剪切突变
育 育 育 合

合 • cat4 定义为罕见的,软件预测为有害的变异 教 教
合因 合 因
合因

教 育 教

合因 育 合 教育
案例讨论
3个真实案例演示全外显子变异过滤逻辑
育 教
教 合因
合因 教育
合因
教育
教育 因
因 育 合
合 教 育 教育
因 教
合 合因
育 合因
育 因教
因教 合
合 育

切换到作业ppt~
合因
合因
教育
教育
合因
教育
合因 育
育 教
因 教 育 育 育 合因
合 因教 教 教
合 合因 合因

教育 教
因 合因
合 育 教育
育 教
因 教 合因
合 教育
案例1 因
合 育
育 因教
因教 合
4y 合
男孩
教育 育 育
因 教 教
主诉: 合 合因
育 合因
育 教
肢体乏力、眼脸下垂2周,加重1周。患儿于2周前无明显诱因出现肢体乏力,3天后出现

因 教 合
双眼睑下垂,1周前症状加重,并出现阵发性轻咳,每次咳2-3声,有痰难以咳出。
合 2021.1.3上午出现浅昏迷,后反复发热,以中高热为主,肢体乏力无明显改善,眼睑下

因教 育
垂改善但逐渐出现双眼内斜及上转。四肢不自主抽动,头不自主左右转,常有惊恐样发 育
合 因教 育 因教
作。 头颅MRI+颈椎MRI:双侧大小脑半球、基底节区、肼胝体、脑干弥漫多发异常信
合 因 教 合
号,双侧大脑半球脑白质受累为主,需注意遗传代谢疾病或中毒性脑病可能;双侧咽后、

双颈II、IⅢ区多发小/稍大淋巴结,拟反应性增生:鼻咽粘膜稍增,考虑未退化腺样体 教育
因 教育
与鼻咽炎鉴别,附见:右上肺炎
育 腹部B超:双肾增大。肠系膜淋巴结肿大。
育 合 因
合 无明确家族史 因教 教 教育
合 合因 合因

教 育 教

2021年1月进行家系全外显子测序
合因
合 育 教育
育 教
因 教 合因
合 教育
案例1 因
合 育
育 因教
因教 合
合 教育 育 育
因 教 教
合 合因
育 合因

变异编号:
因教
154
因教 合

155

因教 育 育
合 教 育 教
合因 因教 合因
合 教育
教 育
白质消融性脑白质病(Ovarioleukodystrophy; OLD; OMIM: 603896)是一种以常染色体因
因 育 育
隐性方式遗传的神经系统疾病。患者通常于婴儿早期或成年期发病。临床表现为表现不
育 合
因 教
合 一的神经系统特征,如进行性小脑性共济失调、嗜睡、痉挛,脑成像显示脑白质病变相
教 教
合 合 因 因
关的认知功能障碍。头部外伤可导致快速的神经系统功能恶化,女性携带者可出现卵巢
育 合 育
教衰竭,40岁以下促性腺激素升高可导致原发性或继发性闭经6个月以上。 因教
合因 育 合 教育
育 教
因 教 合因
合 教育
案例2 因
合 育
育 因教
因教 合
1y 合
女孩
教育 育 育
因 教 教
主诉: 合 合因
育 合因
育 教
2020.12.20,患者两周前头部撞击木门,十分钟后出现惊厥一次,表现为:意识不清,

因 教 合
双眼凝视,牙关紧闭,双手握拳,面色发青,持续1-2分钟,半小时后再次出现惊厥发
合 作,表现同前,一分钟左右缓解。异常脑电:睡眠各期双侧额极,额,中央及前颞区可

因教 育
见尖波,尖慢复合波发放,以左侧为著,睡眠期明显增多,口服德巴金,期间无发作, 育

后治疗过程仍有发作。生长发育轻度迟缓。 因教 育 因 教
合 因教 合
无明确家族史 合 教育

因 教 育 育 育 合因
合 因 教
2021年1月进行全外显子测序
教 教
合 合因 合因

教 育 教
因 合因
合 育 教育
育 教
因 教 合因
合 教育
案例2 因
合 育
育 因教
因教 合
合 教育 育 育
因 教 教
变异编号:
合 合因
育 合因
643 育 因教
因教 合
合 育
因 教 de Lange syndrome育 育
德朗热综合征2型(Cornelia
合 因 教 2;CDLS2;OMIM:300590)是⼀种X染⾊体显性遗传疾病,一
育 因 教
般⼥性突变携带者比男性突变携带者的症状轻。CDLS2患者会出现产前和产后⽣⻓迟缓,⼩头畸形,短头畸形,

⼩颌畸形等,患者还会出现⻓⽽光滑的⼈中,拱形眉⽑,⼀字眉,浓眉,⻓睫⽑,上睑下垂,下睑睑裂,⾼ 因 教 合
⿐梁,⿐孔前倾,上唇薄,⼝⻆下垂, ⾼拱形嘴等⾯部畸形特征。CDLS2患者还会出现短脖⼦,肥厚型⼼肌 合 教育
教育病,胃⻝管反流,肘部运动受限,⼿部会出现⼩⼿,短指,五指,近侧放置拇指等畸形,还会出现⼩脚,前

因 育
发际线低,多⽑症等。除此之外,CDLS2患者还会出现精神运动发育迟缓,认知障碍,语言障碍,部分患者还
育 育 合
合 会出现癫痫。
因 教 教 教
合 合 因 因
早发性婴儿癫痫性脑病85型伴或不伴中线脑缺损(Early
育 合 encephalopathy-85 with 育
infantile epileptic or without
教midline brain defects; EIEE85; OMIM:301044)是一种X连锁神经性疾病,患者通常在一岁左右发病,主要临
因 教
因 合 教育
床特征为难治性癫痫,智力发育受损,语言障碍,面部发育不良,部分患者有中线脑缺陷。
合 育
育 教
因 教 合因
合 教育
案例3 因
合 育
育 因教
因教 合
3y 合
女孩
教育 育 育
因 教 教
主诉: 合 合因
育 合因
育 教
癫痫,2019.2.28发作1次,5月份左右发热,体温38-39度,当天抽搐5-6次,之后将丙

因 教 合
戊酸钠加量至2.8ml,1天2次,2019.9.19发热抽搐1次,2020.1无热抽搐1次表现为双眼
合 上翻,四肢抖动,持续时间1-2分钟,2020.9月至今有四次发作,发作表现为眼睛上翻,

因 教 育
口唇发绀,持续1-2分钟,2020.11发作4次。(注意SCN1A基因,患儿先为发热抽搐, 育
转成无热抽搐。) 合 因 教 育 因 教
合 因教 合
无明确家族史 合 教育

因 教 育 育 育 合因
合 教
2020年12月进行家系全外显子测序
教 教
合因 合因 合因

教 育 教
因 合因
合 育 教育
育 教
因 教 合因
合 教育
案例3 因
合 育
育 因教
变异编号:
因教 合
219 合 教育 育 育
因 教 教
合 合因 合因育
育 因 教
因 教 合
合 育
早发性婴儿癫痫性脑病6型(Dravet综合征)(Epileptic encephalopathy, early infantile, 6 (Dravet syndrome); EIEE6; OMIM:607208)是一种以常染

因 教
色体显性方式遗传的疾病。患者通常于一岁前发病。主要临床特征为全身阵挛性癫痫或强直性阵挛性癫痫发作,单侧阵挛性癫痫发作。该病临床

表现多变,最初由发热引起癫痫,之后患者也会出现其他癫痫类型,如失神发作、复杂的部分癫痫发作、肌阵挛发作等。此外,患者精神运动发 育
合 因 教
育迟缓,常停滞在两岁,并且可能会出现其他神经系统体征,如共济失调、锥体束征等。EIEE6大部分变异为新发突变。
育 因 教
合 因 教
家族性热性惊厥3A型(Febrile seizures, familial, 3A; FEB3A; OMIM:604403)是一种以常染色体显性方式遗传的疾病。患者通常于6个月至6岁之 合
间发病。主要临床症状为复杂性热性惊厥,癫痫,神经系统发育延迟或异常体征。FEB3A患者直系亲属中会有癫痫病史。 合 教 育
教 育 因
全面性癫痫伴热性惊厥2型(Epilepsy,
因 育 合
generalized, with febrile seizures plus, type 2; GEFSP2; OMIM:604403)是一种以常染色体显性方式遗传的
育 育
合 教 教
疾病。患者通常于6个月至6岁发病,单纯型热性惊厥通常在6岁后缓解。主要临床特征为伴有发热的全身性癫痫发作,热性惊厥,全身性强直阵挛
因 教
合 合 因
发作,失神发作,肌阵挛性癫痫发作,偏侧阵挛性发作,局灶性癫痫发作等,但患者精神运动发育正常。该病患者临床表现多样,严重程度多变。

育 合 育
家族性偏瘫性偏头痛3型(Migraine, familial hemiplegic, 3; FHM3; OMIM:609634)是一种以常染色体显性方式遗传的疾病。患者通常于20岁前发

病。主要临床特征为眼睛畏光,由光线,突然站立或眼睑直接压力会引起持续3-10秒的短暂失明,失明发作期间没有瞳孔反射。患者还会有偏头
因 教
合因
痛,偏瘫等症状。FHM3具有遗传异质性。
育 合 教育
总结
To err is Human.
To err repeatedly is research.
We can learn a lot from mistakes.
育 教
教 合因
合因 育
Summary 合因教
教育
教育 因
因 育 合
合 教
• 全外显子测序是目前单基因遗传病诊断的重要武器
育 教育
合因 合因 教
合因
• 绝大部分致病变异是功能丧失的小变异 教 育
教育 因
因 合
合 育
• 高效的变异过滤筛选需要一定的技巧
教 育 育
合因 教 教
因 教 育 因

• 充分了解变异的特征对选出致病变异非常重要 因 合
合 教育
教 育 因
因• 经验是很好的老师,我们需要不断的总结经验教训
育 育 育 合
合 教 教 教
合因 合因
合因

教 育 教

合因 育 合 教育
育 教
教 合因
合因 教育
合因
教育
教育 因
因 育 合
合 教 育 教育
因 教
合 合因 合因
教育 咨询和关爱 从了解开始
因教育
因 合
合 育
因教 育 育
合 教 育 教
合因 因教 合因
合 教育

因 教 育 育 育 合因
合 因教 教 教
合 合因 合因

教育 教
因 合因
合 育 教育
育 教
教 合因
合因 教育
合因
教育
教育 因
因 育 合
合 教 育 教育
因 教
合 合因
育 合因
育 因教
因教 合
合 育
因教 育
heyin@synergene.cn 育
合 教 育 教
合因 因教 合因
合 教育

因 教 育 育 育 合因
合 因教 教 教
合 合因 合因

教育 教
因 合因
合 育 教育
育 教
教 合因
合因 教育
合因
教育
教育 因
因 育 合
合 教 育 教育
因 教
合 合因
育 合因
育 因教
因教 合
合 育
因教 育 育
合 教 育 教
合因 因教 合因
合 教育

因 教 育 育 育 合因

合因教
因教 联系我们因教
合 合 育
教育 地址:江西省赣州市和君小镇和君楼304办公室 教
因 合因
合 教育
70
合因教育微信订阅号 合因教育知识店铺

邮箱:heyin@synergene.com

You might also like