You are on page 1of 6

第 4 策:分子点睛

有了疾、型、模、法、标五恒量的研究体系,往其中代入一个或多个变量即衍生万千

变化。变量有三,从简单到复杂分别是药物、分子、通路,出场率最高的为分子——数量

拥百万之众,又有自身形态的转换。提取一枚创新分子对课题而言恰如画龙点睛,为朴实

无华的套路临摹,注入熠熠新生。

分子原本是个比较宽泛的概念,《三十六策》里所言分子,专门指代两类生物大分子:

核酸(包括 DNA、RNA)和蛋白,它们构成了医学研究的主角。疾病的发生与转归必然存在

内因与外因,外因也借由内因产生效应,而人体内部的调控机制是什么?那便是在细胞内核

酸、蛋白分子上的各种变化。当前的科研能力,正处于站在分子变化角度阐释表型现象的微

观水平。我们常说“分子机制”
,潜台词即机制从分子这一认知深度剖开,无分子不机制。

本策“分子点睛”开始,我们正式进入变量修炼的环节。

人靠衣,马靠鞍,没有灵魂的芬芳,千篇一律的肉体也只剩下索然无味。恒量是一个研

究方向的通用体系、常规套路,一旦参数固定了,研究内容实质上都差不多,但是总不见得

全世界文章都一个模样?同一个台子唱不同的戏,主角是浩如烟海、延绵不绝的分子们。哪

怕两个课题的疾病和表型完全一样,由此导致模型、实验方法和标志物的选择也相差无几,

但是只要研究的分子不一样,就是两篇不同的文章。

所以不难体会,恒量与变量之中,变量更重要!变量就像是衣和鞍,是一项研究区别于

其他研究的显著特征。一样的疾、型、模、法、标经由不一样的分子点缀,讲述各不相同的

分子介导表型故事,赋予了俗气的套路无尽变化的涟漪。领悟这一点,科研之门算打开了

一丝缝,能够从中窥探些许风景了。在基础科研里,老套路新分子构成一种普遍的移植性研

究思路,掌握了老瓶装新酒的分子替换策略,会产生源源不竭的课题火花:把某个新分子放

进恒量套路,不就成自己的项目了嘛?虽然这种设计还属于小学生水准,但好歹思路渐渐萌

芽了。
恒量套变量构成了一条普遍规律,在此基础上本策有两个问题重点探讨。第一,如何证

明一个分子有功能表型?变量代入恒量形成科学假设,证明分子介导表型变化为最核心的论

证步骤。我们做一个思想实验,想象有一个空房间,里面放进去一只母老鼠,这是你的研究

体系,然后再放进去一个公老鼠,过一段时间观察到房间里多了一些小老鼠,会得到什么结

论?公老鼠有能力生小老鼠吗?抛开常识不谈,这种逻辑水平也不严谨。科学家的推断应该

是:公老鼠有能力使包含母老鼠的密闭房间产生小老鼠,且在足够长时间、吃喝管够的情况

下。进一步地,怎么证明小老鼠的产生就是体系加入公老鼠的作用呢?首先,我只放了一只

公老鼠,这是唯一的干预因素;其次,另外设一个对照组,其他条件都一样,放进去一只丧

失性功能的去势鼠,该组就没有观察到小老鼠的出现,所以,我们认为功能正常的公老鼠可

以在有母老鼠存在的情况下,表现出繁衍小老鼠的功能。通过这个思想实验,可以理解科研

的逻辑推演方式跟临床循证(Evidence-based)是一致的,有什么证据说什么结论,不能主

观臆想扩大解释和应用。

加一个干预因素进去,学术上有个专业词,叫 Gain of function——获得功能。但如

果在实验体系里加入一只猫呢?别说生小老鼠了,估计连母老鼠也保不住,这种反过来的操

作策略叫 Loss of function——丧失功能。所以证明一个分子有某个方面功能表型的方法,

无外乎人为驱动分子“上调”或者“下调”表达,观察表型的“获得”或者“失去”,证明

表型存在与分子存在有明显的因果关系。因果逻辑可谓科研论证的本源大道,证明因果有且

只有一种方法:操作因变,观察果是否随之而变。如果操作对象变化,观察对象保持不变,

则两者不存在因果关联。关于操作分子的“法”,我们在上一策归类到分子实验中,上调/

过表达即 Gain of function,而下调/沉默即 Loss of function。注意不要混淆,Gain 或

者 Loss 是指代分子的上或者下,并不是功能的方向(好或者坏)。上调分子让好表型变坏(致

病),依然是 Gain of function,因为获得的是变坏的功能。非要将失去了好的表型理解成

Loss,就陷入望文生义的泥潭了。

在技术上,细胞模型中过表达一个分子的手段有两类,一是质粒(Plasmid),二是病毒

(Virus),它们可以统称为载体(Vector)
,用来实现把外源基因导入到细胞内的目的。载

体是运输工具,制作载体的技术叫基因工程技术。直接把一个基因的 DNA 序列合成好加到细

胞里不会表达出蛋白,因为 DNA 序列只是印钞的母版,印钞票还需要专门的印刷机,此印刷

机即质粒或病毒载体。质粒为一种环状的 DNA 分子,包含一系列结构元件,能够把一段特定

编码序列 DNA 转录出 RNA 来,接着 RNA 在细胞内自动翻译成蛋白,实现外源表达,如同一座


基因表达的高效分子工厂。质粒 DNA 无法直接穿过细胞膜磷脂双分子层,所以质粒导入细胞

需要用到与细胞膜亲和的高分子聚合物试剂(脂质体)
,这一步操作称转染(Transfection)。

转染就相当于把“货”用卡车运进去,但有时候会遇到条件比较恶劣,比如打仗了,更好的

办法是用装甲车来运输。第二种把基因导入细胞的方法——病毒,满足了对付一些难以转染

的细胞,比如神经细胞、干细胞、原代细胞等等。因为病毒自带装甲,武装力更强,细胞膜

即使铜墙铁壁也能突破进去,甚至还有主动巡航功能:有些病毒有特定细胞的亲噬性,可靶

向 特 定 细 胞 感 染 。 病 毒 进 入 细 胞 不 用 转 染 的 概 念 , 用 感 染 ( Infection ) 或 者 转 导

(Transduction)作为术语。无论质粒还是病毒,最终目的都为了运输基因到细胞里,实现

人为的、外源的表达。

Loss of function 作为 Gain of function 的反向操作,在医学研究里其实使用的频次

更高。理由很简单,医学研究往往关注疾病的致病因素,表现为伴随疾病的发生分子表达增

高,这种情况下用 Loss of function 人为地抑制其表达,可以观察疾病相关的表型是否减

轻,起到治疗的模拟作用。按照学术惯例,疾病中高表达的基因(致病因素),倾向于采用

沉默手段来研究,而疾病中低表达的基因(保护因素)倾向于过表达手段研究,总体来说操

作方向是为了缓解疾病相关表型。当然,更严谨的做法是不计成本,将 Gain of function

和 Loss of function 一正一反双向操作平行完成,并获得相互印证的结果,证据更全面、

可信度提升。

如果没有 RNA 干扰(RNA interference,RNAi)技术的出现,Loss of function 实验

执行过程颇为繁琐,本世纪之初科学家们研究一个基因,还主要采用过表达的方法,剔除一

个基因在技术上实现难度大。划时代的 RNAi 技术在 2006 年获得诺贝尔生理学或医学奖,只

要合成一段 21 个碱基的小干扰 RNA(small interfering RNA,siRNA)


,转染到细胞里就能

完成对目标基因七成以上的表达沉默,指哪打哪,全基因谱通用。当 siRNA 进入细胞,会被

一个蛋白复合体 RISC(RNA induced silencing complex)复合体结合,然后以序列互补的

形式找 siRNA 匹配的 mRNA 靶点,一旦配对就启动核酸内切酶活性将特定基因的 mRNA 降解,

从而高效、特异地阻断体内特定基因表达。siRNA 的设计并不难,一个基因可供选择的 siRNA

序列很多,一般来说设计三条 siRNA 总有一条是有效的。用 RNAi 沉默基因有个术语叫

Knockdown,翻译过来称敲降或者敲减,这与基因敲除的术语 Knockout 相对应。RNAi 不是

完全功能缺失,有些研究场景需要用到基因编辑方法实现基因 Knockout,即在 DNA 水平把

基因的编码序列 DNA 破坏掉,如 CRISPR-Cas9 基因编辑技术(2020 年诺贝尔化学奖)


。CRISPR
在 RNAi 之后兴起,既可以做基因敲除也可以实现基因敲入,但因为步骤上比 RNAi 略复杂,

短时间内还无法替代 RNAi 的应用。

至此我们回答了第一个问题,怎么证明一个分子有功能,方法就是一正一反操作,观察

表型变化,论证因果关系。第二个需要重点理解的问题:分子为统称,具体可划分多少个细

分类型?简单说,至少按照 DNA、RNA 和蛋白三类区别理解。DNA 并非医学科研主要对象,

因为 DNA 作为遗传信息比较稳定,大部分疾病的发生与 DNA 变异关联甚微。仅有遗传性疾病

和恶性肿瘤中会出现 DNA 的突变、缺失、重排等异常,此类课题只占医学科研的小部分,主

流方向关注 RNA 和蛋白水平变化。

探讨 RNA 或者蛋白的功能角色,等同于将分子划分成编码基因和非编码基因两类。编码

基因的产物即蛋白,同一个基因有 DNA、RNA、蛋白三种形式,而非编码基因只有 DNA 和 RNA

两种分子类型,非编码 RNA 主要发挥调控功能,本身不翻译蛋白。生物学中心法则阐述了遗

传信息从 DNA 到 RNA 再到蛋白,蛋白作为细胞执行功能的基本单位,属于永恒研究主题。从

前是,现在是,未来还是,只要基因的功能还没有完全解锁,研究蛋白就不会过时。只不过,

最近二十几年学术界风起云涌,发现了一类能够与蛋白平起平坐的非编码 RNA 分子,它们虽

然不编码蛋白,但是能起到广泛的基因调控作用,甚至天生就为精细调控而存在。非编码分

子数量比编码基因还多,作用形式无所不包,有蛋白的地方均有非编码的缠绵纠葛,其重要

性已经到了与蛋白旗鼓相当的地步。编码的、非编码的两分天下,此乃当今变量分子之研究

格局。非编码分子,记住有普遍性的三种:小 RNA(microRNA,miRNA)、长链非编码 RNA(long

non-coding RNA,lncRNA)和环状 RNA(circular RNA,circRNA),特点分别是短、长、环。

其余相对小众,略过不表。

非编码 RNA 的第一站,必先从“短”入手,miRNA 属于所有分子类型中的极简约款,特

别适合新手入门。2001 年,Science 杂志的一篇文章中第一次出现 microRNA 的概念,micro

就是微小的意思,因为这种 RNA 分子很短,长度只有 20 个碱基左右,所以叫 microRNA。最

早的一条 miRNA 发现要追溯到 1993 年,在模式生物线虫中发现的 lin-4,中间隔了 7 年又

发现了一条功能类似的 let-7,由此催生出 2001 年大爆发——Science 同期报道了三个研究

小组在线虫、果蝇和人 cDNA 文库中鉴定出的近百个与 lin-4 和 let-7 相似的小分子 RNA,

并统一命名为 microRNA (miRNA)。


miRNA 的发现开启了非编码 RNA 研究的篇章,揭示了细胞中存在一个由内源非编码 RNA

介导的转录后基因调控的普遍机制。之后科学家在大量生物体中发现了数以千计的 miRNA。

它们都是大约 22nt 长度的内源性 RNA 分子,由茎环结构的前体加工而成,而且在进化过程

中一般比较保守。miRNA 的作用是可以负向调节一个基因的表达,几个 miRNA 可能共同调节

同一个基因,一个 miRNA 也可同时调节几个基因,形成复杂的调控网络。据推测,miRNA 至

少调节着人类三分之一的基因。

接下来,说一说“长”
。非编码 RNA 里真正与蛋白待遇在伯仲之间的,是长链非编码 RNA

——lncRNA。所谓长,指 lncRNA 长度一般大于 200 个碱基。lncRNA 的发现其实比 miRNA

还早,最早是 1990 年在哺乳动物的细胞中鉴定了第一个 lncRNA——H19。刚发现时也没意

识到它是普遍存在的调控分子。最近十几年,受到小 RNA 研究的启发以及新的测序技术推动,

lncRNA 被大量鉴定出来,又发现它具有异常丰富的结构和多样性的功能,引起了研究者们

极大关注。miRNA 作用方式比较单一,lncRNA 则花样百出,基本上蛋白能执行的调控形式

lncRNA 都能参与,灵活性巨大。掌握了 lncRNA 的各种套路,科研能力就像一把上好的宝剑,

一出鞘就气势逼人。

lncRNA 之后还有新的热点,2012 年有研究证实在人细胞中,环状 RNA 分子(circRNA)

是一种比线性 RNA(mRNA)更普遍的特征,与传统的线性 RNA 不同,circRNA 分子呈封闭环

状结构,不受 RNA 外切酶影响,表达更稳定不易降解,“环”由此名声大噪。从概念上讲,

circRNA 属于 lncRNA 的一个分类,不是一种新的分子类型,其研究特征和套路变化也基本

跟 lncRNA 一致,但因为数量实在庞大,研究者也多数习惯将其自立门户。miRNA、lncRNA、

circRNA 再加上蛋白,医学研究中高频出现的分子类型,不外如是。

回顾“分子点睛”,要点有三:1)变量代入恒量,推陈出新产生变化;2)论证分子有

功能,用一正一反操作分子观察表型实现;3)分子有两类,编码和非编码,非编码关注

miRNA/lncRNA/circRNA。恒量“标”具有特异的属性,越专一越好,而变量分子通用才会引

起广泛研究关注,普适性强更受追捧。蛋白与 miRNA/lncRNA/circRNA,兼容于任何疾、型

组合下的研究。第 4 策领悟的标志,是在文献里看到各种编码和非编码,处乱不惊,平静淡

然。孙猴子纵有七十二变,难逃如来五指山。基因名称千千万,皆属变量一家亲。

You might also like