中山大学杨建华/屈良鹄/李斌团队开发新方法发现新结构型RNA及其调控功能
人类基因组是由约30 亿个字符组成的遗传“密码本”,决定细胞和个体发育的命运。该“密码本”的98%字符都是具有“暗物质”之称的非编码序列,而且约80%能够转录成为 “暗物质”核糖核酸(RNA)1。这些“暗物质”RNA大多数都是不具有帽子结构的RNA(noncapped RNA,napRNA),且普遍作为非编码RNA(ncRNA)在基因表达调控和疾病发生发展中扮演了重要角色。然而,目前的研究主要集中于具有帽子结构的RNA(capped RNA,capRNA)2和短的napRNA3,人们对长的napRNA(序列长度≥100核苷酸)的种类组成、结构、生物生成及功能机制都知之甚少。
该研究开发了NAP-seq测序技术和napSeeker算法,在单碱基精度鉴定具有各种末端修饰的napRNA的全长序列,发现多种新类型napRNA和成百上千的新结构型ncRNA,解析它们在不同的细胞刺激和骨骼肌分化阶段的动态变化图谱,揭示了napRNA的表达、结构特征、生物生成特性及其在细胞活动中的功能机制,为在各种生物中发现新的结构型napRNA及其功能机制研究提供了新方法和新思路。
由于napRNA一般不具有polyA尾,因此传统的利用PolyA富集的RNA-seq方法无法鉴定napRNA。即使是测定total RNA的RNA-seq方法由于通过随机六聚体引物对片段化的RNA进行逆转录(RT)产生cDNA,也导致无法鉴定全长的napRNA序列和不能用于分类napRNA及不能用于确定其二级结构等等。
虽然通过小RNA测序(sRNA-seq)技术测定短napRNA发现了一些功能性小非编码RNA(如:miRNA,piRNA),然而几乎所有涉及sRNA-seq的研究都集中在小于50 核苷酸的napRNA,而不是各种长度和不同末端修饰的所有napRNA,尤其是长链(≥100 核苷酸)和结构复杂的napRNA。
针对这些问题,研究团队开发一种捕获长链napRNA的全长序列的新测序方法—NAP-seq,具体的简化步骤包括:对RNA样品进行除杂、T4 PNK修复RNA末端、长度筛选、自主设计的3’端接头和5’端接头连接、非目标RNA的去除、巢式RT-PCR与预扩增、可选地片段化、在两种不同的测序平台(Oxford Nanopore三代单分子测序平台和Illumina二代测序平台)测序和开发新算法鉴定napRNA等步骤(图1)。
图1. NAP-seq的技术流程
研究团队将NAP-seq技术应用于多种人细胞系、细胞应激和小鼠骨骼肌分化模型,在人类和小鼠中发现多种新类结构型napRNA,包括稳定表达的线性内含子napRNA(sliRNA)、snoRNA-内含子杂合napRNA(snotron)、嵌在miRNA间隔区的napRNA(misRNA),以及数千个新结构型napRNA(图2),并解析了这些napRNA可能的生物生成过程(biogenesis)。
此外,研究团队进一步联合了NAP-seq和SHAPE-MaP等技术发展了NAP-SHAPE-MaP方法解析了这些napRNA在体内的二级结构。而且,通过RNA半衰期分析和表达分析发现,napRNA在细胞内稳定表达并在不同的细胞刺激和分化阶段发生动态变化,这提示napRNA可能具有调控功能。
有趣的是,研究团队还发现基因组的各种重复元件(repetitive element)可以转录和加工成多类新结构型ncRNA(repRNA),包括box C/D,box H/ACA和聚合酶III转录的ncRNA4。重要的是,NAP-seq鉴定到目前为止最长的新结构型box C/D和H/ACA基因,展现它能发掘各种长度napRNA的强大潜能。
研究团队通过功能获得、功能缺失和碱基突变等实验发现,小鼠骨骼肌分化过程中下调表达的一个新结构型napRNA(mmu-novel-CD-6)具有抑制骨骼肌细胞分化的潜在调控功能。
通过进化保守性分析和NAP-SHAPE-MaP结构测序分析,研究团队发现一个新的结构型napRNA—DINAP,它是一个包含box C/D和box H/ACA结构的杂合napRNA分子。DINAP从人到非洲爪蟾进化高度保守,提示DINAP可能行驶重要的生物学功能。为了解析DINAP的生物学功能,研究团队利用自主开发的starBase5平台进行互作蛋白组分析并完成多个体内实验,发现和证实DINAP与假尿嘧啶合成酶DKC1相互作用。通过进一步利用放线菌酮追踪实验,发现DINAP与DKC1蛋白互作会影响DKC1蛋白的稳定性。而且细胞表型实验结果表明,DINAP通过维持DKC1蛋白的稳定性来促进细胞增殖(图2)。
综上所述,这项研究工作通过开发了多种新实验策略和计算机算法以及结合二代测序(Illumina)和三代单分子测序(Nanopore)平台实现了napRNA的全长测序(图2),联合我们前期在Nature Biotechnology期刊发表的RIP-PEN-seq/PEN-seq技术,我们可以测定任何长度的napRNA和ncRNA。这些方法为探究现代“RNA世界”中的重要“新大陆(novel napRNA)”开辟了新途径。
图2. napRNA的系统发掘及功能机制研究
2024年3月18日,该研究“NAP-seq reveals multiple classes of structured noncoding RNAs with regulatory functions”为题在Nature Communications期刊上发表。我院的杨建华教授、屈良鹄教授和李斌副教授为本文通讯作者,中山大学生命科学学院刘树榕特聘副研究员和黄钧鸿博士研究生为本文的共同第一作者,该工作得到实验室其他成员的大力支持。中山大学生命科学学院为第一作者单位。本工作受到科技部重点研发项目、国家自然科学基金项目资助。
论文的链接地址:
https://www.nature.com/articles/s41467-024-46596-y
原文链接:
https://lifesciences.sysu.edu.cn/researchprogress/6132
参考文献
1. Djebali, S. et al. Landscape of transcription in human cells. Nature 489, 101-108 (2012).
2. Proudfoot, N.J., Furger, A. & Dye, M.J. Integrating mRNA processing with transcription. Cell 108, 501-512 (2002).
3. Li, B. et al. RIP-PEN-seq identifies a class of kink-turn RNAs as splicing regulators. Nature Biotechnology 42, 119-131 (2024).
4. Li, B., Qu, L.H. & Yang, J.H. RNA-Guided RNA Modifications: Biogenesis, Functions, and Applications. Accounts Chem Res 56, 3198-3210 (2023).
5. Li, J.H., Liu, S., Zhou, H., Qu, L.H. & Yang, J.H. starBase v2.0: decoding miRNA-ceRNA, miRNA-ncRNA and protein-RNA interaction networks from large-scale CLIP-Seq data. Nucleic Acids Res 42, D92-97 (2014).
微信扫码关注该文公众号作者