一文学会RNA二级结构工具网站使用方法

Hello,小伙伴们大家好~圈圈圆圆圈圈,天天年年天天的你又来到了火火的数据库专栏~最近火火看了一篇文章,涉及到了一个关于circRNA的truncation实验,让人眼前一亮,才突然反应过来,我大E了啊,还没跟大家聊过这个预测RNA二级结构非常实用的在线工具网站—RNA fold web server。所以这次我们将从一篇案例文献出发,继续深挖circRNA,看看在研究circRNA直接作用机制时如何更上一层楼,给文章增加一点逼格~网站的网址为http://rna.tbi.univie.ac.at/cgi-bin/RNAWebSuite/RNAfold.cgi,接下来让我们一起进入正菜环节吧~
传送门:
〇、期刊信息
一、文献解读
在正式介绍开始之前,我们先来康康circRNA的二级结构到底是怎么回事,为什么要说到它,又怎么在实验中巧妙的设计进去。案例文献于2020年8月发表在Nature Communications上,影响因子为12.121分,揭示了在结肠炎中,circKcnt2通过调控ILC3的激活来介导炎症反应,是一篇circRNA—蛋白—DNA三元交互模式的文章。
大家在后台回复“火 文献”即可领取哟~
为了节省篇幅,我们直接跳到相关Figure加以说明。已有文献报道RNA的二级结构对于RNA发挥生物学效应有着重要的影响,作者因此探究circRNA的二级结构在circRNA—DNA交互以及circRNA—蛋白交互过程中的作用。作者使用RNA fold web server来预测circRNA上的茎环结构(FigS4G),并设计了针对每一个茎环结构的突变体,发现HR4对于circRNA—DNA的交互至关重要(Fig3G)。同样地,在探究circRNA与蛋白结合位点的时候,发现HR5区域最重要(Fig4H)。
我单独将上述三个图摘出来给大家看。左上角的模式图即作者预测的circRNA的二级结构,其上HR1-5即为circRNA的发卡环。作者将circRNA上预测的五段可能发挥重要作用的序列单独截断出来进行实验验证,进一步明确circRNA与DNA以及蛋白的结合区域。酸菜老师和老谈老师在直播课程中曾经给大家介绍过研究分子交互的几个非常重要的步骤,简单点说,包括有结合,共定位,有区域,有效应。这篇文章这一步骚操作是不是就把“有区域”完成的非常好了?其实文章下一个figure就是突变掉这段序列然后检测下游效应变化了,对应的是“有效应”,只是限于篇幅并未给大家展示。大部分文章在研究circRNA与其他分子交互的时候,做到RIP或者pull down说明他们直接可以相互结合,优秀一点的会做一个双向互拉,再优秀一点的就如这篇文章一样,具体到独特的二级结构了。所以学会这波操作可以妥妥让你文章再往上升一点点逼格。
二、RNA的二级结构
吹了那么多牛皮,大家还是得先冷静一哈,回到最初的起点,先搞明白一件重要的事情,什么是RNA的二级结构?在此之前首先要弄清楚什么是RNA的一级结构。高中生物书上就写的明明白白,RNA是一条单链结构,以不同的顺序排列着A, U, G, C四种碱基,这么一种线性结构就是RNA分子的一级结构。那这就存在一个问题呀,DNA大家都知道是两条单链通过互补配对形成的双链结构,RNA虽然是一条单链,但是其上排布的A, U, G, C完全可以在空间上同样互补配对呀。于是RNA存在着许多由互补碱基对构成的茎环结构,并可以通过这些结构进行自我折叠,所构成的结构即为RNA的二级结构。RNA的二级结构包括以下几个基本构件:单链结构、茎、发卡环、凸环、内环以及多分枝环。
接下来一句话总结一下刚说的那些结构都是些啥:
单链结构又称自由单链,是RNA分子上平平无奇的一段单链状结构,因为莫得别的碱基跟它互部配对。
,即常说的茎环结构中茎的部分,是由两段不相交的等长区域中的碱基进行互补配对形成的,就像植物的根茎一样笔直,常成串出现。
发卡环,即茎环结构中环的部分,是两段构成茎区的碱基之间多出来的碱基形成的环状结构,孤零零地膨出成环,形似发卡,因此称为发卡环。
内环是某段茎区的两条单链上都存在着未能形成碱基对的碱基,由于碱基间作用力而形成向外突出的圆环状结构。其中,如果两条链上的未配对碱基数相等,则内环对称。
凸环是某段茎区的一条单链上存在着未能形成碱基对的碱基而形成的。所以凸环与内环的区别在于由一条链形成还是两条链。
多分支环也称为多重环,可以看作是多个茎区和环的组合。简单粗暴的说就是上述几个结构糅杂在一起形成的一段区域,所以是RNA二级结构中更为常见的一种结构。
那什么是RNA的三级结构呢?
就是在二级结构的基础上进一步进行空间上的折叠。大家还记得tRNA不,二级结构三叶草,三级结构便折叠成了倒“L”型,是一个帮助大家理解RNA分子二、三级结构的一个活色生香的例子。如果大家理解的还有问题可以对着tRNA的模式图仔细瞅瞅~
那什么是RNA的四级结构呢?
今天不说了哈哈哈,感兴趣的小伙伴可以自行查找资料~
案例文献实际上就是找出circRNA上的发卡环结构,并明确到底是哪一个发卡在发挥作用。很多小伙伴可能会逐渐迷惑,因为circRNA本身就是一个环了,为什么还能在空间上歪七扭八,形成互部配对?这个时候大家就不要被模式图上circRNA那么标准的圆形给迷惑啦,把它想象成仅仅首尾相连的一条RNA分子,就可以想象为什么它同样存在发卡环样的二级结构了。
三、RNA fold web server使用教程
说了这么多还是这一part大家最感兴趣哈哈,接下来说说怎么通过RNA fold web server在线工具预测RNA分子的二级结构。输入网址http://rna.tbi.univie.ac.at/cgi-bin/RNAWebSuite/RNAfold.cgi,进入网站主页面,可以发现整个界面非常简洁明了,实际上需要大家操作的也就是两件事情:
1. 在红框中输入RNA的序列;

2. 点击“Proceed”。
由于在下才疏学浅,实在是在circbase中找不到案例文献中的circRNA,这里便以示例分子进行举例说明。输入RNA分子的序列,点击“Proceed”,其他保留默认选项即可。这里输入的RNA分子序列并不局限于circRNA,只要是一个RNA分子,你能知道它的序列就可以输入进去预测。至于怎么找circRNA序列这种问题我就不过多解释了,主要怕得心梗,毕竟前面介绍的数据库几乎个个都有这个功能,欢迎大家关注一下我的专栏推文。
该预测网站由奥地利维也纳大学开发的,在结果出来之前还得麻烦大家耐心等待一会~
页面刷新后,预测结果以两种形式为大家展示,一个是文字描述,一个是可视化图形展示。首先来看看文字信息。这里大家重点了解两件事情:
1. RNA fold web server预测二级结构的原理。该网站采用了两种算法来预测二级结构,包括最小自由能算法以及比较序列分析。重点介绍一下最小自由能算法。自由能,即破坏RNA分子二级结构中的氢键所需要的能量值。RNA 分子结构之所以能够稳定,其原因就是碱基配对造成了能量的降低。因此,最小自由能算法认为,自由能趋向最小的时候为 RNA 真实的二级结构,结构也最稳定。以上就是大家高中化学学过的东西。该网站通过计算最小自由能来合理推测可以进行碱基互补配对的区域。

2. RNA二级结构表示方法。预测RNA二级结构的网站或者软件有很多,各自采取了不同的形式来表示二级结构。RNA fold web server采用的是点括号表示法,用点和成对的括号来表示 RNA 的二级结构信息。其中,RNA 序列中未产生碱基互补配对的自由碱基用“.”表示,而形成互补碱基对的两个碱基分别用一对“(”和“)”表示。该表示法是最常见的文本类 RNA 二级结构表示方法。
页面下拉可以看到图形化展示的区域,包括茎环结构的示意图及反应最小自由能的山峰图。看到这个茎环结构,各位小伙伴是不是直呼眼熟?没错这里的figure可以直接下载放到文章中去,通过修改下方的参数可以选择是否展示图形中的碱基信息以及更改颜色。至于这个图反映了什么信息和内容,前文已经进行了很多讲解,此处不再赘述。
好了,RNA fold web server的介绍就到这里啦~各位是不是有种戛然而止的感觉呢哈哈。其实工具就真的只是一种工具,发挥的作用很有限,像RNA fold web server就只是预测二级结构,但是怎么去用好这个工具就得看使用的人了,是否有非凡的idea,是否能挖掘出一个简单工具的无限潜力。目前文献中关于使用二级结构进行直接交互的操作还不是特别多,大家懂我意思了吧?
我是火火,解螺旋先锋班学员,晨星计划学员,挑圈联靠专栏作者。转眼间新的一年马上又要过去了,我和解螺旋也正式认识一周年啦!这一年里我学习了很多,也成长了许多,收获了众多温暖的小伙伴们,希望新的一年也能和我的family members一起吃吃喝喝,快快落落!
END

撰文丨火   火
排版丨四金兄
值班 | 火   火

主编丨小雪球
欢迎大家关注解螺旋生信频道-挑圈联靠公号~
继续阅读
阅读原文