注册登录才能更好的浏览或提问。
您需要 登录 才可以下载或查看,没有账号?立即注册
×
一、前言 RNA Sturcture 根据最小自由能原理,将Zuker的根据RNA一级序列预测RNA二级结构的算法在软件上实现。预测所用的热力学数据是最近由Turner实验室获得。提供了一些模块以扩展Zuker算法的能力,使之为一个界面友好的RNA折叠程序。 二、基本配置 Windows95,Windows98或WindowsNT。Pentium以上芯片,32兆内存。 三、菜单介绍 熟悉菜单对熟悉使用非常重要。简单介绍如下: New Sequence: 打开序列编辑器,可输入或粘贴入序列,以.seq格式存储。 Open Sequence:打开以.seq格式.gen(genbank)格式或文本格式存贮的序列文件。 RNA Fold Single Strand.此项使用RNA参数打开折叠窗口。 DNA Fold Single Strand.此项使用DNA参数打开折叠窗口。 RNA Fold Intermolecular.此项使用RNA参数折叠两个单体。 DNA Fold Intermolecular.此项使用DNA参数折叠两个单体。 Refold.此项使用不同于先前使用的标准,重新折叠,快速生成次优结构。用于已经折叠并存盘的序列。 Efn2.此项测定生成的RNA二级结构的自由能,储存在ct文件格式中。 Draw. 此项可绘制任何结构,储存在ct文件格式中。 Dot Plot.此项可计算任何折叠的序列的点阵图,用于已经折叠并存盘的序列。 Mix and Match.此项可重组次优结构的区域使生成最低自由能的结构,与化学修饰数据一致。 Oligo Walk.打开Oligo Walk tool帮助确定一个与RNA对象紧密杂交的寡聚体。 四、方法 RNAstructure使用Zuker算法预测RNA二级结构,预测一个结构分两步进行。第一步是使用回归算法生成一个最优结构与一系列次优结构。生成次优结构的个数由用户输入的两个参数(maximum structures and % sort)决定,第三个参数为窗口大小。此参数控制次优结构有多少不同。小的窗口尺寸只允许生成非常类似的结构。 第二步是重新排序最有可能的结构。使用公式重新计算每个结构的最小自由能,输出根据重新计算的最小自由能排序。 两步是连续进行的。 准确度 最近的研究比较了预测与种系确定的结构,When domains of less than 500 bases were used, the algorithm was able to predict 82.5% of 3,426 base pairs from small subunit rRNAs, group I introns, group II introns, and tRNAs. 五、序列编辑器 如何生成与编辑一个RNA或DNA序列 选择File/New菜单,打开序列编辑窗口。需要的话,在Title框内输入Title信息,在Comment框内输入注释信息,最后在 Sequence框内输入序列信息, 由5'端到3'端。注意:使用大写字母输入序列。当使用T或U或同时使用时,RNA折叠算法将假设其为RNA将T认为是U,而DNA折叠模块将认为其为DNA并将U认为是T。 可使用X代表缺口或未知碱基。选择File/Save或File/save as命令以.SEQ格式贮存。 载入序列或引入 Genbank格式文件 选择File/Open Sequence命令载入.SEQ序列文件,也可选择Genbank格式文件(.GEN)或只有序列信息的文本文件。 序列编辑 当输入一个序列时,如果Read while typing选项选择的话,可在输入同时听到输入的序列,按下Read back键,计算机将从光标所在位置向回读序列,按Cancel键终止。如果先选择一部分序列再按Read back键,只读取选定部分。 序列编辑器可将你输入的序列转存为类似Genbank格式的文件。按下Format键,序列将变为每行60个碱基 每10个碱基一个空格。 Fold RNA键将你的文件输入Fold模块,程序将提示你存盘。 折叠 六、预测RNA二级结构 1. 选择file|RNA fold single strand启动模块,单击sequence按键,打开对话框以载入序列,此序列必需以.SEQ为扩展文件名,其它序列文件可在序列编辑器中转为此格式。注意必需为大写字母。 2. 输入文件名后,缺省值将填充在剩下的区域,这些值可改变。选取 Generate Save File选项,在执行算法后生成存盘文件,此存盘文件用于重新折叠与生成点阵图。 3. 在此碱基可被强制为单链或双链或螺旋。 4. 单击开始键,开始预测运算。 5. 需要的话,选择Draw structure,在绘图模块中看预测的二级结构结果。输出的二级结构以最小自由能顺序排列。但由于方法的限制与热力学参数的简化,第一个结构并不一定为实际的RNA结构, 要折叠一个已存贮为.seq文件的序列,可选择菜单选项file|fold RNA single strand,直接进入折叠窗口。或单击工具条中的fold RNA single strand键。 折叠RNA单链 次优结构输出的数量由用户输入的两个参数决定。 Max % Energy Difference:设定输出结构的自由能允许与最小自由能相差的百分数。例如如果结构的最小自由能为-100 kcal/mol,最大能量百分误差为10,将输出所有能量为等于或大于-90 kcal/mol的结构。 Max number of structures: 设定生成的结构数量。最大为1000. 程序输出预测结构直到以上任何一个参数达到要求。 Window size:此参数控制次优结构互相之间有多少不同。小的Windows size只允许生成非常接近的结构,大的Windows size则需要更大的不同。 Advanced Options:除非特殊情况,不推荐使用。 RNA折叠单链模块 强制一个碱基为单链 在二级结构预测时,用户可选择不配对的碱基。方法如下: 1. 在序列文件中,不配对碱基使用小写字母表示。 2. 选择要折叠的序列后,选择Force/Single菜单,进入文本编辑框,输入不配对碱基从5'端的位置序号。单击OK。 查看目前的选择碱基,选择Force|Current.重新设定选择碱基,选择Force|Reset.菜单命令。 强制一个碱基为双链 用户能选择必须配对的碱基,由Force|Double菜单命令完成,操作类似上述。 RNA折叠单链模块 强制一个碱基对 选择菜单命令Force|Pair.完成。 折叠模块 使用限制 尽管作者努力,预测的最低自由能结构可能并不是自然界存在的形式,特别当序列长度为几百时,但至少其可能的结构已限制在一定数量内。 最近的研究证明最低自由能结构,含有大约70%正确的碱基对,但前1000个最佳次优结构中的一个结构会含有大于95%的正确的碱基对。因此建议进行实验以限制预测的结构。例如,化学修饰数据可帮助识别存在与自然界中的结构。Mix&Match模块的功能便是帮助你使用此类数据识别最可能自然结构。 RNAstructure现在也提供其它几种折叠的预测,如单链DNA折叠,RNA或DNA寡聚体的分子间折叠。并提供重新折叠选项refold重新生成已折叠序列的次优结构。 单链DNA折叠 使用John SantaLucia, Jr.及其同事提供的热力学参数,也可折叠DNA序列。 RNA或DNA分子间折叠 可使用RNA或DNA参数确定寡聚体的分子间二级结构,这需要选定两个序列。 分子间折叠使用初始参数以正确决定自由能。但也有一些限制。程序算法不能预测pseudoknots,对于分子间折叠意味着pseudoknots结构如kissing hairpins结构不能被正确预测,因此,使用的分子间折叠的序列应很短。 Refold 重新折叠选项可读取一个由任何折叠模块生成的存盘文件*.sav,并生成一个不同的次优结构。因为程序算法分为两部门,因此这功能非常有帮助。第一步是非常慢的一步,重新折叠便读取第一步的数据快速生成其它结构。 EFN2 能量函数2 此模块计算结构的自由能 1. 单击.CT File按键,打开对话框输入.CT文件的名字,这是一个含有二级结构信息的文件格式,以CT为扩展 名。 2. 对于输出文件.OUT,给出了缺省名称,可单击Out file 按键更改 3. 单击Start 按键 4. 输出两个文本文件扩展名分别为.CT与.OUT。 5. 使用文本文件编辑器打开文件, 6. 结构以自由能大小排列, 绘图模块 1 选择菜单命令File|Draw. 2. 选择一个已存在的.CT文件绘图 如果.CT文件含有超过一个结构,可以选择观看哪个结构。在菜单中选择View|Structure number,选择想要观看的结构。或按住Control键按动上箭头或下箭头也可更改现有显示结构。 放大缩小 选择View|Zoom或按住Control键按动左箭头或右箭头。 打印 选择File|Print. 拷贝到剪贴板 选择Copy菜单place a black and white bitmap on the clipboard将其拷贝到剪贴板,并可复制到其它应用程序。 可在view|counterclockwise菜单选项选择是顺时针还是逆时针绘图。
|