作者:XUWEI 来源:生物软件网
翻译者:XUWEI(bioxuwei@163.net)
下面的指南手册对PAUP4.O 的基本用法提供了一个非常简洁的概述。这个指南将通过分析例子数据文件中的一个例子来一步一步教会你. 这个例子可以在你提供给你的盘里,也可以在https://paup.csit.fsu.edu/data/primate-mtDNA-interleaved.nex 上下载. 这个指南为那些以前没有用过PAUP 经历的人设计,如果你已经很熟悉PAUP,那么你可以跳过这个指南,我们假定用户已对系统发育术语和特别的计算机操作系统很熟悉.如对DOS 和Unix用户而言,我们已在你的路径上设定了PAUP二进位,只要键入命令”paup”便会运行PAUP程序. 只要你用PAUP4.0 越来越多,你就会发现对下面操作的描述又很多替代方案.显而易见的原因是:我们不可能在这个指南中描述所有的可能操作.但是,只要你的时间允许,我们还是鼓励你去开发其他的菜单和命令行选项. 目前有PAUP4.0 的好几个版本,这些版本分别适合Macintosh,Windows 和Portable的这三个界面,Macintosh 界面允许你执行菜单命令和命令行,而在Windows 和Portable界面(DOS 和Unix)界面几乎完全由命令行驱动,很多菜单功能在WINDOWS 界面有,而这些大部分包括归档和编辑操作,这个指南将用菜单选项和命令行语法来展示在不同环境下PAUP 可能的运行情况. 为了排版和印刷上的方便,这个指南全篇采用了以下几点.第一,菜单,菜单选项和对话框或屏幕任何位置上的选项均用黑体San serif 字体,如,文本File > Open 意思是选择主菜单”File”再选择”File”菜单下的”Open”选项.第二,用户想在命令提示行或在对话框中键入的文本用无格式的固定了宽度的字体表示,如,指令”输入: weights 2:1stpos "表示只要出现” 输入:",都应当确切的键入它出现的.最后,界面特别的说明已分开列出并表述,但是所 有其他的文本适合所有PAUP 界面.
开始PAUP 1 检查数据文件 Mac 和 Windows. 双击PAUP 应用图标. 当第一次启动时,PAUP 将自动登陆到打开对话框 . 选择”Sample NEXUS dat”文件夹中的 ”primate-mtDNA-interleaved.nex”的文件. . 通过单击Edit 来改变原来的Execute 起始模式为Edit(编辑)模式,这样来打开PAUP*的编辑器.
Portable .改变路径到Sample-NEXUS-files ,它包含在PAUP 文档中选择你最喜欢的文档编辑器(如 vi 或emacs)来打开文件名为primate-mtDNA-interleaved.nex 的例子文件. .在这个编辑器里,通过例子文件来滚动.要注意这个文件被单词”begin”和”end”划分为多个文本区, "begin"后面的单词定义区型.在这个例子里,有以下几个区型:分类,元素,假设,和paup.但是,有很多其他的NEXUS 区型. 实际上,一个NEXUS 格式的优点是应用程序对那些他们不能识别的区能够简单的跳过去.可以看Maddison 等(1997)的文章来了解关于NEXUS 格式更详细的讨论.
2 执行数据文件 关闭例子文件并按以下操作: Mac 和Windows . 选择 File > Execute "primate-mtDNA-interleaved.nex" Portable . 在系统提示行输入paup. PAUP*将显示该程序的一般信息并在paup提示行显示光标. . 输入: execute primate-mtDNA-interleaved.nex; 在执行这个例子文件后,PAUP 将显示关于这个数据的评论和一般信息.如,显示关于这个数据矩阵的维数和数据类型等等的部分,接着是显示这个数据设置的来源. 到这里,还没有进行数据分析;PAUP 只是简单的处理了这个数据,并等待执行下一步的命令. 记录日志结果 通常,你想要在硬盘上记录PAUP 分析的结果,这样使得你有你分析的结果的记录.
1 开始日志记录 Mac 和 Windows .选择File > Log Output to Disk... Mac .在Log subsequent output to: 下输入practice.log ,单击 Start Saving Windows . 在Filename: 下输入practice.log 单击Start Portable . 输入:log start file=practice.log; 2 停止记录 在PAUP 决议的任何时候都可以开始和停止日志记录. 如果要停止日志记录,按以下操作: Mac . 选择File > Log Output to Disk... 并单击Stop Saving Windows . 选择File > Log Output to Disk... Portable . 输入: log stop; 总结数据 现在这个数据矩阵正被分析,你可以获得这个数据设置的基本总结数据.一开始,你可以显示关 于这个例子数据设置元素的信息. Mac . 选择Data > Show Character Status... . 不要改变默认设置并单击OK. Portable 和Windows . 输入: cstatus; PAUP* 将显示关于当前元素状态的总结 (如类型,权重,等等). 注意,如果打开记录,显示在屏幕上的总结信息也会被保存在日志文件中.你也可以选择去显示分类 (tstatus)、全部数据矩阵( showmatrix )和更多的总结,所有的这些命令都在DATA(数据)菜单下面. 管理数据 PAUP提供了几个方法对包括在数据矩阵中的分类和元素的子集进行限制分析,如这个例子数据设置包括主要的线粒体DNA编码和非编码蛋白区域.假设我们只想分析这个数据中的编码区域.用charsets命令可以识别该例子文件中这些区域的元素. 你可以通过一个单个的名称来参考一组元素,这样使得元素设置程序变得简单.除了编码区域,你可以通过排除数据集中所有的元素来开始.
1 排除元素 Mac • 选择Data > Include-Exclude Characters... • 在 Included characters:下面点击All并点击 >> Exclude >> • 在 Excluded characters: 下面选择 CharSets : coding并点击<<Include << • 点击 OK
Portable 和 windows • 输入: include coding/only; 2 删除分类 你也可以限制你所有的分析为五个人科动物种和三个其他用于外围集团分类的灵长类种.这五个人科动物(Homo sapiens, Pan, Gorilla, Pongo, 和Hylobates)可以用例子文件中的taxset命令来确定,用相同的方法,charset命令使得你可以通过单个名称来参考一组元素,taxset使得你通过单个名称来参考一组分类. Mac • 选择Data > Delete-Restore Taxa... •在Undeleted taxa:下点击All并点击Delete •在Deleted taxa:下面选择Taxsets并然后选择hominoids •拉下应用命令键( )选择 Lemur catta, Macaca fuscata和 Saimiri sciureus
• 点击 Restore 和OK Portable和 Windows •输入: undelete hominoids lemur_catta macaca_fuscata saimiri_sciureus/only; 要注意在命令行中分类名中的空格一定要用”_”(字符下划线)或包含在单引号中,也有PUAP不注意分类标签中的元素语法格.最后,要意识到当各自用exclude和delete命令(或菜单相等的命令)来排除或删除分类时,你实际上没有修改数据文件.也就是,下一次执行这个例子数据时,所有的元素和分类设置仍将在内. 定义假设 在你开始分析之前,这里有一个很好的机会了解你的数据矩阵中元素的有关信息,这些信息可能提示这些元素可能有不同的加权值.如,通常发生在密码子第一位的取代频率要低于第三位. 这个简单的解释是密码子第一位的取代通常导致一个氨基酸的取代,但是,第三位的改变却不会改变氨基酸的转录.你要把这些信息包含在下面的分析中,可以通过采用在密码子第一位的高权重的取代来解决.用charset命令已经确定例子文件中的密码子位点.
1 增加元素权重 Mac • 选择 Data > Set Character Weights... . • 在 CharSets菜单下选择 1stpos . • 在 Assign weight 框中输入 2 并单击 Apply 然后单击Done Portable 和 Windows • 输入: weights 2:1stpos; 2设置元素类型 PAUP默认所有转换耗费都相同,在这部分,你将调用一个元素类型,它被分配了比转录较高的权重的颠换.更详细的说,我们将假定颠换(从嘌呤(A或G)到嘧啶的改变(C或T))的耗费是转录的两倍,一个在这个分析包含这个假设的方法是:建立转录/颠换 “步骤矩阵”.这样的步骤矩阵已在例子文件中定义.为了应用转换耗费到当前考虑的所有元素中去, 可以按以下操作: Mac • 选择Data > Set Character Types... . • 在Characters:下面点击All按钮 . • 在菜单 User-Defined 下 2 1 并点击Done Portable 和 Windows • 输入: saveassum file=tutorial.dat; 4 重新打开假设 重启PAUP并执行开始操作的文件primate-mtDNA-interleaved.nex,按以下步骤重新打开先前的假设设定 Mac 和 Windows • 选择 File : Open... 并选择 tutorial.dat • 改变 Initial mode(起始模式):由Edit到Execute 并点击 Execute Portable • 输入: execute tutorial.dat; 你现在将返回到你所开始的地方.为了保证假设是有效的,从Data菜单或在命令行用cstatus选择Show Character Status....你将得到下面的输出 查找树 1 定义最佳标准 PAUP* 4.0 具有用不同的最佳标准来分析数据的优点;这些标准有简约性法,可能性法和距离依靠法.在这个手册的好几章节和大量已发表的文献中专注于比较这些最佳标准的性能.在这里我们只是仅仅说每个标准都有各自的长处和限制,而不花费时间讨论目前标准各自相关的优点. 一开始,我们默认采用最大简约性法标准来查找最优树.在这个指南的后面,你可以用其他标准查找树.
Mac • 选择 Analysis > Parsimony (注: 简约性法是默认设置并可能已被选定.)
Portable 和 Windows • 输入: set criterion=parsimony;
2 定义查找策略
PAUP* 提供了两个基本类方法来查找最优树;它们是精确的和启发式的.精确的方法保证找到最优树,但是却可能需要大量的计算时间来分析大批量的数据设置.启发式方法不一定找到最优树,但是一般需要较少的计算时间.即使当前的数据相对少,你开始将采用启发式查找.
Mac • 选择 Analysis > Heuristic Search... • 在项目菜单下选择 Stepwise-Addition Options
|