词条 | blat |
释义 | 生物信息学分析工具定义Blat,全称 The BLAST-Like Alignment Tool,可以称为"类BLAST 比对工具",对于DNA序列,BLAT是用来设计寻找95%及以上相似至少40个碱基的序列。对于蛋白序列,BLAT是用来设计寻找80%及以上相似至少20个氨基酸的序列。 通常起源于3.5亿年前的基因家族都可以检测到。通过使用NCBI的BLAST和psi-BLAST,然后使用BLAT对UCSC基因组进行联配可以找到更多的差异序列。实际上,BLAT对灵长类的DNA以及陆地脊椎动物的蛋白效果都很好。 产生背景Blast由 W.James Kent 于 2002 年开发。当时随着人类基因组计划的进展,把大量基因和 ESTs 快速定位到较大的基因组上成为一种迫切需要。blast 相对于这种比对有几个缺陷:速度偏慢、结果难于处理、无法表示出包含 intron 的基因定位。Blat 就是在这种形势下应运而生了。 特点Blat 的主要特点就是:速度快,共线性输出结果简单易读。对于比较小的序列(如 cDNA 等)对大基因组的比对,blat 无疑是首选。Blat 把相关的呈共线性的比对结果连接成为更大的 比对结果,从中也可以很容易的找到 exons 和 introns。因此,在相近物种的基因同源性分析和EST 分析中,blat 得到了广泛的应用。 Blat的比对速度之所以能比Blast快几百倍,是因为此两者之间的比对机制有着本质的差别。Blast是将查询序列索引化,然后线性搜索庞大的目标数据库,期间频繁地访问硬盘数据,时间和空间上的数据相关性较小;Blat则将庞大的目标数据库索引化,然后线性搜索查询序列,这种搜索方式在时间和空间上的数据相关性比较大。Blat将数据库索引一次性读入内存,可以反复地高速调用,无需访问硬盘,占用的系统资源很少。只要索引建立,查询序列的量越大,Blat的优势就越明显。 局限性Blat虽然性能优异,但是它自身也存在着一定的局限性,对于特殊的任务需要注意选择合适的软件。例如Blat用于远亲缘物种间的核酸序列比对时,比对精度就不够高,建议使用专门为此用途开发的Blastz软件;对于少量的蛋白质比对任务(如数条或数十条),在速度和精度上Blastp均优于Blat;比对同时需要获得蛋白质的同源性信息时,则一般使用SAM和PSI-BLAST软件。另外,Blat在重复搜索短小匹配片段的同时,会产生过多的没有生物学意义的序列比对碎片,这说明搜索过程还存在一定的假阳性结果,应进一步分析确认。 运行模式Blast有两种运行模式,一种是单机版(Stand - alone Blat);另一种是交互式的客户端/服务器模式(Client/Server Blat),Blat的源代码、执行程序以及相关文档可以从作者Kent的个人网站上免费下载获得。两种模式的Blat都能够对核酸序列和蛋白质序列以及核酸翻译成的蛋白质序列进行相互比对,单机版可选参数较多,比在线版更加精确, 而客服端/服务器模式则更适合于提供交互式的批量比对服务,特别是本地化后性能非常优越。目前互联网上由美国加州大学圣克鲁斯分校(UCSC)提供了webBlat服务。 程序结构Blat最新版是blast suite.34,suite包中主程序有: 程序名称 程序描述 gfServer 用于将查询序列索引保存在内存中,通过索引快速地获取序列,构建blast是服务器端 gfClient 通过网络查询gfServer,将查询序列与gfServer找到的序列进行详细的比对 blat 是前面所说的单机版blat,将Server和Client结合在一起组成一个独立的运行程序 webBlat 是gfClient的一个Web,用它可构建在线版Blat 其他辅助程序: 程序名称 程序描述 pslSort 对多个Blat结果进行组合和排序 pslReps 采用"near best in genome算法,为特定的查询选择最佳比对 pslPretty 将比对产生的psl格式的结果文件转换成更易阅读的格式 faToTwoBit 将fasta序列文件转换成gfServer能使用的2bit格式的文件 twoBitToFa 将2bit文件转换成fasta序列文件 faToNib 将fasta序列文件转换成Nib文件,一个nib文件只能包含一条序列 nibFrag 将nib文件转换成fasta序列文件下载及安装 下载 可直接搜索BLAT去查找或NCBI. 安装 如果下载的是已经编译好的可执行文件,只需解压缩即可使用,如上面提到的对于 linux 系统的 blatSuite.33.zip,解压命令: unzip blatSuite.33.zip。 如果下载的是源代码,需要进行编译,对于不同的操作系统稍有区别,安装过程如下: 1. 解压缩包:unzip blatSrc33.zip 2. 检查机器的环境变量 MACHTYPE ,如果没有设置需要进行设置,对于不同的机器设置不 同,如:linux 对应的机器类型为 i386,Alpha 对应 alpha,sun 对应 sparc,irix 对应 mipseb。 设置: bash shell: bash shell: MACHTYPE=机器类型 export MACHTYPE tcsh shell: setenv MACHTYPE 机器类型 3. 建立安装目录 mkdir ~/bin mkdir ~/bin/$MACHTYPE 4. 到源文件目录的 lib 目录下,查看是否有对应机器类型的目录,如没有需建立: cd blatSrc/lib mkdir $MACHTYPE 5. 编译,成功后可执行程序放到了~/bin/$MACHTYPE 下面,可移到其他你所要放可执行程序的目录。 cd blatSrc make > make.log 使用Blat 的输入文件必须满足 fasta 格式,运行时非常简单,不需要进行建库就可以直接比对。 Blat 的基本命令: blat database query [-参数] output 电子邮件发送工具Blat 是一个命令行发邮件的小工具,仅支持简单的SMTP协议,需要SMTP服务器的支持。据说现在新申请的邮箱已经不支持SMTP服务了,是为了抑制垃圾邮件而采取的措施。但是,Blat也是一个非常方便的小工具,基本上可以满足一般人的需求。 |
随便看 |
百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。