生物医疗基因 2-3W方案
基因序列比对软件BWA的特点:
基本上只做整型计算
单节点有线性加速比,不支持跨节点并行
对内存带宽有一定要求,内存大小要求不 高,Cache miss率较高
对存储带宽有需求
基因序列拼接计算机测试
整体CPU利用率不高,计算基本为整形 计算,会有很少量的向量运算。
大部分时间只能使用单核进行计算,扩 展性能不好
对内存大小和内存带宽有较高的需求
对网络带宽有一定需求,这部分需求主 要用来请求存储数据。
CPU | EPYC 7551P(32核) 2.00 GHz | 1 |
散热 | SP3散热器 | 1 |
主板 | H11单路 | 1 |
内存 | 16 GB DDR4 RECC | 8 |
OS SSD | 500GB | 1 |
缓存SSD | 2TB | 1 |
存储HDD | 16TB | 1 |
机箱 | ATX静音机箱 | 1 |
电源 | 800W金牌电源 | 1 |
显卡 | 待定 | 1 |
CPU | INTEL E5 2678 V3(18*2) 2.30 GHz | 2 |
散热 | 2011散热器 | 2 |
主板 | X10双路 | 1 |
内存 | 16 GB DDR4 RECC | 8 |
OS SSD | 500GB | 1 |
缓存SSD | 2TB | 1 |
存储HDD | 16TB | 1 |
机箱 | ATX静音机箱 | 1 |
电源 | 800W金牌电源 | 1 |
显卡 | 待定 | 1 |
计算机硬件受行情影响存在一定变化,
有需求的客户以实际情况以及具体配件型号,确认采购时的最新价格为准。
bedops 高性能基因组特征操作
bedtools2 Bedtools是由犹他大学昆兰实验室开发的基因组算法工具集,它堪称是基因组分析工具中的瑞士军刀。
Bedtools可以对基因组广泛使用的数据格式BAM,BED,GFF/GTF,VCF进行处理,进行 取交集、并集、补集、计数以及格式转变等操作。
bowtie Bowtie是一个超级快速的,较为节省内存的短序列拼接至模板基因组的工具。它在拼接35碱基长度的序列时,可以达到每小时2.5亿次的拼接速度。Bowtie并不是一个简单的拼接工具, 它不同于Blast等。它适合的工作是将小序列比对至大基因组上去。它最长能读取1024个碱基的片段。
cytoscape Cytoscape 是一个专注于开源网络可视化和分析的软件。它的核心是提供基础的功能布局和查询网络,并依据基本的数据的结合成可视化网络。
Cytoscape 源自系统生物学,用于将生物分子交互网络与高通量基因表达数据和其他的分子状态信息整合在一起,其最强大的功能还是用于大规模蛋白质-蛋白质相互作用、蛋白质DNA和遗传交互作用的分析
fastareader fastqc 测序数据质控FastQC是一款基于Java的软件,它可以快速地对测序数据进行质量评估
gatk GATK (全称The Genome Analysis Toolkit)是Broad Institute开发的用于二代重测序数据分析的一款软件,是基因分析的工具集。在4.0以后,GATK包含有Picard工具集,所有Picard工具都 能够使用GATK完成。
igv IGV(Integrative Genomics Viewer)是一款本地即可使用的基因组浏览器,不管你用何种系统基本上都可找到对应的安装包,方便且实用。只需要导入参考基因组文件以及bam或者bw 文件即可 mageck 非常实用的数据分析工具,即MAGeCKFlute。
ncbi NCBI 开发有 Genbank 等公共数据库,提供 Pubmed 、 BLAST 、 Entres 、OMIM 、 Taxonomy 、 Structure 等工具,可对国际分子数据库和生物医学文献进行检索和分析,并开发用于 分析基因组数据和传播生物医学信息的软件工具。
picard Picard是一组命令行工具,用于处理高通量排序(HTS)数据和格式,例如SAM / BAM / CRAM和VCF。这些文件格式在Hts-specs存储库中定义。 preseq Preseq是一款通用的评估二代测序文库复杂度的方法 rstudio RStudio是R的集成开发环境(IDE),它包括一个控制台、支持直接执行代码的语法高亮编辑器,以及用于绘图、历史、调试和工作空间管理的工具。
samblaster 去重工具 skewer 过滤软件 star 2.6 比对软件 trimmomatic NGS 原始数据过滤
ucsc UCSC Genome Browser是由University of California Santa Cruz (UCSC) 创立和维护的,该站点包含有人类、小鼠和大鼠等多个物种的基因组草图,并提供一系列的网页分析工具
vep VEP是非常好的变异注释工具,提供了在线和本地化安装两种使用方式,对于需要大批量注释变异的使用者来说本地化安装是必要的。