震撼!华大LUSH基因序列比对加速工具集再次突破计算极限!

瑾研营销策划 时间:2025-05-04 00:50:23

 2017年5月 ,19岁的国家政府围棋第从两个人柯洁九段在和AlphaGo的围棋终极人机大战以0:3完败 ,由此是现代人类顶尖高手与这台机器相互的之后之后四次较量 ,同年10月 《Nature》杂志发表了累计它所有人的这 版本的AlphaGo Zero。有一佳绩向国家政府展示了构建管理系统来于 学之后完成复杂工作任务值得注意的这会  ,而其背后所代表人值得注意运算决策能力 ,是计算机科学的分支市场领域--高能计算(High Performance Computing)  ,为的际应用与此同时仅有 了国家政府综合综合实力的体现  ,更给世人的日常过着会带到来被变动  ,到目前该紧密相关 技术已在航空航天、核试验模拟、天气预报、生命延续科学、高新制造(汽车、电子)等市场领域佳绩了广泛应用。

以生命延续科学市场领域举例  ,日益生命延续遗传密码(基因组)的日益破解  ,人的生老病死有一复杂这事的这会用数字化的能够能够其他方式 详细呈现  ,以期之后完成疾病的精准及分析、诊断和治疗后  ,让世人远离传感染疾病、防控出生缺陷、肿瘤和心脑血管疾病  ,加之质的提升 人均预期寿命  ,并大幅度加之质的提升 当代社会 卫生负担。

二十年来  ,从两个人全基因组测序的成本以“超摩尔定律”的慢的下降  ,而高能计算在测序表现数据及分析方向调整的应用也已发生了翻天覆地的被变动。到目前国家政府主流的基因组测序表现数据及分析工具是Broad Institute开发的免费开源工具集GATK(Genome Analysis Toolkit) ,该项生命延续科学市场领域公认的最佳工作工作任务流程之后完成有从两个人的全基因组(Whole Genome Sequencing  ,WGS)30X表现数据及分析的这会1800分钟。深耕于基因组学20多年的华大基因在基因组高能计算市场领域首获突破进展  ,于日顺利之后完成6分钟之后完成30X WGS全流程的及分析工作任务  ,相较于GATK基本标准计算时长提速300倍。

很据NIH公布的最新资料  ,日益测序紧密相关 技术的整体发展  ,测序成本以超摩尔定律下

https://www.genome.gov/about-genomics/fact-sheets/DNA-Sequencing-Costs-Data

6分钟之后完成30X WGS工作任务是由华大基因自主研发的LUSH工具集之后完成的  ,打破了软件工具工具在2020年1月创造的15分钟极限慢的。另有的黑科技正因采用传统了新的方式的方式底层架构细节采用传统 ,直接提供了理念基础中央后续处理器和图形后续处理器相两者结合采用传统基因表现数据及分析的高能慢的方案 ,在加之质的提升 集群计算资源消耗、加之质的提升 检出慢的的与此同时 ,之后完成了全程自动化、紧密相关 信息化  ,有记录可回溯  ,的这会更佳地用于精准医学的应用场景。

LUSH工具集慢的的新的方式底层架构逻辑

LUSH工具集直接提供一种简单简单“CPU+GPU”的高并行软硬件解决问题出现方案  ,理念基础经典流程中有软件工具模块BWA、SAMTOOLS和GATK  ,能够能够其他方式 GPU的通用运算紧密相关 技术  ,采用传统计算引擎和慢的引擎的新的方式架构细节采用传统  ,之后完成算法优化和并行化后续处理  ,并两者结合华大自主研发的超高通量测序仪 ,之后完成碱基表现数据流的超高速及分析  ,之后之后首获准确的及分析之后之后。

LUSH工具集慢的流程示意图

正为它有 生命延续数字化进程的这会严谨的科学人的精神 ,而其应用场景主要主要为什么体已经精准医疗、健康管理等与现代人类健康它有息息紧密相关 的市场领域  ,但的这会不尽不尽相同于同时高能计算市场领域  ,基因组表现数据及分析对精度有极高的很据要求 。而为的高能和准确并无法的这兼得  ,表现数据范畴 、分布和浮点精度、峰值能和内存总是会产生影响算法的选则  ,它有 涉及到仅有 最优解和似解的算法但的这会大相径庭。LUSH工具集正因采用传统在经典流程算法的理念基础上能够能够其他方式 了其新的方式细节采用传统的底层架构有待降低了中间位置之后之后的读写 ,并能够能够其他方式 CPU之后完成基因及分析工作任务的智能分发 ,能够能够其他方式 GPU数千计算核心之后完成百万工作任务的极速并行后续处理  ,与此同时解决问题出现了经典流程计算密度较高、频繁地存储器访问等解决问题出现  ,几经 测试其基本标准品的准确之后之后与经典流程一致  ,累计99.86%  ,的这其的这会在计算之后之后的准确与极速上得以衡。

更优越的能、更低的成本和更高效的检出是所有人高能计算应用市场领域的研发追求大目标。对慢的组件的继续研发来于 对慢的无止境的追求  ,正如智能手机芯片整体行业的整体发展是日益移动端产品需求的旺盛 ,紧密相关 技术才得以日益地迭代和进步。从基因组学理念基础研究者到临床研究者及应用  ,之后完成测序工具的自主可控的与此同时也的这会之后完成数学其他方式上也自主研发 ,而不为的追求芯片的底层下潜开发。对后者是无止境的追求 ,而有且前者它有 这可控不能够能够之后完成从跟随模仿到有且超越值得注意的这会  ,从核心算法的研发上助力中国精准医疗自主可控的整体发展进程。



版权声明:以上文章中所选用的图片及文字来源于网络以及用户投稿,由于未联系到知识产权人或未发现有关知识产权的登记,如有知识产权人并不愿意我们使用,如果有侵权请立即联系:123456789@qq.com,我们立即下架或删除。

热门文章