利用UGC攻克技术难题 WeGene加速解读基因秘密 | U刻
  • 利用UGC攻克技术难题 WeGene加速解读基因秘密

    栏目:技术分享

    随着基因检测在遗传病检测、新药研发、肿瘤诊断及治疗、生物多样性保护等多领域的应用,其价值也逐渐获得大众认可。作为一个兼具技术潜力和市场前景、产业链完整同时又获得国家支持的产业,基因检测赢得了资本与创业者的青睐。

    国内领先的个人基因组服务公司——WeGene是一家致力于消费级基因数据解读与个性化健康服务的创业公司。在IT基础设施搭建上,WeGene采用UCloud研发的通用计算服务(UGC)不仅攻克了技术难题,而且极大缩短了开发周期,降低了运维成本,使公司能够更加专注于业务本身,提高解读基因的效率。

    个人基因解读开拓者

    基因检测是指通过血液、其他体液或细胞对被测者的DNA分子进行检测,并分析被检测者所含致病基因、疾病易感性基因等情况的一种技术,可以诊断疾病, 预测疾病风险,还可以分析祖源成分,解析运动基因。

    相比人类基因缓慢的进化速度,基因组测序技术的发展在近二十年里突飞猛进,已成为全球大趋势。由于各国扶持政策加码以及大公司大资本布局基因检测,因此2017年被业内认为是整个产业爆发的临界点。

    今年1月,国家发展改革委正式印发《“十三五”生物产业发展规划》,在发展目标中提到,通过生物产业的发展,基因检测能力(含孕前、产前、新生儿)覆盖出生人口50%以上,社会化检测服务受众大幅增加。另外,中投顾问发布的《2017-2021年中国基因检测行业投资分析及前景预测报告》预计,中国基因测序市场增长率超20%,为增长最快国家之一。2017年,我国基因检测行业市场规模将达到133亿元,未来五年(2017-2021)年均复合增长率约为36.86%,2021年中国市场规模将达到421亿元。

    目前,基因检测行业蓄势爆发的状态不仅加速大公司布局,同时也吸引大批创业者加入。WeGene是一家成立于2014年的个人基因组服务供应商,通过高通量基因检测技术,向用户提供祖源分析、运动基因、营养代谢、健康风险等信息,同时构建起基因组数据的开放平台,支持和鼓励第三方基因应用的发展。自2015年底产品发布以来,WeGene已为数万用户提供服务。

    近期,WeGene宣布与全球最大基因组学研发机构——华大基因旗下子公司华大科技达成战略合作,将共同推动人类基因组研究和应用领域的发展,并为客户提供更可靠的数据和更优质的个性化服务。双方在技术研发、产品服务、市场活动等方面的长期深入合作,必将进一步巩固和发展WeGene在个人基因检测领域的开拓者地位。

    微解读平台的技术困扰

    然而,每一位成功者背后都要经历不同的曲折与探索,WeGene也不例外。初期,在WeGene开放给社区开发者自行创建第三方基因解读的“微解读”平台上,开发者们只能通过单个的基因位点去解读性状。但因为许多复杂性状都是由多位点决定的,所以单位点的解读方式缺乏充分的合理性。

    不过,想要在微解读中支持对多个位点组合的情况进行分析依然比较复杂,因为对于不同的基因解读项目,其解读规则、算法均不相同,很难通过用户图形界面去创建。当微解读功能被限制时,开发者们必须通过更为复杂的开放API进行应用开发,WeGene也收到了“开放平台API的使用太复杂、写个基因分析应用还要搞数据库、Web框架怎么用?能不能只写个脚本来分析?”等一系列来自生物信息工程师们的抱怨。

    这种“繁杂的研发模式”严重影响了社区开发者的开发意愿。开发者们必须将基因解读算法改写成服务端程序,进行部署上线,再通过API从 WeGene 的数据库中拉取数据并为用户进行计算,最后将计算结果返回给用户并存入数据库中。

    这种研发模式极大增加了开发周期和运维成本,社区开发者需要考虑服务器容量、存储容量、网络带宽、架构伸缩性等多重问题,很多时候无法专注于业务本身,而WeGene也需要投入大量精力、资源去帮助开发者们逐个解决基础架构和计算成本的问题。

    UCloud助力WeGene平台升级

    通用计算(UCloud General Compute,简称“UGC”)是由国内领先的云计算提供商UCloud研发的分布式大规模并行计算服务,是UCloud基于UGC高效并行计算能力搭建的对象存储(UFile)图片处理服务。UGC能够充分利用UCloud一个区域内的多个可用区的UHost(云主机),提供基于UCloud云平台的高可用性、高安全性和高功能性,同时满足图片处理、机器学习、大数据处理、生物数据分析等领域的计算需求。

    UGC可提供十万核级的并发计算能力,系统自动完成任务调度,并按实际使用量计费。在使用UCloud提供的UGC服务之后,开发者只需要上传已经被抽象为计算函数的各种基因解读算法代码,WeGene 会通过自动化构建过程将这些算法打包到UGC的算法仓库中。通过调用UGC的API,使这些函数能够在UGC平台上被远程执行并实时返回运行结果。这一过程将开发者从底层架构中解放了出来,使他们能够专注于业务的实现。

    作为Serverless服务,UGC能够根据WeGene的请求量,自动化实现服务的伸缩计算和资源的调度分配,进行完全自动化、弹性的扩展。同时,根据UGC“pay-as-you-go”的收费原则,还最大程度节约了WeGene的资源使用成本。

    伴随科技进步,基因工程已进入普通百姓的生活,人们只需简单操作就能得到与自身紧密相关的基因解答。一直以来,UCloud积极与基因工程、航天技术等前沿科技企业开展合作,推动科技研究和应用市场实现快速落地,为人类更深入地了解自己与世界服务。

    13