UCloud AMD快杰云主机助力蓝威加速HPC场景落地 | U刻
技术分享/

UCloud AMD快杰云主机助力蓝威加速HPC场景落地

  • UCloud AMD快杰云主机助力蓝威加速HPC场景落地

    过去,高性能计算(HPC)因其高昂的成本和复杂的编程,长期只能被应用于军事、科研等高精尖领域。随着工业制造、生物医药、基因检测、影视渲染等行业的数字化转型,各领域对于高性能芯片、存储和内网的需求不断攀升。
    ​在云服务的推动下,高性能计算逐渐向大众化的趋势演进,用户可以按需构建自己的“云上超算中心”,降低一次性大规模资金的投入,提高灵活可扩展的能力。

    传统HPC部署面临的痛点

    传统的数据中心模式下,用户部署一套HPC服务器集群通常面临着诸多痛点,除了前期采购的设备成本和后期运行的维护成本高外,还包括:1、一次性购买、底层配置锁死、难以动态扩容升级导致资源灵活性差问题;2、短则数天、长则数周且受供应商采购周期限制的资源获取效率低问题;3、在数据安全和可靠性上,软硬件故障导致关键数据丢失或损坏也是不可忽视的问题;4、HPC一般不提供高性价比的持久化存储,拉取到本地又会面临大量文件的存储和管理,因此不同用户之间数据共享还严重依赖于传统的U盘、硬盘、网盘、共享文件夹等低效方式。

    另外,由于用户获取HPC高性能计算通常采用远程操作的“黑盒子”式工作流程,不仅访问效果差、数据传输速度慢,而且“点对点”的作业模式严重依赖于本地进行前后处理,难以开展横向协同。总而言之,成本投入大、交付效率低和灵活扩展性差是传统HPC部署下用户所面临的“三座大山”。

    蓝威HPC遇到的问题

    蓝威技术是一家自主研发CAE的软件公司,将CAE和HPC引入云端,提供行业CAE云计算软件和云超算服务。旗下产品有蓝威EASYCAE仿真云计算平台、蓝威BVWIND风场规划智能决策平台、CRAFE电子可靠性分析云平台。

    蓝威的HPC业务主要部署在物理服务器上,其节点分布了贵安、山西、苏州和成都等不同地域。随着其业务规模的不断增长,底层的HPC基础设施资源也需要不断调整升级。业务的不断扩容,需要一次性投入的服务器成本在不断增高,对于创业型公司的蓝威是一笔非常大的开销。
    UCloud灵活的弹性合作模式,吸引蓝威将其业务扩展到UCloud公有云平台,同时也做了严格的性能对比,可以满足蓝威的业务场景需要。

    AMD云主机助力蓝威打造云上超算中心

    在UCloud公有云平台支持按需付费、弹性扩缩容机制下,最大限度帮助蓝威降低硬件投入、提高资源的交付效率;不同地域数据中心之间内网互通也能解决蓝威之前面临的地域割裂问题;还有云存储的数据自动冗余、手动/自动备份、回滚复原、权限访问等多种手段确保蓝威对自己的仿真数据拥有100%的所有权和管理权。
    至于蓝威最关心的性能问题,UCloud又是如何给用户“吃下定心丸”,打消其顾虑的呢?
    蓝威的应用场景主要面向工程仿真领域,对CPU的密集计算处理能力要求极高。而UCloud AMD快杰云主机采用了AMD第二代EPYC处理器,主频高达2.9GHZ;另外,AMD云主机采用的UCloud网络2.0增强技术使得内网的最大包量可达1000万pps,同步配置的RSSD云盘带来的存储性能高达120万IOPS。相比蓝威之前物理部署模式,HPC性能提升了30%,而成本却降低了30%。

    为什么AMD云主机更适合HPC场景

    AMD快杰云主机是UCloud专为高性能场景打造的旗舰机型,可为基于CPU的HPC提供坚实的基础。高达2.9GHZ主频的CPU可以根据用户的业务所需进行多种规格的灵活组合,轻松实现高性能集群的管理和调度。
    对于HPC远程操作的数据传输问题,UCloud外网大带宽可支持GB级计算文件的分钟级高速传输,内网最大25G 带宽助力多节点大规模并行,且不受地域限制、随时随地连接HPC资源。还有UCloud自研的超高速RSSD云盘、海量对象存储和高性能文件存储等多种选择能帮助解决HPC持久化存储和数据共享难题。
    针对HPC场景,AMD云主机的优势不止于此:

    • 快速部署、弹性扩展

    用户数秒内即可启动基于AMD云主机搭建的HPC集群,还可以直接向HPC可视化平台提交作业的模式(由合作伙伴运营),AMD云主机多种配置可供选择,扩容时只需在线更改主机配置,而无需重新部署。

    • 数据存储更安全

    海量文件存储多副本冗余,支持数据方舟产品全自动备份,在不影响磁盘IO的前提下,还原数据可精确到秒,从而最大限度确保数据不丢失、不损坏,权限设置让用户对自己的仿真数据拥有100%的所有权和管理权。

    • 按需付费、降低成本

    搭载了最新款AMD芯片的高性能AMD快杰云主机折算下来平均每核小时费用最低不到0.1元 ,10TB容量的持久性对象存储,每月费用最低至300元。用户依据业务需求即时开通所需资源,有效减少一次性高成本的硬件投入,还能避免资源闲置的浪费。

    总结

    未来,UCloud将继续与蓝威及HPC领域其他合作伙伴,携手构建高性能、高可用、多集群HPC云服务,利用UCloud AMD快杰云主机的超高性价比和云平台自身的丰富运营经验,将HPC的性能优势充分释放给深度学习、在线直播、影视渲染、工业仿真、基因检测等更多新兴领域,致力于为提升计算效率、提高资源利用率和降低成本提供更多支持。