You are on page 1of 14

怀曦智能科技 HPC 混合云

公司、技术及案例

怀曦智能科技(上海)有限公司
中国(上海)
自由贸易试验区祖冲之路 1077 号 2 幢 1245 室
目录
一、 公司简介 ................................................................................................................................................................... 1
二、 产品介绍 ................................................................................................................................................................... 2
2.1 怀曦智能科技下一代混合云计算门户系统(HCP-NX) ................................................................................... 2
2.2 HPC 智能自动提交引擎 ........................................................................................................................................ 4
2.3 HPC 智能监控系统 ................................................................................................................................................ 5
三、 当前客户成功案例分析 ........................................................................................................................................... 8
3.1 SAIC Volkvagans 上汽大众 .................................................................................................................................... 8
3.2. WM-Motor/威马汽车科技集团 ............................................................................................................................. 9
3.3. FAW-VW/一汽大众 ............................................................................................................................................... 10
一、公司简介

怀曦智能科技(上海)有限公司,是一家初创新锐高科技企业,2016 年 6 月成立,12 月入驻张江高科浦东软


件园国家级孵化器。由业界资深高性能计算、CAE 仿真云、分布式计算、工程数据管理及大数据分析等领域知名专
家组成,聚焦于高性能混合云计算领域,致力于让客户能以经济、高效、灵活、智能的方式运用 HPC 技术进行产
品创新、运营创新及模式创新。

公司创立以来,客户覆盖汽车、航天航空、电子、教育科研、生物科技等行业,业务覆盖私有云高性能计
算、公有云及混合云高性能计算;解决方案包括高性能计算私有云服务及相关软件、混合云服务及相关软件。公
司秉承服务创新、技术创新、模式创新的理念,竭力为制造业客户提供新一代企业高性能计算架构,在优质服
务、创新模式和创新产品等方面获得了新老客户的高度认可。

在汽车行业,公司创立以来的客户主要有蔚来汽车、华人运通、上海思致汽车、上海大众、一汽大众、上海
通用安吉星、国家新能源监测中心、威马汽车、宝能汽车、观致汽车、美嘉帕拉斯特汽车零部件、上海启琼汽车
等;在教育行业,主要有北京理工大学、南京信息工程大学、南京大学、中山大学等;在生物科技行业,主要客
户有晶能生物、中科普瑞、金域医学等;在国防领域,有中科电子、航天科工四院等客户。

公司积极开展和公有云 IaaS 厂家的合作,和 AWS、阿里云等开展了深入的合作,是 AWS Partner Network 中


HPC 技术合作伙伴;公司同时积极开展和硬件厂家的合作,和戴尔、曙光、浪潮、新华三、清华同方等都保持良好
的合作关系,在整体解决方案、硬件租赁等方面开展合作;同时,公司官方开展和各大国家超算中心,如无锡超
算、上海超算、天津超算、济南超算等的合作,在超算云服务、混合云方面开展合作;公司也积极开展了 CAE 软
件 ISV、国产 CAE 软件公司、创业者之间的合作探索,包括 CAE 公有云、SaaS 解决方案、开源求解器的工业落地
及云化等。

公司的主要产品有怀曦智能下一代混合云计算门户系统、HPC 中间件系统(HCP SOA-NX)及智能自动提交引


擎、智能监控系统(作业、集群、许可证)等;公司的服务包括,私有云建设架构咨询、架构优化、系统实施、

1 怀曦智能科技(上海)有限公司
www.hpc-cloud.cn | www.huaixiis.com
中国(上海)自由贸易试验区祖冲之路 1077 号 2 幢 1245 室
分布式集群建设咨询、公有云、超算云、混合云服务咨询、基于大数据的 HPC 业务分析服务等。
公司坚信,企业要在竞争中胜出,就必须在计算中胜出,这是我们对客户坚定的承诺。

二、产品介绍

2.1 怀曦智能科技下一代混合云计算门户系统(HCP-NX)
HPC 作为一庞大复杂的系统,在商业应用领域急需一个智能的、自动的、简洁易用的使用界面,把复杂性屏蔽
起来,把必要信息实时自动呈现出来,从而使得 HPC 真正成为一个透明的、强大的研发工具,在进一步提高集群
利用效率、精确感知业务优先级的同时,大幅度提高用户的使用体验和生产率。
怀曦智能科技将超过 15 年的技术洞察、市场洞察凝聚在自己的产品开发之中,紧密结合领域实际、趋势与挑
战,扎实地一步步开发独具特色的、适应下一代混合云计算架构的、具备一系列令用户眼前一亮的特征的产品,
达到了业内最高水准,形成了独特的竞争优势。
系统架构:

怀曦智能下一代混合云计算门户系统架设在企业内部,同时连接私有云和公有云。对内,智能对接企业内部
集成和接口 PBS Professional OSP、Slurm、OpenLAVA 或其他商业/开源调度系统;对外智能对接主流成熟公有云
平台,实现按需(on-demand)、长租、短租等业务模式,在给用户透明提供本地化一致体验同时,在载荷均衡、
数据移动等方面具有灵活的策略,来确保资源的利用效率、业务的优先级和高效的带宽利用。
常见的载荷均衡策略包括,授权者自行制定、本地自动优先、高优先级作业本地等待时间阈值设置、数据实
时同步与提前移动、云存储自动清理、云主机空闲阀值设置等。

2 怀曦智能科技(上海)有限公司
www.hpc-cloud.cn | www.huaixiis.com
中国(上海)自由贸易试验区祖冲之路 1077 号 2 幢 1245 室
优势功能:

• 批量提交及管理:支持多文件夹、include 文件;一键显示/一键删除
• 后台提交:后台上传后,自动提交
• 一键提交:自动识别、填充求解器、主文件、参数、作业名字,无键盘输入、无下拉列表
• 智能提示:最大 free 核数
• 自动记忆:使用的参数、浏览的页面位置……
• 实时更新:作业状态、实时输出、节点利用率
• 草稿作业、克隆作业
• 作业编辑:替换主文件、修改核数……(每个作业仅允许一次)
• 数据引用:结果文件、输入文件、include 文件、服务器端特定共享/专用文件夹文件
• 精确捕捉完成状态
• 秒开下载、快速/自动过滤
• 远程高性能图形桌面/应用
• 细粒度权限,如求解器授权、个性化 CPU 序列
• Per-user 的数据输入、结果存储位置、数据浏览位置定义
• LDAP 集成

专为混合云而生的创新功能:
→ 数据旁路传输(绕过门户)、多路传输
→ 多门户以支持分布式研发团队
→ 数据实时同步、自动下载

3 怀曦智能科技(上海)有限公司
www.hpc-cloud.cn | www.huaixiis.com
中国(上海)自由贸易试验区祖冲之路 1077 号 2 幢 1245 室
→ 混合云许可监控、调度
怀曦智能下一代混合云计算门户系统致力于以优质服务为导向、以技术和模式创新为驱动,为客户提供创新
的解决方案,让企业在计算中快人一步,成为客户最可信赖的计算伙伴,助力客户快速进行产品创新,并实现数
字化运营。

2.2 HPC 智能自动提交引擎


HPC 智能自动提交引擎是怀曦智能中间件系统(HCP SOA-NX)的核心模块,实现作业数据的智能识别、完整
性检查、作业自动化提交,从而大幅度提高作业提交的效率、显著降低差错率,避免错提、漏提、重复提交及无
效提交。
智能自动化提交是进行更复杂分析流程,如热流耦合、多方案迭代、多学科优化、DOE 试验设计的必要前提,
是 CAE 分析工作流程化、标准化和自动化必须要做的前提性、基础性工作。
随着分析计算在产品研发中应用更深入、更全面、更快速、更精确,涉及的性能领域/物理场、系统与部件、
设计参数、load case 数量越来越多,分析任务数量呈现不断增多、流程日趋复杂的新情况,因此智能化、自动化
提交显得尤为迫切。

智能自动提交引擎架构:

智能自动提交引擎是业内革命性的新技术和新产品。通过自动识别受控文件系统活动(file system
activities)或接受用户的 data ready 指令(数据就绪命令、特定标志文件),对用户数据进行一系列自动化操
作,自动化完成作业的提交、结果的自动返回,同时提供可视化的智能监控入口或工具,来帮助用户监控和管理
作业,实现了整个流程的自动化、智能化,让用户完全脱离作业提交,专注于领域问题、数据及分析流程。

智能自动提交引擎主要功能:
• 自动识别已提交/未提交目录
• 自动识别求解器种类、主文件
• 自动设置资源请求及提交参数,包括核数、内存、版本、精度、作业名字等
• 自动实现批量、后台提交
• 提供必要工具查看作业名称、提交目录、id、求解器信息、核数等作业信息
• 提供必要工具查看计算中间过程输出 log 信息
• 提供必要的工具自定义提交参数
• 提供机制接受用户发出的数据准备 Data Ready 信号
• 自动识别文件系统实时变动,包括连续操作识别

4 怀曦智能科技(上海)有限公司
www.hpc-cloud.cn | www.huaixiis.com
中国(上海)自由贸易试验区祖冲之路 1077 号 2 幢 1245 室
怀曦智能科技自动提交引擎是 SOA-NX(HPC 中间件系统)的一部分,SOA 系统除了自动提交功能外,
还能实现用户 Linux 客户端和 HPC 集群的松耦合,提高集群的可维护性、提高集群使用的规范程度,在显著降低
HPC 工作站以及 HPC 服务器端维护工作的同时,亦有利于提高 HPC 集群的利用效率,用户可以在使用命令行、web
门户或自动提交引擎的任意情况下,获得透明的 HPC 全程计算服务能力。为用户和 HPC 搭建了一个友好、透明、
互动、松耦合的接口,使得 HPC 系统成为一个独立运行的生产力工具。

HPC 调度系统中间件主要功能:
• 提供完整的 HPC 客户端相应功能,包括作业操作、作业提交、作业查看、优先级查看与调整
• 屏蔽工作站客户端和 HPC 服务器的直接作业相关操作
• 提供作业中间过程数据查看、log 查看等手段
• 提供完整的应用及系统集成 web service 及 RESTful API 接口
• 无需安装、配置客户端、无需配置工作站和 HPC 计算节点的 ssh 互信

HPC 调度系统中间件 HCP SOA-NX 及智能自动提交引擎为开创性的、下一代的 HPC 接口系统,必将改变行业用


户和 HPC 系统打交道的方式,将用户精力从作业提交、HPC 系统转向关乎产品设计和创新的数据、流程、研发任务
上,在革命性地改善工程师使用 HPC 的体验的同时,极大地解放工程师,提高工程师的效率。

2.3 HPC 智能监控系统


怀曦智能 HPC 智能监控系统以创新的理念、先进的流数据处理技术,对 HPC 系统的全方位实时监控,以超乎
寻常的简洁实时、直观活跃、自动智能的方式,呈现 HPC 系统实时运行状态、异常与潜在问题。
怀曦智能 HPC 智能监控系统专注于提供关键信息、捕捉系统异常、把握系统运行真实情况,将集群监控、作
业监控、许可证服务器监控溶于一体化,并和门户系统、智能提交引擎紧密集成,形成了一套完整的、面向下一
代计算架构的创新解决方案。

作业监控主要功能:

5 怀曦智能科技(上海)有限公司
www.hpc-cloud.cn | www.huaixiis.com
中国(上海)自由贸易试验区祖冲之路 1077 号 2 幢 1245 室
针对排队作业:
• 当前状况监测:可运行该应用的节点、分区忙闲、同类作业排队运行状况一览
• 排队顺序:当前排队位置
• 排队原因分析
针对运行作业:
• 计算进度监测:实时显示当前计算进度、输出
• 计算健康监测与预警
• 计算剩余时间预测
异常监测:
• 异常作业(E|W|H)侦测,揭示潜在的基础设施问题
• 异常作业(R)侦测:包括运行缓慢、空运行、超长运行、僵死等

集群监控:

• 当前的作业概况透视图、计算能力利用概况
• 近一段时间概况展示,精确显示指定时间跨度内使用核数 VS 同时刻排队核数曲线
• 多维度 breakdown
• 综合展示集群/节点、作业、应用

许可监控:
实时显示:
• 许可证服务器健康状况
• 一段时间以来利用率曲线及实时利用率
• 显示超长会话
• 层面分明地表达详细用户列表

6 怀曦智能科技(上海)有限公司
www.hpc-cloud.cn | www.huaixiis.com
中国(上海)自由贸易试验区祖冲之路 1077 号 2 幢 1245 室
7 怀曦智能科技(上海)有限公司
www.hpc-cloud.cn | www.huaixiis.com
中国(上海)自由贸易试验区祖冲之路 1077 号 2 幢 1245 室
三、当前客户成功案例分析

3.1 SAIC Volkvagans 上汽大众


成为客户时间:2018 年 1 月;计算规模:30,000+ 核;用户数:257+;系统建设时间:>16 年

SVW 是国内汽车行业 HPC 计算规模最大、建设时间最长的企业。HPC 计算基础设施,经历了超过 15 年的发展


历史,形成了规模庞大、环境复杂、承担重大研发任务的 business-critical 技术支撑平台。经过多年的使用,
积累了丰富的、宝贵的使用经验、成熟规范的管理流程,形成了独特的计算环境、计算流程和计算需求。
2018 年前,SVW 一直使用性价比高、功能强大的 Altair PBS Works 解决方案。2018 年以后,随着集群规模迅
速扩大,管理水平、管理效率、投资回报等方面的问题也日益凸显。经过大量的评估、试用及复杂的商务过程
后,怀曦智能被选定为 SVW 下一阶段 HPC 技术供应商。以下为我司成为 SVW 的计算伙伴后,客户价值综述:

怀曦智能秉承客户至上、锐意创新的精神,针对 SVW 集群 10 多年来形成的复杂环境,进行了全面的治理:

8 怀曦智能科技(上海)有限公司
www.hpc-cloud.cn | www.huaixiis.com
中国(上海)自由贸易试验区祖冲之路 1077 号 2 幢 1245 室
 操作系统从商用转变为开源,仅此一项,每年节省上百万开销。
 调度系统意义重大的优化,解决了多年存在的载荷均衡、IO 优化、资源快速回收等方面的重大问题
 用户生产率方面采取了端到端的优化,从提交、批量提交、自动提交、快速查看进度、中间结果、排队
顺序、节点查看,提供了强大的系列工具集,极大提高了用户效率
 在系统管理层面,在许可证调度、系统批量自动化操作(增加节点、用户、存储等)等方面采取了一系
列优化工作,深得客户赞赏和感谢

最终,客户的设备效率、人员效率显著提高,软件及服务成本显著降低,怀曦智能亦因此在业内收到高度关
注和认可,树立了老牌龙头企业和技术初创公司合作共赢的典范。

3.2. WM-Motor/威马汽车科技集团

成为客户时间:2018 年 10 月;计算规模:1500+ 核;用户数:30+;系统建设时间:4 年


威马汽车是国内新兴的新能源汽车企业及出行方案提供商。威马汽车 2017 开始建设 HPC,集群管理采用了硬
件公司推荐的实施合作伙伴的方案,基于 OpenLava、Putty、Ganglia、Xcat、TigerVNC 等技术。该方案不符合威
马公司新锐科技创业公司需要高起点、高速度发展的要求。
威马汽车于 2108 年开始评估某硅谷归国工业互联网创业公司的方案,因其欠缺 HPC 行业、制造业 CAE 领域经
验积累,最终客户转而和怀曦智能合作,首先从咨询服务开始,对威马汽车 HPC 5 年发展进行了规划,从体系架
构、计算模式、数据管理、IT 治理等方面,对汽车行业进行了全面的调研、分析,确定了 HPC 投资策略、技术路
线,以下为架构咨询的最终交付物目录:

9 怀曦智能科技(上海)有限公司
www.hpc-cloud.cn | www.huaixiis.com
中国(上海)自由贸易试验区祖冲之路 1077 号 2 幢 1245 室
从 2019 年,威马汽车正式全面采用怀曦智能科技的解决方案以来,在设备效率、人员效率、数字化运营方面
取得了显著的效益:

怀曦智能科技除了在资源管理和作业调度方面带来了最新的技术和最佳的行业实践经验外,处于友好互助的
宗旨,在应用程序计算效率的优化、许可证的高效调度方面也做了重要的贡献,得到了客户高度的信任和感激。
双方形成了长期卓有成效的合作模式,怀曦智能成为了威马唯一的计算合作伙伴,在 HPC 规划、运营、优化等方
面全面为威马提供咨询、服务和产品,树立了创业公司之间相互促进、彼此成就的案例。

3.3. FAW-VW/一汽大众

成为客户时间:2020 年 1 月;计算规模:10000+ 核;用户数:150+;系统建设时间:15 年

10 怀曦智能科技(上海)有限公司
www.hpc-cloud.cn | www.huaixiis.com
中国(上海)自由贸易试验区祖冲之路 1077 号 2 幢 1245 室
FAW-VW 是北方汽车行业最大的合资企业,其各方面技术体系、技术规范都引领着北方汽车集团,包括 HPC 计
算架构、管理优化等层面,同时,南北大众在自主研发、技术引进、技术创新、管理创新方面保持着密切的沟
通。上海大众在 HPC 方面的杰出成绩,在大众全球、大众中国都产生了热烈的反响,最终经过多次考察、多次交
流,FAW-VW 决定重新构架 HPC 基础设施,从管理层面进行全面的审视、优化。

一汽大众的集群今年迎来了大的发展机遇,其在管理和优化层面仍有大量工作需要完成,为此,怀曦智能特
地进行了详尽的分析和建议,在后续扩展过程中,将协同一汽大众逐步完善、优化 HPC 的计算环境。
11 怀曦智能科技(上海)有限公司
www.hpc-cloud.cn | www.huaixiis.com
中国(上海)自由贸易试验区祖冲之路 1077 号 2 幢 1245 室
怀曦智能科技在 HPC 方面的创新技术,如智能自动提交引擎、许可证调度技术也得到了一汽大众的高度重
视,将在适当时机进行引入,进一步完善 HPC 平台建设,促进双方的互利合作。

12 怀曦智能科技(上海)有限公司
www.hpc-cloud.cn | www.huaixiis.com
中国(上海)自由贸易试验区祖冲之路 1077 号 2 幢 1245 室

You might also like