7个小知识,快速了解高性能计算
想象一下,新药的研制时间从数年缩短至数天。 高性能计算机 (HPC) 通过模拟、建模和分析,可以轻松解决这类以及更多其他科学难题。 高性能计算系统帮助人们解决世界上最棘手的难题,引领人类走向“第四次工业革命”。
高性能计算系统现已广泛用于:
寻找全新的药物化合物并测试已知药物组合,从而更好地治疗不同种类的癌症和其他疾病
模拟分子动力学以开发新材料,如防弹纤维织物
提前预测重大天气变化,使受影响的地区做好准备
超级计算机代表着高性能计算系统最尖端的水平。 随着处理能力的不断演进,超级计算机的认定标准也会不断提升。 单个超级计算集群可能包含数万个处理器,使用全球最昂贵且最强大的系统,成本高达 1 亿美元。

高性能计算的工作原理
在高性能计算中,处理信息的两种主要方式为:
串行处理,由中央处理器 (CPU) 完成。 每个 CPU 核心通常每次只能处理一个任务。 CPU 对于运行各种功能而言至关重要,如操作系统和基本应用程序(如文字处理、办公生产力工具等)。

并行处理,可利用多个 CPU 或图形处理器 (GPU) 完成。 GPU 最初是专为图形处理而设计的。它可在数据矩阵(如屏幕像素)中同时执行多种算术运算。 同时在多个数据平面上工作的能力使 GPU 非常适合在机器学习 (ML) 应用任务中进行并行处理,如识别视频中的物体。

突破超级计算的极限需要不同的系统架构。 大多数高性能计算系统通过超高带宽将多个处理器和内存模块互连并聚合,从而实现并行处理。 一些高性能计算系统将 CPU 和 GPU 结合在一起,被称为异构计算。
计算机计算能力的度量单位被称为“FLOPS”(每秒浮点运算次数)。 截至 2019 年初,现有的高端超级计算机可以执行 143.5 千万亿次 FLOPS (143 × 1015)。 此类超级计算机被称为千万亿次级,可以执行超过千万亿次 FLOPS。相比之下,高端游戏台式机的速度要慢 1,000,000 倍以上,可执行约 200 千兆次 FLOPS (1 × 109)。 超级计算在处理和吞吐量方面的重大突破很快将会实现超级计算的下一个重大级别——百亿亿次级,该级别的速度比千万亿次级约快 1,000 倍。 这意味着百亿亿次级超级计算机每秒将能够执行 1018(或者 10 亿 x 10 亿)次运算。

“FLOPS”是对理论处理速度的描述,实现该速度需要连续向处理器传输数据。 因此,系统设计必须考虑到数据吞吐量这一因素。 系统内存以及处理节点之间的互连会影响数据传输到处理器的速度。

为了实现 1 百亿亿次级 FLOPS 的下一级超级计算机处理性能,大概需要 5,000,000 个台式机。*
*假定每个台式机具备 200 千兆次 FLOPS 的能力
术语知识
高性能计算 (HPC):一个广义上的强大计算系统,其范围涵盖简单计算机(如 1 个 CPU + 8 个 GPU),乃至世界一流的超级计算机
超级计算机:最先进的高性能计算机,以不断提高的性能标准为依据
异构计算:优化串行 (CPU) 和并行 (GPU) 处理能力的高性能计算架构
内存:在高性能计算系统中为实现快速访问而存储数据的地方
互连:可令处理节点互相通信的系统层;在超级计算机中存在多个级别的互连
千万亿次级:为达到每秒执行千万亿次 (1015) 运算而设计的超级计算机
百亿亿次级:为达到每秒执行百亿亿次 (1018) 运算而设计的超级计算机
新兴应用领域
随着技术的进步,高性能计算现已应用在更广泛的领域。 我们现在拥有比以往更加强大的处理能力和内存,能够解决更加复杂的问题。
机器学习:作为人工智能(AI)的一个领域,机器学习 (ML) 是指可以自己主动学习的系统,而不是被动地按照指令执行任务。 高性能计算系统可用于高级机器学习来分析海量数据,例如用于癌症研究,可以检测照片中的黑素瘤。
大数据分析:快速比较和关联海量数据,用于辅助研究和解决学术、科学、金融、商业、健康、网络安全以及政务应用方面的各种问题。 此类工作需要巨大的吞吐量和计算能力。 NASA 每年大约生成 50 PB的任务数据,依靠超级计算来分析观测结果并利用海量信息来进行模拟。
高级建模和模拟:高级建模和模拟不需要在早期阶段进行物理构建,可使公司在节省时间、材料和员工成本的同时,更快地将创新产品投入市场。 高性能计算建模和模拟可用于药物研制和测试,汽车和航空航天设计、气候/天气系统预测以及能源应用。