高性能计算主要是研究什么的？-知性问

高性能计算主要是研究什么的？

的有关信息介绍如下：

高性能计算主要是研究什么的？

作为一个在高性能计算领域十多年的老兵，大概回答下

高性能计算是一个非常大的领域，总的来看，可以分为三个层面：

以上3个层面，每一个层面都有大量的工作可以做，比如软件层面，其中任何一个方向，都值得深入。本人博士所在的实验室，主要是做计算，提供高性能的计算库，一个实验室上百人，就专门只做这个事情，为国产的、商用的处理器，提供高性能计算库，提出新的计算算法，提出新的优化方法。

基本概念各位答主都已经说得很详细了

题主既然担心就业方向

那么作为行业内部资深（并不）人士

并且我们既不是搞超算也不是搞科研的

我很负责任地告诉题主

我们很缺人啊……

来贴几个我们做过的行业案例：

药物研发的AutoDock Vina和分子自由能计算的Amber：

芯片设计中的HSPICE和OPC光刻：

风电制造的Bladed和CFD流体仿真应用Fluent：：

十分欢迎题主入坑（划掉）~~~

码字不易，喜欢请点个赞哦~

高性能计算是国之重器，计算机学科中的明珠。

举一个例子，现在的天气预报，可以预测到未来的7天、15天，预测到当天几点有雨，还比较准（当然，卫星的作用似乎更大，对于长时预测）。这对于社会民生来说，具有非凡的价值。

高性能计算广泛地应用于勘探、天气、海洋、气候变化、核能、有限元设计、煤燃烧、发动机、螺旋桨、电子商务、交通、人工智能，等等。

要说高性能计算，就要了解一下问题的求解。一说到计算，中小学生首先想的是计算式。

鸡兔同笼、百元买百鸡、韩信点兵，平方根，等等。这些在小学、中学，可能都接触过。

小学生、中学生都立刻可以列出算式。比如8的平方根，我们可以立刻列出来是。

但是，结果到底是多少？只能在要求的精度范围内不断进行逼近，得到数值解：2.82842...。

现实当中，大量问题是没有解析解的，只有数值解。

CPU的计算速度虽然看起来很快，但是，现实中的数值解的计算次数是指数爆炸的，比如。解决这个计算爆炸问题，一方面是降低精度要求；一方面是研究更快更好的近似算法；一方面是研制高性能计算机。

降低精度要求，不同的问题，对于精度的要求不一样，这个很容易理解。

更好更快的近似算法，一般可以说，找到NP问题的多项式近似解。

高性能计算机，既然一颗CPU的计算速度不够，那么就用很多颗CPU同时计算，加快计算求解的过程。那么，几千颗几万颗CPU怎么同时计算一个问题呢？这很复杂，需要解决一系列问题。

总得来说，有两个问题：1）如何制造一个高性能计算机系统；2）给定一个高性能计算机系统，如何用它去求解问题。

就好比，如何制造一个算盘；给你一个算盘，你怎么去计算。

前者涉及到一系列的问题，既是一个包括软、硬件的系统工程，同时也包含大量的科学问题。

后者，主要是计算（机）科学、算法设计。

中国的高性能计算还比较落后，虽然有集群、超算，但是，计算科学、算法设计和软件开发的人太少了。

顺便说一下，高性能计算这个说法，看怎么理解。有狭义的，也有广义的。从历史上，高性能计算主要是指并行计算、并行计算机、并行算法。90年代后，包涵了集群计算。2006年后，又包含了云计算（当然，很多人并不认可），现在又包含了分布式计算（当然，同样很多人不认可）。所以狭义的高性能计算，主要是并行计算和集群计算。广义的高性能计算，那就多了。

又，现在的深度学习，算是高性能计算中的阵列处理器（向量计算机）和SIMD。

又，如何把几千个、几万个GPU加速器、TPU加速器连接在一起，同时解决一个问题，又变成了并行计算机的问题。

作为一个高性能计算从业人员，而且跟中山大学超算中心打过交道，很负责人地告诉你，这个行业就业前景明朗。

第一个问题，高性能计算起初主要用在密码学、气象学，后来延伸到很多的仿真模拟，包括第一性原理、分子动力学、有限元分析等。近两年人工智能产业重新勃起，也为高性能计算注入新的生机，国内对高性能计算人才极其稀缺，特别是软件开发人员。

至于需求，以前高性能计算都是国家在建设的，如天河二号等，但今年阿里、华为、腾讯、浪潮都致力于发展自己的高性能计算平台，这还只是第一梯队的企业，不算我们这种中小企业。所以就业前景还是很好地，不一定至继续做科研。

另外，国内现在致力于开发自己的芯片和操作系统，神威太湖就是号称全国产。这也给国内的高性能计算开发了一个新的方向。

以上，谢谢。

广州高能计算机科技有限公司

高性能计算，简称HPC，从百度百科给出的定义中我们提炼一下它的概念原理，即高性能计算是通常使用很多处理器（是单个机器的一部分）或者某一集群中组织的几台计算机（作为单个计算资源操作）的计算系统和环境。

从这里我们可以看出来高性能计算是一个并行计算系统。在上面运行的程序一般使用的事并行算法，算法通常是把一个大的问题根据规则分解成许多小的问题，在集群的不同节点上进行计算，协同合作，在计算过程中可以进行数据的交换，把这些小的问题的处理结果合并就可以得到整个大的问题的结果，并行计算可以缩小问题的处理时间。同时集群的处理能力和集群的规模是成正比的，规模越大，集群内节点间的协作处理能力越强，计算性能越好。

高性能计算是计算机科学的一个分支，研究集群架构、并行算法和相关软件基础，通过分布式计算实现单台计算机无法大奥的运算速度，同时在大规模科学问题、天气预报、生物制药、地形分析、数据挖掘、图像处理、基因测序方面有很大应用。

高兴能计算最初是主要应用在，密码学、气象学，后来通过延伸，得到了第一性原理、分支动力学、有限元分析以及人工智能等。高性能计算的主要研究方向有网络计算技术、高性能计算软件与工具开发、计算机系统拼车技术、云计算等。而且在天气预报中高性能计算也大有可为，现在的天气预报可以预测未来一两周，比较准确，这对于民生具有非常实用的价值。

高性能计算这一领域有很多类型的HPC系统，它的范围从标准计算机的大型集群到高度专用的硬件，大多数基于集群的HPC系统都是使用的高性能网络互联，可以改善总体网络性能和传输速率。

高性能计算是计算机科学与技术这门科学的分支之一，它主要是从体系结构、软件开发和并行算法这些方面研究开发高性能计算机的技术。在计算机技术飞速发展的过程中，高性能计算机的计算处理速度也一直在提升，其所依据的标准也在不断变化之中。

高性能计算这方面我们根据数据流和指令可以得到四个分类。分别是：SISD即单指令单数据流，是非并行计算的模型，典型案例就是单核CPU，同一个处理器顺序处理所有数据，同一时刻只能使用一个指令，SIMD即单指令多数据流，例如GPU同时处理多个不同数据，MISD即多指令单数据流，在同一个数据流上可以执行不同的指令，MIMD即多指令多数据流，例如多核CPU。

另外从并行任务间的关系角度来对高性能计算进行分类。高吞吐计算，这种类型的一个共同特征是在海量数据上搜索某些特定模式；分布计算，它与高吞吐计算正好相反，需要进行大量的数据交换。大多数基于集群的HPC系统使用高性能网络连接，基本的网络拓扑和组织可以使用一个简单的中线拓扑，而且HPC系统由计算、存储、网络和集群软件四部分组成。高性能计算系统的技术特点是目前主流处理器是X86处理器，操作系统是Linux系统，构建方式采用的是刀片系统，互联网使用IB和10GE。高性能计算急群众计算节点一般分为3种：MPI节点、胖节点、GPU加速节点，其中双路节点称为搜节点，双路以上称为胖节点，胖节点需要配置大容量内存。

计算在数学上的概念: 计算是一种行为，通过已知量的可能的组合，获得新的量。计算的本质是集合之间的映射。

个人粗浅直白的理解是: 输入一个或多个数据，经过处理，输出一个或多个数据。如 1 + 2 就是一个计算，输入 2 个数据，输出 1 个数据 3 。

那到这里就会有很多疑问，在计算机上：

高性能计算：通常使用很多处理器（作为单个机器的一部分）或者某一集群中组织的几台计算机（作为单个计算资源操作）的计算系统和环境。

在移动端，我们可以认为是通过同时启用移动设备的 CPU 和 GPU 构成的异构计算资源，进行协同计算。

从数据流和指令的角度把计算模型分为4类（费林分类法）

本文内容讨论的高性能计算则主要是在 SIMD 的基础上讨论，但这里并不需要严格按照 SIMD，只需要计算流程中的一部分内容符合 SIMD 我们就认为该实现过程就是一个高性能计算。

知道了计算模型的类型，我们就能知道并不是所有的计算类型都能实现为高性能计算。只有满足以下要求的算法（或者算法中的部分满足，其他部分通过CPU协调）才能够比较好的实现为高性能计算。

这里首先了解的是图形显示流程，常用的通用计算也正是基于这个显示流程做修改而实现的。这里以OpenGL ES为例，其他的如Direct3D、CG的流程大体也相同。

其中的顶点着色器和片元着色器的处理过程，程序猿可以自行编写，且是分别在 GPU 中的顶点处理器和片元处理器（或者统一处理器）计算。

知道了这个流程，我们可以很容易联想到：

其中 {{ }} 显示的部分并不是我们关心的内容，我们的程序会经过这几步骤，但逻辑上一般并不用生效。

这里的处理过程还是很模糊，对比一下上面的常规计算 (普通计算左，高性能计算右)：

为了保证我们输出到纹理的数据是完整正确的，另外需要注意的是：

前面介绍了这么多，但终究只是理论介绍，我们并没有看到使用高性能计算究竟提升了多少。

写一个非常简单的图像处理的算法 (因为使用图像暂时效果比较明显，表达也比较容易，所以这里使用的是图像显示的 Demo，并不是说高性能计算只能用于显示相关)

算法基本流程是:

常规计算 ( java 代码) 实现

在系统 5.1.1 的 Nexus 5 手机，对 142KB 的正方形 png 图片做处理，实现结果如下：

说明:

上面的图片是输入图片，下面的图片是输出图片，显示的处理时间是 4234.676ms

片元处理器代码 gray_blur_f.glsl (用于处理数据) 如下：

java 代码 (用于读取数据并生成 bitmap) 如下：

在系统 5.1.1 的 Nexus 5 手机，对 142KB 的方形 png 图片做处理，实现结果如下：

说明:

上面的图片是输入图片，下面的图片是输出图片，显示的处理时间是257.13364ms

这里的时间并不仅仅包含片元处理器的代码执行时间，也已经包括从纹理缓存对象中读取数据并生成Bitmap的时间，读取数据的时间也会占用比较多的时间

PS：删除了使用java代码翻转图片数据的操作，而是在输入纹理顶点的时候，修改顺逆方向，达到相同的目的，节省了 200ms 左右。

以上答案来自我厂张云龙老师的博文《移动端高性能计算基础》。

更多网易技术、产品、运营经验分享敬请关注网易社区芝士回答机构号：网易云 - 芝士回答

下面这张照片，你很可能已经见过：

作为「人类第一张黑洞照片」，它在 2019 年发布时引起了巨大轰动。但要问起这张照片是怎么拍出来的，很多人也许就不那么清楚了。

照片中央的黑洞位于 M87 星系，考虑到它远在 5500 万光年之外，想为其「画像」的难度无异于在地球上给月球表面的一个可乐瓶盖拍照。为了达到所需的分辨率，我们甚至需要一面像地球那么大的望远镜。

好消息是，人类还真建出了这样的望远镜。

这里的关键是甚长基线干涉测量技术（VLBI）。通过调动散布在全球的射电望远镜，让它们同一时间观测同一个目标，再将得到的观测信号进行联合处理，就相当于用一台口径达到各望远镜之间距离的超大射电望远镜进行观测。理论上说，这台「虚拟望远镜」的口径甚至能够超越地球直径。

负责这次黑洞观测计划的是事件视界望远镜（EHT）。借助横跨多个大洲的望远镜阵列，天文学家如愿以偿地得到了他们想要的数据。

但怎么处理望远镜得到的数据是另一个问题。仅仅是一场为期五天的观测，事件视界望远镜就会产生约 7PB 的数据，能够装满近 2000 个大容量硬盘。如此大的数据量难以通过互联网传输，因此各地天文台会将硬盘集中邮寄到美国麻省理工学院海斯塔克天文台——在那里等候多时的高性能计算机（HPC）将会把数千个硬盘中杂乱无章的数据转换成我们后来看见的黑洞「出道照」。

在事件视界望远镜计划中，硬件设备至关重要。但与阿塔卡马沙漠夜空中庄严的望远镜阵列相比，高性能计算机看起来只是一片低调地隐藏在室内的机箱柜，负责的也是枯燥芜杂的数据处理工作，这让高性能计算于我们而言往往是一个遥远的概念。

但听起来更陌生缥缈的高性能计算，与日常生活的关系可能远更紧密于那些沉默地伫立的射电望远镜。只要将高性能计算与其实际服务的项目联系起来，就很容易理解，为什么它在当下堪称是不可或缺的「基础设施」。

谈到「日常生活」，最好的例子莫过于天气预报。天气是那么重要，以至于两个许久未见的人在开启话题时都往往会选择从天气着手：「今天怎么突然下雨了？」

但另一方面，天气也是「蝴蝶效应」的最佳诠释者——千里之外的微小诱因常常能以数学模型都无法预测的方式改变天气，正如发生在太平洋东部的拉尼娜现象会让粤闽一带今年遭遇旱情。

尽管人类可能永远都无法完全理解天气，但科技进步至少让人们更加趋近这个目标：多普勒雷达和气象卫星让我们对云系有了更深入的了解；而高性能计算加持下的大数据统计让预测的精度不断提高。

有了数据科学，如今我们预测未来一周的降水情况比半个世纪前预测一天之内的降水情况更加准确，甚至可以清楚地告诉你，现在盘旋在菲律宾东部的 2 号台风「舒力基」极有可能加强为超强台风，然后取道太平洋东去。数据科学背后，自然少不了拥有强大算力的高性能计算参与。

高性能计算应用的另一个例子是电影和动画的渲染。我去看了最近重映的《阿凡达》，出色的美术设计和纤毫毕现的特效创造了恢弘华美的潘多拉星球，哪怕在 11 年后看来依然无比惊艳。

但这么漂亮的特效也意味着惊人的渲染工作量——当年詹姆斯·卡梅隆的团队找来了拥有 6000 个处理器的高性能计算机协助渲染，渲染工作大概花了一年时间。如果换用普通 PC，这部分工作就需要马不停蹄地渲染一万年。

高性能计算还支持了许多重要的学术研究。例如，去年日本学者通过目前算力最强的「富岳」高性能计算机模拟计算了口罩的防飞沫效果；西班牙的一个研究团队也借助高性能计算机模拟水熊虫体内损坏抑制蛋白与 DNA 的相互作用，发现了水熊虫得以成为「最顽强生命体」的机制。

时至今日，在众多行业的根基处，都能发现高性能计算的身影。目前高性能计算应用范围包括了航空航天、石油勘探、气象研究、生物工程、工业设计、动画渲染、智能化社会等诸多领域。可以说，任何需要计算机和算力的行业，都会用得上高性能计算。

提起「高性能计算」，你脑海中会浮现出哪些名字？是先后登顶算力 TOP500 排行榜的「天河 1 号 A」？还是「神威·太湖之光」？

或许有些意外，在中国高性能计算系统中份额最大的供应商其实是联想。对，就是那个你以为只做笔记本电脑的联想。

在中国超级算力大会 ChinaSC 2020 发布的高性能计算机 TOP100 榜单中，联想以 35 套领跑，其中 6 套位列前 10。即使放到世界上，联想也是高性能计算领域的重要参与者：去年 11 月发布的 TOP500 高性能计算名单中，联想入围 182 台，独占 36.4% 的份额。

事实上，联想早在 1999 年就正式成立高性能计算（HPC）部门入局相关研发领域。要明白为什么联想要制造高性能计算机，就要理解当初的时代背景。

从世界第一台通用计算机「ENIAC」开始，高性能计算便长期服务于尖端领域的研究，但因为起点不同，高性能计算机技术长期由欧美国家所把持。

一个著名的故事是，上世纪 80 年代中国石油工业部物探局曾花重金购买了一台 IBM 大型机，但 IBM 方面给出的交易条件非常苛刻：为免「窃取技术」，美方将机器放在一间玻璃房里实施 24 小时监控，且进出钥匙和开机启动密码都由美方掌握，中方还必须定期提交使用日志。

在这样的环境下，自主掌握高性能计算技术就显得尤为重要。在高性能计算研制上，一边是以「银河」「曙光」与「神威」系列为代表的「国家队」，另一边则是联想的「深腾」系列高性能计算机；前者更多负责国家级关键任务，而后者将高性能计算更广泛地推向商用。

2002 年，联想推出了国内首套万亿次运算能力的服务器深腾 1800，它创造性地放弃了先前向量机的发展方向，转向了集群计算的技术路线，奠定了今天高性能计算体系的结构基础。在深腾 1800 的引领下，高性能计算集群体系结构迅速成为了主流。

短短一年后，深腾 6800 在 2003 年研制成功，它的运算速度达到了每秒 4 万亿次，在当年 TOP500 排行榜上名列第 14，这还是首次有中国高性能计算机跻身前 20 名。

自此，联想数据中心业务一路稳步扩张，在最新发布的 2020—2021 财年第三季度财报中，数据中心业务营收达到了 108.2 亿元，如上文所说，联想也迅速成长为了高性能计算领域的领头品牌。

在此期间，联想高性能计算部门还完成了一系列重要任务。比如说，联想与中国载人航天工程办公室共建了中国载人航天工程总体仿真实验室，承接了轨道计算、模拟仿真和航天器设计等任务，助力了神舟九号与天宫一号载人交会对接、神州十一号与天宫二号载人交会对接等航天任务的成功实践。

中科院计算所研究员张云泉博士在接受采访时曾表示：「农业社会靠体力，工业社会靠机器，信息社会靠互联网，而智能化社会要靠算力，谁能占领力的制高点，谁就有了引领社会发展的基础。」

IDC 报告预测，2018—2025 年，中国的数据总量将以每年 30% 的高速增长引领全球，预计到 2025 年，中国的数据总量将会攀升至世界第一。为了应对爆炸式增长的数据，建立更多的数据中心势在必行。

但是在「绿色经济」的大环境下，政府和企业都更关心绿色节能指标，新建的数据中心不能仅仅满足于高性能，还必须拥有高能效比。作为「反面教材」，当前 TOP500 第一名的日本「富岳」高性能计算虽然总性能领先，却因为高造价、高能耗而饱受诟病。

立足于商业领域的联想会更注重能效比。为此，联想开发了专有的「海神」液冷系统，使用 18~50℃ 的去离子水作为冷媒，通过冷板液冷（服务器产生的热量传导至冷板，再由液体带走）的方式对服务器进行冷却，经热循环后的温水接近 60 ℃，还可以回收热量用于室内供暖。一系列举措相结合，「海神」液冷系统能够提供数倍于传统风冷的散热效率，从而提升单机柜的功率上限。

以联想为北京大学打造的「未名一号」高性能计算平台为例，「海神」液冷系统为其节省了 50% 的制冷散热成本，将 PUE 值（数据中心所有设备能耗之和 / IT 设备能耗，越接近 1 效能越好）控制在 1.1，每年能为北京大学节省 60 万度电。

而联想为荷兰学术机构 SURF 打造的新一代高性能计算机，更是通过联合加速、分布式存储、微通道散热技术和「海神」液冷系统实现了比传统散热方式节能 90% 以上的高效能源利用模式。

当然，高性能计算性能再高、能效再好，也必须要应用于实际项目才能发挥价值。没有软件的辅助，空有算力也无法转化为现实价值。曾经就有报道说，「天河 1 号」因为缺少软件配合而长期闲置。

为了更好地实施软硬件协同，联想并未停留在硬件提供者的角色上，而是发展为了完整的解决方案提供者：联想会深度参与到系统构建的过程中，根据用户实际需要设计合适的数据中心规模，并提供高性能计算管理系统以及可扩展计算平台，赋予了高性能计算系统更广泛的应用潜力。

当高性能计算运算速度朝着每秒百亿亿次迈进，数据中心在地球表面的每个角落铺开，我们有理由相信，未来的人们能够将目光投向更深邃的太空，享受到更精准的天气预报、更高水平的医药服务以及更活灵活现的动画电影。

本文作者：彭海星

高性能计算（High performance computing，简称 HPC），是指利用聚集起来的计算能力来处理标准工作站无法完成的数据密集型计算任务，被广泛应用于科学和工程界的各个领域，包括核电、生物医学、气象、航空航天、数值仿真、建模和渲染等方面。

我们在处理各种计算问题时常常遇到这样的情况：由于需要大量的运算，一台通用的计算机无法在合理的时间内完成工作，或者由于所需的数据量过大而可用的资源有限，导致根本无法执行计算。对于这样的需求，我们可以考虑 HPC，通过使用专门或高端的硬件，或者将多个单元的计算能力进行整合，能够有效地克服这些限制。为此，需要将数据和运算相应地分布到多个单元中，即大家经常提到的并行计算。

所谓并行计算，根据百度百科给出的定义是指同时使用多种计算资源解决问题的过程，是提高计算机系统计算速度和处理能力的一种有效手段。基本原理就是将一个大的问题根据一定的规则分解成不同小的问题，或者说子问题，然后在计算机集群上对这些子问题进行计算求解，最后将所有子问题的结果合并得到大问题的解。

就硬件配置而言，常见的并行计算有两种类型：

共享内存式通常是指单计算机节点上的多核运算，其中所有处理单元（CPU）都可以访问存储器；而在分布内存式通常是指计算机集群，不同的处理单元或节点之间不直接访问同一个内存，而是必须存在一个相互连接的网络，在这些单元之间发送消息（或者使用其他通信机制），以网络共享的方式相互访问分布式的存储器。鉴于有些单元共享共同的内存空间，而其他单元又是另一种情况，现代 HPC 系统通常是融合了这两个概念的混合体，即采用混合并行计算，从而最大程度地发挥共享内存的性能优势，如下面的示意图所示：

不同类型的建模问题具有不同的可并行程度。以仿真中常见的参数化扫描为例，这种问题求解多个具有独立的几何、边界条件或材料属性的相似的模型，几乎可以完全并行计算，具体的实现方法是将每一个模型设置分配给一个计算单元。这类问题非常适合并行计算，因此通常称为“易并行问题”（embarrassingly parallel problem）。

易并行问题对集群中的网络速度和延迟非常敏感。（在其他情况下，由于网络速度不够快，无法有效处理通信，很可能导致速度减慢。）因此，可以将通用硬件连接起来，加快这类问题的计算速度（例如，构建 Beowulf 集群）。

另一种问题，正如前面说过并行计算中可以将有些问题可以分解为多个子问题，例如，可以通过数据分解（数据并行）或任务分解（任务并行）来进一步分解问题，通常这些子问题之间的耦合程度会直接影响它们的并行化程度。

举例来说，易并行问题便是一个几乎可以完全解耦的问题，如前面讨论的参数化扫描。而完全耦合问题的例子则是一个迭代过程，其中的计算必须以严格的串行方式进行。当多个子问题相互耦合时，由于一个子问题的中间结果可能依赖于其他子问题，因此不能单独进行处理，我们需要通过信息交换来处理这些依赖关系。

共享内存或互连网络可用于在不同的计算单元之间进行通信和同步，根据计算任务是在共享内存环境下还是在分布式内存环境下运行，有众多因素会对可并行化以及潜在加速比产生影响。

在多个节点上运行分布式内存仿真时，各个计算单元必须使用网络进行通信。此时，网络延迟和带宽会进一步影响通信速度。正因如此，大多数 HPC 集群都配备了高带宽/低延迟网络，实现在集群的各个节点之间快速传输数据。

使用 HPC 的原因主要体现在两个方面。

首先，随着中央处理单元（CPU）和节点数量的不断增加，人们可以使用的计算能力越来越多。有了强大的计算能力，就能在单位时间内执行更多运算，从而提高特定模型的计算速度。这就是我们所说的加速比。

加速比通常定义为：同一个任务在并行系统的执行时间与在串行系统的执行时间的比值。加速比的上限取决于模型并行求解的程度。举个例子，假设一个运算量固定的计算任务，其中 50% 的代码可以并行执行。在这种情况下，理论最大加速比为 2。如果并行执行的代码能够上升至 95%，则理论最大加速比很可能达到 20。对于能够实现完全并行的代码，可以不断向系统中添加计算单元，因此不存在理论上的最大限制。阿姆达尔定律对这一现象进行了解释。

另一方面，在集群的情况下，可用的内存量通常以线性方式增加。如此一来，随着计算单元数量的增加，就能够处理越来越大的模型，这称为扩展加速比。从某种意义上来说，运用这种方法可以对阿姆达尔定律提出的限制加以“欺骗”——该定律适用于固定大小的计算问题。将计算能力和内存提高一倍，就可以在相同的时间内完成大小为基本任务两倍的计算任务，Gustafson-Barsis 定律对这一现象作出了解释。

使用计算机集群时，科学家可以从两个方面受益于额外的资源：

第一，由于内存增多、计算能力增强，科学家可以求解更大型的问题。具体来说，一方面增加额外的进程，另一方面保持每个进程的工作负载（即子问题的规模和运算数量）水平不变，由此在相同的时间内解决规模更大的问题。这叫做弱扩展。

第二，科学家可以在保持整体问题规模不变的前提下，将原问题分割成更多更小的子问题，并分配给更多进程。这样一来，每个进程的工作量减小，就可以更快地完成任务。在最优情况下，假如一个规模固定的问题被分配给 P 个进程，那么计算速度就会提高 P 倍。相比于单位时间（一个小时、一天等）内运行一次仿真，第二种方法允许在单位时间内运行 P 次仿真。这种方法称为强扩展。

简而言之，分布式内存计算可以帮助您在相同的时间内解决规模更大的问题，或者缩短相同问题的求解时间。

研究内容主要是具体的应用（超大规模）和系统体系结构，前者包含的内容较多，如科学计算、金融等，就业前景多样，应用相关研究单位急需这样的人；后者是单纯的计算机方向，如高性能存储、高性能网络、任务调度、大数据处理和可视化等，可以去像google，阿里巴巴，msra这样的企业研究院，也可以去相关的科研单位

高性能计算主要研究方向：

1.面向科学计算以及工程需要的计算机系统

网络计算技术

高性能计算软件与工具开发

计算机系统评测技术

2.以数据为中心的计算系统

云计算系统

移动计算系统

手机码一下，后续电脑上再补充～～～～

IT界对高性能计算的需求大么？

可以看一下IDC的咨询报告，2015年全球市场空间252亿美金，增长率超过8%，其中服务器和存储占70%。研究HPC的人都去干嘛了呢？我想先也了解下大家去研究哪方面？我再分别尝试答复。

什么是高性能计算，涉及哪些技术和知识呢？

高性能计算(High performance computing) 指通常使用很多处理器(作为单个机器的一部分)或者某一集群中组织的几台计算机(作为单个计算资源操作)的计算系统和环境。高性能集群上运行的应用程序一般使用并行算法，把一个大的普通问题根据一定的规则分为许多小的子问题，在集群内的不同节点上进行计算，而这些小问题的处理结果，经过处理可合并为原问题的最终结果。由于这些小问题的计算一般是可以并行完成的，从而可以缩短问题的处理时间。

高性能集群在计算过程中，各节点是协同工作的，它们分别处理大问题的一部分，并在处理中根据需要进行数据交换，各节点的处理结果都是最终结果的一部分。高性能集群的处理能力与集群的规模成正比，是集群内各节点处理能力之和，但这种集群一般没有高可用性。高性能计算的分类方法很多。这里从并行任务间的关系角度来对高性能计算分类。

一、高吞吐计算(High-throughput Computing)

有一类高性能计算，可以把它分成若干可以并行的子任务，而且各个子任务彼此间没有什么关联。因为这种类型应用的一个共同特征是在海量数据上搜索某些特定模式，所以把这类计算称为高吞吐计算。所谓的Internet计算都属于这一类。按照Flynn的分类，高吞吐计算属于SIMDSingle Instruction/Multiple Data，单指令流-多数据流)的范畴。

二、分布计算(Distributed Computing)

另一类计算刚好和高吞吐计算相反，它们虽然可以给分成若干并行的子任务，但是子任务间联系很紧密，需要大量的数据交换。按照Flynn的分类，分布式的高性能计算属于MIMD（Multiple Instruction/Multiple Data，多指令流-多数据流）的范畴。

有许多类型的HPC 系统，其范围从标准计算机的大型集群，到高度专用的硬件。大多数基于集群的HPC系统使用高性能网络互连，基本的网络拓扑和组织可以使用一个简单的总线拓扑。HPC系统由计算、存储、网络、集群软件四部分组成。

高性能计算HPC系统技术特点是什么？

HPC系统目前主流处理器是X86处理器，操作系统是linux 系统(包括Intel、AMD、NEC、Power、PowerPC、Sparc等)、构建方式采用刀片系统，互联网络使用IB和10GE。

高性能计算HPC集群中计算节点一般分3种: MPI节点、胖节点、GPU加速节点。双路节点称为瘦节点(MPI节点)，双路以上称为胖节点；胖节点配置大容量内存；集群中胖节点的数量要根据实际应用需求而定。

高性能计算应用的范围很广，比如，人工智能，生命科学，工业仿真，计算化学等等，高性能计算是这些行业的基础设施。所以题主不用担心，未来的就业前景很好呢

人勤春来早，瑞雪兆丰年。今天是正月初七，也是年后开工第一天，你准备好了吗？

新年新开始，瑞雪兆丰年，上班路上，大家都踩着瑞雪迎接新年第一天的工作。