并行计算时节点分配核数有最优方式吗? | 您所在的位置:网站首页 › fluent并行计算核数问题 › 并行计算时节点分配核数有最优方式吗? |
贴一下我这边测试的结果,同一个案例计算到某个固定步数,总共48核。测试时任何机器上没有别的作业,机器之间是IB网络。 单节点:1200s 双节点:24+24,810s;47+1,1190s 三节点:16+16+16,670s;2+5+41,1060s 四节点:12+12+12+12,720s;2+3+8+35,940s 总结下来,一是均匀分配核数确实比不均匀要快,这点得到了证实。 二是多节点并行比单节点在均匀分配核数的情况下居然还要快,可能是因为多节点的时候机器上没有别的作业从而用了更多的计算性能? 三是多节点并行似乎也有最优的节点数量。 第二和第三点我猜测可能跟网格量、求解器、机器的内存等等都有关系,比较复杂。想请教一下,多节点并行除了通信占用的时间外,是否还有其他比较大的影响因素呢? |
CopyRight 2018-2019 实验室设备网 版权所有 |