为何一座国产超算中心打不过8张nvidia A100计算卡?(二)
(接上篇)
在与nvlink性能差5个数量级的情况下,超算中心居然能战平8张nvidia A100,说明中国的软件优化团队确实很给力,从5个数量级的性能差距提高到了3个数量级的性能差距。但是在无力改变cpu计算性能依然只能依赖分布式结构的情况下,只能想办法提高网络的iops性能,那么方案只能是唯一的如下所示。
1.使用eth网络提高细粒度任务调度效率,eth可以实现64字节小包,因此相比4K甚至64K的IB,他的效率可以提升1000倍,虽然不及nvlink,但相比IB依然可以提高3个数量级的带宽利用效率还是有一定意义的。
2. 使用异数OS操作系统提升操作系统IOPS性能2到4个数量级,这样才能充分发挥eth网络的io性能,实现200G到1.6T的eth网络性能,而传统的操作系统仅能满足100M eth网络的性能需要。
目前异数OS MR Lab 的元宇宙Demo已在Steam发布,设计带宽200G到1.6T,十万人同服同屏,全球唯一,欢迎体验研究。
(接上篇)
在与nvlink性能差5个数量级的情况下,超算中心居然能战平8张nvidia A100,说明中国的软件优化团队确实很给力,从5个数量级的性能差距提高到了3个数量级的性能差距。但是在无力改变cpu计算性能依然只能依赖分布式结构的情况下,只能想办法提高网络的iops性能,那么方案只能是唯一的如下所示。
1.使用eth网络提高细粒度任务调度效率,eth可以实现64字节小包,因此相比4K甚至64K的IB,他的效率可以提升1000倍,虽然不及nvlink,但相比IB依然可以提高3个数量级的带宽利用效率还是有一定意义的。
2. 使用异数OS操作系统提升操作系统IOPS性能2到4个数量级,这样才能充分发挥eth网络的io性能,实现200G到1.6T的eth网络性能,而传统的操作系统仅能满足100M eth网络的性能需要。
目前异数OS MR Lab 的元宇宙Demo已在Steam发布,设计带宽200G到1.6T,十万人同服同屏,全球唯一,欢迎体验研究。