只需一步,快速开始
手机号码,快捷登录
2020-6-25 20:35| 发布者: 南召修电视| 查看: 207| 评论: 0
图1. Transient仿真的基本原理流程
图2. ALPS-GT的基本理念
图3. GPU的算力显著高于CPU
Platinum 8180
Telsa V100
运算单元
28 physical cores
5376 FP64 cores
浮点计算能力
2T flops
7T flops
表1. 硬件运算能力对比
独有的智能矩阵切分技术,相较于传统仿真器,能够将总矩阵切割成更多的子矩阵,分配到各个CPU核去进行仿真,以提高CPU核的平均利用率。
包含较传统仿真器更多的Matrix solver供选择,对于每个子矩阵而言,自适应的选择特定的Matrix Solver可以得到更高的求解效率。当可供选择的Matrix Solver越多,那么每个子矩阵获得更高求解效率的概率也就越大。
运行时间(ms)
加速比
NV CUDA 求解器
SMS-GT 求解器
测例1
130
22
5.9X
测例2
116
46
2.5X
测例3
441
39
11.3X
测例4
171
48
3.6X
平均加速比
5.8X
表2. 矩阵分解性能对比
评论
|门户地图|手机版|小黑屋|家电维修论坛 ( 蜀ICP备14030498号 )
GMT+8, 2025-5-1 10:56
Powered by Discuz! X3.4
Copyright © 2001-2021, Tencent Cloud.