深度学习的GPU型号和参数选择

关于深度学习的Nvidia的GPU加速网络训练参数性能测试
英伟达RTX 30系列已出,有预算的,建议直接30系列了

深度学习的GPU型号和参数选择

深度学习注重的参数有两个,分别是显存带宽和单精度浮点计算能力(这里不考虑双精度浮点计算能力)
显存带宽计算涉及到的显卡参数:显存位宽(位)、显存频率(Mhz)
单精度浮点据算能力涉及到的显卡参数:显卡主频(Mhz)、cuda核心

下面介绍常见的几种显卡参数:

显卡型号显存单精度计算能力显存带宽
主频xCuda核心数x2/1000 (TFlops)显存位宽x显存频率/8/1000(Gb/s)
10606G1.582x1280x2=4.05192.2
1660ti6G1.580x1536x2=4.85288
10708G1.566x1920x2=5.78256.32
1070ti8G1.607x2432x2=7.85256
10808G1.607x2560x2=8.23320
1080ti11G1.480x3584x2=10.61484.4
20608G1.365x1920x2=5.24336
20708G1.410x2304x2=6.51448
2070 Super8G1.410x2560x2=7.22448
20808G1.515x2944x2=8.92448
2080 Super8G1.650x3072x2=11.65448
2080ti11G1.350x4352x2=11.75616
30708G1.730x5888x2=20.40448
308010G1.71x8704x2=29.80760
309024G1.70x10496x2=35.70936
Titan X (Maxwell架构)12G1.000x3072x2=6.14336.6
Titan X (Pacsal架构)12G1.418x3584x2=10.16336.58
Titan XP>12G1.582x3840x2=12.15547.7
Titan V>12G1.200x5120x2=15.36652.8

根据整理的以上数据

  • 推荐入门级别的选择2060的8GB,计算力和显存带宽都是最低价格也是最低
  • 其次性能较好的就是2070Super,拥有8GB显存,带宽较大,cuda核心数也增多
  • 如果是做图像方面的深度学习,那么标配起步就是1080ti,11GB显存,可以训练更深的网络,cuda核心较多计算力较强,带宽不用多说也是很大(本人18年购买的1080ti显卡,目前已经停产)
  • 此外Titan X(Maxwell)架构的显卡不推荐购买,购买的时候要注意,这款显卡比较老是28nm工艺了,计算力和带宽表现都很差。

根据实际测试1080ti、2070、3070

运行相同的代码所用时间对比,并不能完全依照上述单精度计算能力来对比速度

显卡型号单精度计算力测试结果
1080ti10.61165s
20706.51194s
307020.40154s

版权声明:本文为Deeachain原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。