关于深度学习的Nvidia的GPU加速网络训练参数性能测试
英伟达RTX 30系列已出,有预算的,建议直接30系列了
深度学习的GPU型号和参数选择
深度学习注重的参数有两个,分别是显存带宽和单精度浮点计算能力(这里不考虑双精度浮点计算能力)
显存带宽计算涉及到的显卡参数:显存位宽(位)、显存频率(Mhz)
单精度浮点据算能力涉及到的显卡参数:显卡主频(Mhz)、cuda核心
下面介绍常见的几种显卡参数:
| 显卡型号 | 显存 | 单精度计算能力 | 显存带宽 |
|---|---|---|---|
| 主频xCuda核心数x2/1000 (TFlops) | 显存位宽x显存频率/8/1000(Gb/s) | ||
| 1060 | 6G | 1.582x1280x2=4.05 | 192.2 |
| 1660ti | 6G | 1.580x1536x2=4.85 | 288 |
| 1070 | 8G | 1.566x1920x2=5.78 | 256.32 |
| 1070ti | 8G | 1.607x2432x2=7.85 | 256 |
| 1080 | 8G | 1.607x2560x2=8.23 | 320 |
| 1080ti | 11G | 1.480x3584x2=10.61 | 484.4 |
| 2060 | 8G | 1.365x1920x2=5.24 | 336 |
| 2070 | 8G | 1.410x2304x2=6.51 | 448 |
| 2070 Super | 8G | 1.410x2560x2=7.22 | 448 |
| 2080 | 8G | 1.515x2944x2=8.92 | 448 |
| 2080 Super | 8G | 1.650x3072x2=11.65 | 448 |
| 2080ti | 11G | 1.350x4352x2=11.75 | 616 |
| 3070 | 8G | 1.730x5888x2=20.40 | 448 |
| 3080 | 10G | 1.71x8704x2=29.80 | 760 |
| 3090 | 24G | 1.70x10496x2=35.70 | 936 |
| Titan X (Maxwell架构) | 12G | 1.000x3072x2=6.14 | 336.6 |
| Titan X (Pacsal架构) | 12G | 1.418x3584x2=10.16 | 336.58 |
| Titan XP | >12G | 1.582x3840x2=12.15 | 547.7 |
| Titan V | >12G | 1.200x5120x2=15.36 | 652.8 |
根据整理的以上数据
- 推荐入门级别的选择2060的8GB,计算力和显存带宽都是最低价格也是最低
- 其次性能较好的就是2070Super,拥有8GB显存,带宽较大,cuda核心数也增多
- 如果是做图像方面的深度学习,那么标配起步就是1080ti,11GB显存,可以训练更深的网络,cuda核心较多计算力较强,带宽不用多说也是很大(本人18年购买的1080ti显卡,目前已经停产)
- 此外Titan X(Maxwell)架构的显卡不推荐购买,购买的时候要注意,这款显卡比较老是28nm工艺了,计算力和带宽表现都很差。
根据实际测试1080ti、2070、3070
运行相同的代码所用时间对比,并不能完全依照上述单精度计算能力来对比速度
| 显卡型号 | 单精度计算力 | 测试结果 |
|---|---|---|
| 1080ti | 10.61 | 165s |
| 2070 | 6.51 | 194s |
| 3070 | 20.40 | 154s |
版权声明:本文为Deeachain原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。