训练

RTX 4090的方案探讨

2023-04-10 20:50:50 gx 237

随着4090显卡的上市,由于其强大的单精度算力88TFlops

赢得很多对精度要求不高且预算有限的客户青睐


但是各家工厂出品的4090在功耗和性能上少许有些差异

大部分功能的限制是通过vBios来操控的


(TDP差异≠较大的性能差异)

目前大部分多风扇游戏卡 TDP是450,实际跑在420-450之间

部分带超频功能的游戏卡,TDP上限设置在标称550,实际上还是跑在450左右

但是大部分服务器在使用的涡轮卡,标称TDP是450,实际跑在370W左右

我猜测还是为了长久的稳定运行而设定的


下图GPUBURN的算力值做个参考(≠AI场景下的算力)


高性能工作站服务器找我们

高性能工作站服务器找我们




我们看到56xxx参数的是跑在450W TDP


高性能工作站服务器找我们

高性能工作站服务器找我们





通过命令看到内部的设置

部分显卡吧瞬间的峰值限制在480w内

但是也有显卡把瞬间的峰值设置在600w


高性能工作站服务器找我们



高性能工作站服务器找我们



高性能工作站服务器找我们

解决方案