前兩天剛入了一塊二手Radeon Vii,裝了Rocm2.9+Tensorflow1.15 。今天通過實戰評測,談談我的體驗。
一、背景小知識:
除了這個問題里的人之外,恐怕很多人都不知道,現在Nvidia已經不再是深度學習唯一的選擇了。AMD對標CUDA的產品ROCm經過2年多的發展,對tensorflow和pytorch都實現了原生支持,A家最近幾代GCN架構的顯卡都可以跑,但不包括最新出的5700這種RDNA架構卡。
在GCN架構的消費級顯卡中,卡皇當屬2019年2月發布、7月就停產的的Radeon Vii。這塊卡基於7nm工藝,能提供13.44TFLOPS的fp32算力,或者2倍於此的fp16算力,相比之下,RTX 2080ti的TFLOPS是13.4,2080是10.1,1080ti是11.3, 1080是8.9。Raveon vii的性能應該等於2080Ti,但售價只有一半。更奢侈的是,這卡配備了16G HBM2高速顯存,光顯存成本就佔了顯卡價格的一半,因此網友們都推測它其實是AMD計算卡Mi50的馬甲,短暫下放只是為了不在旗艦級消費市場掉隊,屬於賠本賺吆喝的範疇。
其實,既然麻花騰不會虧,蘇媽當然也不會虧,只有老黃賺大了,天下苦Nvidia久矣!
二、實戰評測
本體:我收的是一塊藍寶石廠牌的Radeon Vii,比最低價要貴幾百,但據說vbois和蘋果更兼容,這是我的一個強需求。
Baseline:由於手頭沒有2080或者2080ti,我只能祭出原先用的是一塊1080。講道理這塊卡我很喜歡,微星和賊船聯合出品的Sea Hawk一體水冷,靜音效果那叫一個棒。但是問題有二:顯存只有8G,finetune個Bert不便;MAC OS 10.14之後不支持N卡。兩點都是硬傷。
平台: 公平起見,兩塊卡都在以下平台上測試:6700K CPU,16G內存,Ubuntu-18.04,kernel-4.15,anaconda-2.7,tensorflow-1.15,cuda-10,cudnn-7.6,rocm-2.9。bare metal安裝,不用docker。
2.1 tensorflow官方benchmark
tf官方提供了一個benchmark repo ,內含大部分常見卷積網路。廢話不多說直接開跑,trainning examples/per sec對比如下,-部分是顯存不夠無法啟動。