剑客
关注科技互联网

深度学习三大硬件+四大学习库基准测试对比,指标全面呈现

1 新智元编译 1

来源:

译者:闻菲、胡祥杰

【重要通知:世界人工智能大会现场一律凭活动行二维码入场,不接受现金购票,分论坛票只有下午可以入场】 2016 世界人工智能大会活动行浏览过 5 万,大会售票进入尾声,还有一些已购票付款的公司和机构未换二维码。活动行在大会现场设有咨询席位,但提前换二维码节省签到时间。请团购注册的公司关注,务必提醒参会的同事们手机接收二维码,如果不清晰可以打印出来,现场在签到处换领大会嘉宾胸卡。

AI World 2016 世界人工智能大会 【倒计时 4 天,点击“阅读原文”抢票!!】 ? 业界领袖回溯60年AI历史,全球对话人工智能未来挑战,权威发布2016世界人工智能名人堂及中国人工智能产业发展报告;? 国际大咖“视频”远程参会, Bengio 和李飞飞联袂寄语中国人工智能;? 探秘讯飞超脑及华为诺亚方舟实验室,最强CTO与八大研究院院长交锋;? 滴滴CTO与百度首席架构师坐镇智能驾驶论坛,新智元三大圆桌阵容史无前例;? 中国“大狗”与"X-Dog"震撼亮相,龙泉寺机器僧“贤二”卖萌。

【新智元导读】深度学习计算该买哪款GPU,选择哪个平台?这篇文章为你提供对比指南。

购买用于运行深度学习算法的硬件时,我们常常找不到任何有用的基准,唯一的选择是买一个GPU然后用它来测试。现在市面上性能最好的GPU几乎都来自英伟达,但其中也有很多选择:是买一个新出的TITAN X Pascal还是便宜些的TITAN X Maxwell,又或是GTX 1080?本文中我们对几个最常见的英伟达GPU以及最常用的一些深度学习算法进行了基准测试。软件方面,我们比较了最近发布的四个开源深度学习库:Tensorflow v0.10.0、Neon v1.6.0、Caffe rc3以及caffe的英伟达版本NVcaffe v0.15.10。

GPU基准测试:GeForce GTX 1080 vs Titan X(Maxwell) vs Titan X (Pascal)

深度学习三大硬件+四大学习库基准测试对比,指标全面呈现

我们比较了GeForce GTX 1080、Titan X Maxwell和Titan X Pascal三款GPU,使用的深度学习库是Neon、Tensorflow和Caffe,深度学习网络是AlexNet、GoogleNet、OverFeat和VGG-A。

所有基准测试都使用64位系统,每个结果是100次迭代计算的平均时间。

基于库的测试结果

训练基准测试

使用四种库(Tensorflow,NVcaffe,Caffe,Neon)进行一次前向迭代和反向迭代的总时间[ms](越少越好)。结果如下:

深度学习三大硬件+四大学习库基准测试对比,指标全面呈现

推论基准测试

使用四种库(Tensorflow,NVcaffe,Caffe,Neon)进行一次前向迭代的总时间[ms](越少越好)。结果如下:

深度学习三大硬件+四大学习库基准测试对比,指标全面呈现

基于神经网络的测试结果

训练基准测试

使用四种神经网络(VGG-A, OverFeat,AlexNet, GoogLeNet)进行一次前向迭代和反向迭代的总时间(越少越好)。结果如下:

深度学习三大硬件+四大学习库基准测试对比,指标全面呈现

推论基准测试

使用四种神经网络(VGG-A, OverFeat,AlexNet, GoogLeNet)进行一次前向迭代的总时间(越少越好)。结果如下:

深度学习三大硬件+四大学习库基准测试对比,指标全面呈现

配置

深度学习三大硬件+四大学习库基准测试对比,指标全面呈现

基准测试工具

在Neon上进行基准测试使用的是neon库中的脚本neon/tests/run_benchmarks.py,在Tensorflow上使用的是convnet-benchmarks和不加修改的脚本convnet-benchmarks/tensorflow/benchmark_alexnet.py, convnet-benchmarks/tensorflow/benchmark_googlnet.py, convnet-benchmarks/tensorflow/benchmark_overfeat.py 以及 convnet-benchmarks/tensorflow/benchmark_vgg.py。Caffe使用的也是convnet-benchmarks,但对脚本convnet-benchmarks/caffe/run_imagenet.sh作了修改以指向我们的caffe安装。

深度学习库基准测试:Caffe vs Neon vsNVcaffe vs Tensorflow

同样,所有基准测试都使用64位系统,每个结果是100次迭代计算的平均时间。

基于GPU的测试结果

训练基准测试

使用四种GPU(Titan X Pascal, Titan X Maxwell, GeForce GTX 1080)进行一次前向迭代和反向迭代的总时间(越少越好)。结果如下:

深度学习三大硬件+四大学习库基准测试对比,指标全面呈现

推论基准测试

使用四种GPU(Titan X Pascal, Titan X Maxwell, GeForce GTX 1080)进行一次前向迭代的总时间(越少越好)。结果如下:

深度学习三大硬件+四大学习库基准测试对比,指标全面呈现

基于神经网络的测试结果

训练基准测试

使用四种神经网络(VGG-A, OverFeat,AlexNet, GoogLeNet)进行一次前向迭代和反向迭代的总时间(越少越好)。结果如下:

深度学习三大硬件+四大学习库基准测试对比,指标全面呈现

推论基准测试

使用四种神经网络(VGG-A, OverFeat, AlexNet,GoogLeNet)进行一次前向迭代的总时间(越少越好)。结果如下:

深度学习三大硬件+四大学习库基准测试对比,指标全面呈现

配置

深度学习三大硬件+四大学习库基准测试对比,指标全面呈现

基准测试工具

在Neon上进行基准测试使用的是neon库中的脚本neon/tests/run_benchmarks.py,在Tensorflow上使用的是convnet-benchmarks和不加修改的脚本convnet-benchmarks/tensorflow/benchmark_alexnet.py, convnet-benchmarks/tensorflow/benchmark_googlnet.py, convnet-benchmarks/tensorflow/benchmark_overfeat.py 以及 convnet-benchmarks/tensorflow/benchmark_vgg.py。Caffe使用的也是convnet-benchmarks,但对脚本convnet-benchmarks/caffe/run_imagenet.sh作了修改以指向我们的caffe安装。

深度学习三大硬件+四大学习库基准测试对比,指标全面呈现

豪华嘉宾阵容,共飨 AI 盛宴

深度学习三大硬件+四大学习库基准测试对比,指标全面呈现

深度学习三大硬件+四大学习库基准测试对比,指标全面呈现

深度学习三大硬件+四大学习库基准测试对比,指标全面呈现

7 大院长齐聚新智元智库院长圆桌论坛

2016世界人工智能大会技术论坛特设“新智元智库院长圆桌会议”,重量级研究院院长8仙过海,带来最前沿的AI研究动态、剖析技术发展趋势。

八位人工智能界“高手”现场过招,思想的激烈碰撞会给目前的人工智能发展带来哪些洞见?八位院长对行业的发展会有哪些前瞻揭秘?10月18日下午,2016 世界人工智能大会技术论坛,答案将逐层揭晓。

新智元智库院长圆桌汇集了中国人工智能产学研三界最豪华院长阵容:美团技术学院院长刘江担任主持人,微软亚洲工程院院长刘震、IBM中国研究院副院长邵凌、360人工智能研究院院长颜水成、北京理工大学计算机学院副院长黄华、Intel 中国研究院院长宋继强、新华网融媒体未来研究院院长杨溟联袂出席。

2016世界人工智能大会技术论坛议程

深度学习三大硬件+四大学习库基准测试对比,指标全面呈现

扫描二维码购票:

购票链接:http://www.huodongxing.com/go/aiworld2016

也可点击‘阅读原文’直接购票

票务联系 132·4023·6748

分享到:更多 ()

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址