一般来说,大家谈到caffe,都是基于CUDA在的NVIDIA显卡上运行的版本,其实有一个支持opencl的分支版本OpenCL Caffe。理论上这个版本的caffe可以运行在支持OpenCL并行计算框架的任何设备上(不限于显卡),因为这个分支版本目前还是试验性版本,所以之前一直没有尝试使用,今天想起来就试着在NVIDIA显卡编译OpenCL Caffe。
这里记下编译过程:

硬件配置

神舟Z7M-SL7D2笔记本
cpu Core i7-6700HQ(含集成显卡)
芯片组 Intel Hm170
独立显卡 NVIDIA GTX965M

软件环境

ubuntu 16.04
NVIDIA driver 378
CUDA8.0

安装OpenCL

对于NVIDIA显卡,只要正常安装了CUDA,就自动包含了OpenCL的支持,所以不需要另外的安装。

如果是Intel,AMD或其他的GPU显卡,就要安装相应的OpenCL支持,可以去对应的官网下载。

编译环境准备

安装编译OpenCL Caffe所需的依赖库,大部分依赖库与CUDA下编译是一样的,参见我的另一篇博文《Ubuntu16:cmake生成Makefile编译caffe过程(OpenBLAS/CPU+GPU)#编译环境准备》

#!/bin/bash
sudo apt-get install cmake cmake-gui #安装 cmake
sudo apt-get install libprotobuf-dev protobuf-compiler libleveldb-dev libsnappy-dev libopencv-dev libhdf5-serial-dev 
sudo apt-get install libboost-all-dev   // 安装boost库
#sudo apt-get install libatlas-base-dev //BLAS如使用OpenBLAS,可不安装
sudo apt-get install libopenblas-dev    //BLAS如使用atlas,可不安装
sudo apt-get install libgflags-dev libgoogle-glog-dev liblmdb-dev
sudo apt-get install python-numpy  // 安装numpy
#sudo apt-get install doxygen // doxygen用于文档生成 可不安装

唯一不同的是需要安装ViennaCL,ubuntu下安装ViennaCL也很简单:

sudo apt-get install libviennacl-dev

ViennaCL是一个用于并行矩阵计算库,ViennaCL在后台支持OpenCL、OpenMP和CUDA。

下载并编译Caffe

#!/bin/bash
# 下载Caffe代码到本地
git clone --recursive https://github.com/BVLC/caffe.git
# 检出opencl分支版本
git checkout opencl
cd caffe && mkdir build && cd build
# 在build下执行cmake生成Makefile 
# 指定BLAS使用OpenBLAS
cmake -DBLAS=Open .. 
# 如果使用atlas 则更简单
# cmake .. 
# 开始编译并安装到build/install文件夹下 并发8线程 提高编译速度
make install -j 8

经编译成功后运行ldd显示,caffe已经是基于cuda下的OpenCL动态库版本

MNIST训练测试

OpenCL Caffe编译成功后可以运行mnist手写体数字识别训练测试一下效果:

#!/bin/bash
cd caffe
# 下载MNIST训练数据
./data/mnist/get_mnist.sh
# 创建imdb格式数据
./examples/mnist/create_mnist.sh
# 开始训练
./build/tools/caffe  train --solver=examples/mnist/lenet_solver.prototxt
训练过程中运行nvidia-smi,显示GPU已经在满速运行中

参考

《Caffe-OpenCL在ubuntu16.04.2上的简要安装指南》

ubuntu16 CUDA 编译opencl caffe版本并通过mnist训练测试的更多相关文章

  1. 如何在Xcode 4.1中调试OpenCL内核?

    我有一些OpenCL内核没有做他们应该做的事情,我很想在Xcode中调试它们.这可能吗?当我在我的内核中使用printf()时,OpenCL编译器总是给我一大堆错误.解决方法将格式字符串转换为constchar*似乎可以解决此问题.这适用于Lion:这有上述错误:

  2. android – 符合Nvidia Tegra profiler 2.0的移动设备

    解决方法通常任何基于Tegra4和K1的设备都可以工作,但我会推荐Nvidia的Shield/Note用于你的工作,不仅是他们退出便宜,而且他们的机器人留下了很多香草使它更容易使用.还有(可用的)更新策略的优点.

  3. Android支持OpenCL吗?

    最近我想开发并行计算应用程序在Android上使用OpenCL.据我所知,Android系统不包括“libopencl.so”,但是仍然有一些网站或博客在Android上显示OpenCL开发.Android支持OpenCL吗?如果是这样,在Android上开发OpenCL应该怎么办?

  4. PyTorch实现MNIST数据集手写数字识别详情

    这篇文章主要介绍了PyTorch实现MNIST数据集手写数字识别详情,文章围绕主题展开详细的内容戒杀,具有一定的参考价值,需要的朋友可以参考一下

  5. pytorch实现mnist手写彩色数字识别

    这篇文章主要介绍了pytorch-实现mnist手写彩色数字识别,文章围绕主题展开详细的内容姐介绍,具有一定的参考价值,需要的小伙伴可以参考一下

  6. PyTorch中的CUDA的操作方法

    这篇文章主要介绍了PyTorch中的CUDA的操作方法,CUDA是NVIDIA推出的异构计算平台,PyTorch中有专门的模块torch.cuda来设置和运行CUDA相关操作,更多相关介绍,需要的朋友可以查看下面文章内容

  7. 女士们,先生们,大家好,有人试过用Adreno Gpu和pyhton代码吗?

    我需要使用AdrenoGPU进行深度学习而不是nvidia。有人知道怎么做吗?

  8. 是否可以在另一个GPU(2 GPU系统)中处理数据

    我的算法需要对每个相机的数据进行长期处理,因此每个相机都需要访问相同的GPU内存问题在一个GPU中处理4个摄像头可能会导致内存不足。所以,我认为一个GPU只能处理两个摄像头。但在第一时间,如果cam3在GPU0处被处理,则cam3数据不能在GPU1处处理。我想将cam3数据从GPU0复制到GPU1,但它并没有那么小,所以看起来效率很低。是否可以在GPU1上使用GPU0数据进行处理而无需内存?我在CUDA方面很短,所以如果有好的关键词来解决这个问题,请告诉我。

  9. 如何编写CUDA内核来加速python代码

    几周来,我一直在学习python作为我的第一种编程语言。我决定用Numba编写一个乐透模拟。该代码在我的CPU上每秒大约250k次迭代时运行得很好。我真的很想看看它是如何在我的英伟达GPU上运行的,但我有点力不从心。如果有人能帮我一把,我将非常感激。我想我应该能够运行float16,因为数字并不复杂。此外,@vectorize似乎很重要。但是,老实说,我在踩水。

  10. 为什么cuGraphAddMemCopyNode已经获得了两个上下文,却需要额外的上下文?

    考虑CUDA图形API函数在此描述。它采用的CUDA_MEMCPY3D结构是一组非常广泛的参数。实际上,它包含两个上下文句柄字段:srcContext和dstContext,用于定义源和目标内存区域或数组的上下文。然而,该函数需要额外的第三个上下文句柄。但是,这意味着什么?节点是一个图,它通过具有上下文的流启动。除此之外,为什么这很重要?两个端点上下文应该足以让CUDA驱动程序执行复制。虽然大多数节点插入API函数都没有?

随机推荐

  1. crontab发送一个月份的电子邮件

    ubuntu14.04邮件服务器:Postfixroot收到来自crontab的十几封电子邮件.这些邮件包含PHP警告.>我已经解决了这些警告的原因.>我已修复每个cronjobs不发送电子邮件(输出发送到>/dev/null2>&1)>我删除了之前的所有电子邮件/var/mail/root/var/spool/mail/root但我仍然每小时收到十几封电子邮件.这些电子邮件来自cronjobs,

  2. 模拟两个ubuntu服务器计算机之间的慢速连接

    我想模拟以下场景:假设我有4台ubuntu服务器机器A,B,C和D.我想在机器A和机器C之间减少20%的网络带宽,在A和B之间减少10%.使用网络模拟/限制工具来做到这一点?

  3. ubuntu-12.04 – 如何在ubuntu 12.04中卸载从源安装的redis?

    我从源代码在Ubuntu12.04上安装了redis-server.但在某些时候它无法完全安装,最后一次makeinstallcmd失败.然后我刚刚通过apt包安装.现在我很困惑哪个安装正在运行哪个conf文件?实际上我想卸载/删除通过源安装的所有内容,只是想安装一个包.转到源代码树并尝试以下命令:如果这不起作用,您可以列出软件自行安装所需的步骤:

  4. ubuntu – “apt-get source”无法找到包但“apt-get install”和“apt-get cache”可以找到它

    我正在尝试下载软件包的源代码,但是当我运行时它无法找到.但是当我运行apt-cache搜索squid3时,它会找到它.它也适用于apt-getinstallsquid3.我使用的是Ubuntu11.04服务器,这是我的/etc/apt/sources.list我已经多次更新了.我尝试了很多不同的debs,并没有发现任何其他地方的错误.这里的问题是你的二进制包(deb)与你的源包(deb-src)不

  5. ubuntu – 有没有办法检测nginx何时完成正常关闭?

    &&touchrestarted),因为即使Nginx没有完成其关闭,touch命令也会立即执行.有没有好办法呢?这样的事情怎么样?因此,pgrep将查找任何Nginx进程,而while循环将让它坐在那里直到它们全部消失.你可以改变一些有用的东西,比如睡1;/etc/init.d/Nginx停止,以便它会休眠一秒钟,然后尝试使用init.d脚本停止Nginx.你也可以在某处放置一个计数器,这样你就可以在需要太长时间时发出轰击信号.

  6. ubuntu – 如何将所有外发电子邮件从postfix重定向到单个地址进行测试

    我正在为基于Web的应用程序设置测试服务器,该应用程序发送一些电子邮件通知.有时候测试是使用真实的客户数据进行的,因此我需要保证服务器在我们测试时无法向真实客户发送电子邮件.我想要的是配置postfix,以便它接收任何外发电子邮件并将其重定向到一个电子邮件地址,而不是传递到真正的目的地.我正在运行ubuntu服务器9.10.先感谢您设置本地用户以接收所有被困邮件:你需要在main.cf中添加:然后

  7. ubuntu – vagrant无法连接到虚拟框

    当我使用基本的Vagrantfile,只配置了两条线:我看到我的虚拟框打开,但是我的流氓日志多次显示此行直到超时:然后,超时后的一段时间,虚拟框框终于要求我登录,但是太久了!所以我用流氓/流氓记录.然后在我的物理机器上,如果我“流氓ssh”.没有事情发生,直到:怎么了?

  8. ubuntu – Nginx – 转发HTTP AUTH – 用户?

    我和Nginx和Jenkins有些麻烦.我尝试使用Nginx作为Jenkins实例的反向代理,使用HTTP基本身份验证.它到目前为止工作,但我不知道如何传递带有AUTH用户名的标头?}尝试将此指令添加到您的位置块

  9. Debian / Ubuntu – 删除后如何恢复/ var / cache / apt结构?

    我在ubuntu服务器上的空间不足,所以我做了这个命令以节省空间但是现在在尝试使用apt时,我会收到以下错误:等等显然我删除了一些目录结构.有没有办法做apt-getrebuild-var-tree或类似的?

  10. 检查ubuntu上安装的rubygems版本?

    如何查看我的ubuntu盒子上安装的rubygems版本?只是一个想法,列出已安装的软件包和grep为ruby或宝石或其他:)dpkg–get-selections

返回
顶部