ubuntu+cuda8.0+opencv3 Caffe GPU环境配置

2020-06-21 原文

最近临近中期答辩，在总结一些以前碰到过的坑，以便后人乘凉。回顾了一下去年配置caffe的完整流程，去年双11买的神舟z7m电脑，性价比很高，显卡是GTX965m的，查了计算能力达5.2，刚买回来后就开始捣腾caffe环境下的配置。当时配置过程一波三折，主要卡在显卡驱动这一环节，因为Ubuntu对Nvidia显卡驱动的支持似乎不是很好。下面给出完整的配置流程。

一、安装Ubuntu系统

注意很多教程都选择14.04的版本，但其实它对一些较新的显卡支持并不好。我最开始用的14.04的版本，用尽各种方法安装965m的驱动，重启后要不就是进不了桌面，要不就是循环登录。为此还找了各种乱七八糟的解决办法，什么bumblebee都试过了，没有卵用。考虑到在windows下已经配好了其它可用的框架，在我正打算放弃的时候，我决定用16.04的系统试试，不行就算了。不尝试不知道，安装了16.04的Ubuntu后，显卡驱动安装完后重启成功进入桌面，没有出现各种乱七八糟的奇怪现象。我的结论是：解决版本的兼容性远比通过其它方法来的重要。只要版本能对上，比如Ubuntu16.04能支持GTX965m，那么安上驱动基本不会有问题，根本不需要什么改bios，装bumblebee等其它东西。

制作系统盘，分好空闲500g，然后bios设置u盘启动装Ubuntu双系统。安装过程，注意几点：1）建议语言选择英文版，之前有一次配cpu环境，用英文版的没问题，用中文的就不行了，原因未明；2）分区采取自定义，我是256Mboot，2Gswap，500ghome，剩下的是根分区；第三方软件可以不装，不影响。

此外，应该不少人在u盘安装的时候卡在了Ubuntu的logo界面，那是因为其内置的显卡驱动不支持较新的显卡，用集显启动没有问题，或者直接在选择界面按e，然后在启动参数quietsplash--的两个斜杠去掉，改为nomodeset，按F10即可进入安装界面。其次安装完系统后的那次重启也需要用nomodeset启动才能进入，进入系统后立即修改启动参数：sudovim/etc/modprobe.d/blacklist.conf，最后一行加上blacklistnouveau屏蔽自带驱动，系统便会从集显启动从而成功进入系统，不用每次都再修改启动参数。

新系统启动后，先做几个事情：

安装完整版vim，否则自带的vim方向键会错乱：

sudoapt-getremovevim-common

sudoapt-getinstallvim

设置root密码：

sudopasswdroot

安装必备：

sudoapt-getinstallbuild-essentials

二、安装Nvidia显卡

建议如果是较新的显卡，那么就选择Ubuntu16.04吧，然后在系统设置-》软件更新的附加驱动处进行安装，我装的是系统推荐的Nvidia367.57，安装完重启即可进入桌面；又或者自己去官网搜型号并下载相应驱动run文件，在tty中关掉lightdm进行安装：sudoservicelightdmstop安装然后重启。无需改bios，无需其它附加软件。

安装完重启后，可以打开应用NvidiaSetting可以看到有多个选项，命令行中打：nvidia–smi可以出来显卡信息，cat/proc/driver/nvidia/version可以出来显卡驱动号，用sudoprime-selectquery可以查询当前使用的显卡（安装完或默认使用Nvidia显卡），用sudoprime-selectselectintel/nvidia可以切换显卡，建议不要再切了。

三、安装cuda

注意如果安装16.04的系统，仅支持cuda8.0，好像是官网说的吧。

sudoshcuda_8.0.27_linux.run–-override

一系列提示按照默认即可，注意其中的nvidia驱动就不要装了，以免覆盖最新的，因为cuda中的nvidia驱动不是最新的。按空格键可以快速跳过协议。

设置环境变量和动态链接库：

sudovim/etc/profile，文件末尾添加：

exportPATH=/usr/local/cuda/bin:$PATH

保存后sudosource/etc/profile生效

创建链接文件：sudovim/etc/ld.so.conf.d/cuda.conf，编辑：

/usr/local/cuda/lib64

保存后sudoldconfig生效

测试sample：

cd/home/hunterlew/NVIDIA_CUDA-8.0_Samples

sudomakeall–j4

据说cuda不支持gcc5.0以上，而16.04自带的超过了该版本，需要修改一个文件，但我的系统很奇怪并没有报错，直接就编译成功了。

编译无报错后，测试：

cd/home/hunterlew/NVIDIA_CUDA-8.0_Samples/bin/x86_64/linux/release

./deviceQuery

如果能打出关于显卡的一系列信息，说明显卡驱动和cuda的安装都没有问题。

四、cudnn安装

加速用，可以下载最新的cudnn-8.0-Linux-x64-v5.1，无脑操作：

tarzxvfcudnn-8.0-Linux-x64-v5.1.tgz

cdcuda/include

sudocpcudnn.h/usr/local/include

cd../lib64

sudocplib*/usr/local/cuda/lib64

（如果复制无效，尝试root权限）

cd/usr/local/cuda/lib64

sudorm–rflibcudnn.solibcudnn.so.5

sudoln–slibcudnn.so.5.0.5libcudnn.so.5

sudoln–slibcudnn.so.5libcudnn.so

五、OpenBLAS

线性代数程序库，加速用，也可以用atlas，intelMKL，可参考我的Ubuntu14.04caffe的cpu模式教程。

六、安装OpenCV

我安装的是3.0.0版本，可以上官网搜，有个大神写好了脚本，有最新的3版本。安装前先安装一些依赖，此处省略。用现成的脚本安装即可，先是依赖，然后再是安装和编译，具体可看脚本内容。注意，OpenCV的编译比较费时。

值得注意的是，cuda8和OpenCV3版本不兼容，会出现NppiGraphcutStatehasnotbeendeclared的错误，需要修改一个文件即可编译通过，网上可以找到，其它错误我没有发现。耐心等待吧…

七、安装Caffe

万事具备只欠东风。git最新的caffe：

sudoapt-getinstallgit

gitclonehttps://github.com/BVLC/caffe.git，进入目录修改makefile文件：

cd/home/hunterlew/caffe

cpMakefile.config.exampleMakefile.config

vimMakefile.config

有以下几个地方要修改：

1）USE_CUDNN:=1取消注释

2）BLAS:=open，这个根据自己的实际情况，如果是OpenBLAS的需要加上路径

3）OPENCV_VERSION:=3

4）INCLUDE_Dirs在后面加一个空格，加上/usr/include/hdf5/serial，否则会报一个找不到hdf5.h的错误。

然后就是编译安装：

cd/home/hunterlew/caffe

makeall–j4

maketest–j4

makeruntest

如果有需要用python接口，安装一些依赖。

sudoapt-getinstallpython-pip

cd/home/hunterlew/caffe/python

sudosu–

forreqin$(catrequirements.txt);dopipinstall$req;done

用pip安装很慢，可以用清华镜像源：

forreqin$(catrequirements.txt);

dopipinstall–ihttps://pypi.tuna.tsinghua.edu.cn/simple$req;

done

然后编译

makepycaffe

测试：在python终端下，importcaffe

八、测试MNIST：

cd/home/hunterlew/caffe

cddata/get_mnist.sh

shexample/mnist/create_mnist.sh

shexample/mnist/train_lenet.sh

可以看到网络开始训练。从脚本可以发现，必须在caffe根目录下运行才不会报错。

ubuntu+cuda8.0+opencv3 Caffe GPU环境配置的更多相关文章

android – 符合Nvidia Tegra profiler 2.0的移动设备

解决方法通常任何基于Tegra4和K1的设备都可以工作,但我会推荐Nvidia的Shield/Note用于你的工作,不仅是他们退出便宜,而且他们的机器人留下了很多香草使它更容易使用.还有(可用的)更新策略的优点.
PyTorch中的CUDA的操作方法

这篇文章主要介绍了PyTorch中的CUDA的操作方法，CUDA是NVIDIA推出的异构计算平台，PyTorch中有专门的模块torch.cuda来设置和运行CUDA相关操作，更多相关介绍，需要的朋友可以查看下面文章内容
是否可以在另一个GPU（2 GPU系统）中处理数据

我的算法需要对每个相机的数据进行长期处理，因此每个相机都需要访问相同的GPU内存问题在一个GPU中处理4个摄像头可能会导致内存不足。所以，我认为一个GPU只能处理两个摄像头。但在第一时间，如果cam3在GPU0处被处理，则cam3数据不能在GPU1处处理。我想将cam3数据从GPU0复制到GPU1，但它并没有那么小，所以看起来效率很低。是否可以在GPU1上使用GPU0数据进行处理而无需内存？我在CUDA方面很短，所以如果有好的关键词来解决这个问题，请告诉我。
如何编写CUDA内核来加速python代码

几周来，我一直在学习python作为我的第一种编程语言。我决定用Numba编写一个乐透模拟。该代码在我的CPU上每秒大约250k次迭代时运行得很好。我真的很想看看它是如何在我的英伟达GPU上运行的，但我有点力不从心。如果有人能帮我一把，我将非常感激。我想我应该能够运行float16，因为数字并不复杂。此外，@vectorize似乎很重要。但是，老实说，我在踩水。
为什么cuGraphAddMemCopyNode已经获得了两个上下文，却需要额外的上下文？

考虑CUDA图形API函数在此描述。它采用的CUDA_MEMCPY3D结构是一组非常广泛的参数。实际上，它包含两个上下文句柄字段：srcContext和dstContext，用于定义源和目标内存区域或数组的上下文。然而，该函数需要额外的第三个上下文句柄。但是，这意味着什么？节点是一个图，它通过具有上下文的流启动。除此之外，为什么这很重要？两个端点上下文应该足以让CUDA驱动程序执行复制。虽然大多数节点插入API函数都没有？
windows – 未检测到支持CUDA的设备

我是CUDA编程的新手,我完全陷入困境.当我尝试运行提供的deviceQuery实用程序或其中一个示例应用程序时,我收到以下错误：我使用的是Windows7,64位.我安装了VisualStudio2012,然后安装了CUDA5.064位.我的显卡是NVIDIAGeForceGTS250.今天我去了NVIDIA网站并重新安装了该卡的最新驱动程序.除了“确保安装了正在运行的驱动程序”之外,我在Win
windows-services – 使用本地系统以外的帐户配置Windows服务时,“允许服务与桌面交互”选项不可用

我想配置Windows服务,以便允许与桌面交互,而不管它配置为运行的帐户.怎么实现呢？这是一个很好的问题！
windows – 安装Tensorflow的问题 – 不是CUDA / CuDNN问题

我最近开始进入Tensorflow,但我遇到了安装问题.每次我尝试导入它时,我都会收到以下错误我查看了与我有同样问题的其他堆栈溢出帖子,他们建议从NVIDIA获取CUDA库.问题是,我既没有NVIDIA显卡也没有GPU版本的张量流,所以我不认为这是问题所在.还有一些建议可以确保安装VisualStudio的Microsoft可再发行组件.如果这是一个基于系统变量的问题,我很感激帮助改变系统变量,因为我是新手.谢谢！
如何在Windows上模拟CUDA

有没有什么方法可以从没有NVIDIA显卡的电脑上测试CUDA样品和代码？
Windows 8：以迷你日历显示周数

我知道的唯一方法是下载一个名为T-Clock的程序,它取代了标准时钟.一种让它工作的方法：>下载T-ClockApp>安装程序>打开程序后,在左侧确保选中.>其他–>选中“使用T-Clock的日历”和“显示周数”>点击“应用”–>“好”那它应该工作！如果其他人有任何其他想法我也会好奇！

随机推荐

crontab发送一个月份的电子邮件

ubuntu14.04邮件服务器：Postfixroot收到来自crontab的十几封电子邮件.这些邮件包含PHP警告.>我已经解决了这些警告的原因.>我已修复每个cronjobs不发送电子邮件(输出发送到>/dev/null2>&1)>我删除了之前的所有电子邮件/var/mail/root/var/spool/mail/root但我仍然每小时收到十几封电子邮件.这些电子邮件来自cronjobs,
模拟两个ubuntu服务器计算机之间的慢速连接

我想模拟以下场景：假设我有4台ubuntu服务器机器A,B,C和D.我想在机器A和机器C之间减少20％的网络带宽,在A和B之间减少10％.使用网络模拟/限制工具来做到这一点？
ubuntu-12.04 – 如何在ubuntu 12.04中卸载从源安装的redis？

我从源代码在Ubuntu12.04上安装了redis-server.但在某些时候它无法完全安装,最后一次makeinstallcmd失败.然后我刚刚通过apt包安装.现在我很困惑哪个安装正在运行哪个conf文件？实际上我想卸载/删除通过源安装的所有内容,只是想安装一个包.转到源代码树并尝试以下命令：如果这不起作用,您可以列出软件自行安装所需的步骤：
ubuntu – “apt-get source”无法找到包但“apt-get install”和“apt-get cache”可以找到它

我正在尝试下载软件包的源代码,但是当我运行时它无法找到.但是当我运行apt-cache搜索squid3时,它会找到它.它也适用于apt-getinstallsquid3.我使用的是Ubuntu11.04服务器,这是我的/etc/apt/sources.list我已经多次更新了.我尝试了很多不同的debs,并没有发现任何其他地方的错误.这里的问题是你的二进制包(deb)与你的源包(deb-src)不
ubuntu – 有没有办法检测nginx何时完成正常关闭？

&&touchrestarted),因为即使Nginx没有完成其关闭,touch命令也会立即执行.有没有好办法呢？这样的事情怎么样？因此,pgrep将查找任何Nginx进程,而while循环将让它坐在那里直到它们全部消失.你可以改变一些有用的东西,比如睡1;/etc/init.d/Nginx停止,以便它会休眠一秒钟,然后尝试使用init.d脚本停止Nginx.你也可以在某处放置一个计数器,这样你就可以在需要太长时间时发出轰击信号.
ubuntu – 如何将所有外发电子邮件从postfix重定向到单个地址进行测试

我正在为基于Web的应用程序设置测试服务器,该应用程序发送一些电子邮件通知.有时候测试是使用真实的客户数据进行的,因此我需要保证服务器在我们测试时无法向真实客户发送电子邮件.我想要的是配置postfix,以便它接收任何外发电子邮件并将其重定向到一个电子邮件地址,而不是传递到真正的目的地.我正在运行ubuntu服务器9.10.先感谢您设置本地用户以接收所有被困邮件：你需要在main.cf中添加：然后
ubuntu – vagrant无法连接到虚拟框

当我使用基本的Vagrantfile,只配置了两条线：我看到我的虚拟框打开,但是我的流氓日志多次显示此行直到超时：然后,超时后的一段时间,虚拟框框终于要求我登录,但是太久了！所以我用流氓/流氓记录.然后在我的物理机器上,如果我“流氓ssh”.没有事情发生,直到：怎么了？
ubuntu – Nginx – 转发HTTP AUTH – 用户？

我和Nginx和Jenkins有些麻烦.我尝试使用Nginx作为Jenkins实例的反向代理,使用HTTP基本身份验证.它到目前为止工作,但我不知道如何传递带有AUTH用户名的标头？}尝试将此指令添加到您的位置块
Debian / Ubuntu – 删除后如何恢复/ var / cache / apt结构？

我在ubuntu服务器上的空间不足,所以我做了这个命令以节省空间但是现在在尝试使用apt时,我会收到以下错误：等等显然我删除了一些目录结构.有没有办法做apt-getrebuild-var-tree或类似的？
检查ubuntu上安装的rubygems版本？

如何查看我的ubuntu盒子上安装的rubygems版本？只是一个想法,列出已安装的软件包和grep为ruby或宝石或其他:)dpkg–get-selections