2017/1/5 更新

本篇文章是基于之前安装CUDA 7.5的经验写的,但因为最近更新TensorFlow 到了r0.12版本,官方提示该版本TensorFlow 和CUDA 8.0 & cudnnv5.1 配合的最好,所以又卸了CUDA 7.5,重新装了一遍CUDA 8.0,安装的过程中发现了之前文档里的些许不足,于是做了稍许修改。

PS:本来想在7.5的基础上更新到8.0,但是失败了。还把系统搞崩了,又重装了一遍Ubuntu,唉,说多了都是泪啊

CUDA7.5和CUDA8.0的安装过程是一毛一样的。所以如果安装CUDA8.0的同学,直接将下文中的所有7.5替换为8.0即可。


折腾了好多天,前后重装了大概六、七次Ubuntu,终于上把CUDA安装好了,被坑了好多次,也走了不少弯路。
第一次发帖,还请多指教。


【环境】
笔记本:ThinkPad T450X86_64
显卡:主显 Intel HD Graphics 5500 ; 独显 NVIDIA GT 940M
系统环境:Ubuntu14.04 64位、Windows7 64位 双系统
CUDA 版本: 7.5
其他:Ubuntu中不存在已经安装的CUDA

先说说自己遇到的大坑吧,安装完CUDA之后总是遇到登录界面循环问题:输入密码后又跳回密码输入界面。尝试了网上的多种说法无解,最终发现我的问题是出在双显卡这里。最后是在官方安装文档中找到了答案。

问题解决方案:
在安装cuda时,会出现提示,询问你是否需要安装openGL Libraries。如果你的电脑是双显,而且用来显示的那块GPU不是NVIDIA,则OpenGL Libraries就不应该安装,否则不是NVIDIA的那块GPU使用的OpenGL Libraries会被覆盖,然后GUI就无法工作了。


先谈谈关于安装CUDA的几点感受吧

关于 CUDA的安装,网上有特别多的安装帖子,我在安装的时候也参考了很多。你会发现网上很多的安装帖子,一般只做十几个操作就完事了。但是CUDA的官方安装文档却非常冗长,有四十多页,别觉得它是废话,其实都是干货。

网上的安装帖子之所以精炼,是因为它只涵盖了必须的安装步骤,跳过了许多的检查操作(例如:检查电脑中是否已安装CUDA需要依赖的软件、是否已经卸载会与CUDA产生冲突的软件)等。如果你足够幸运,电脑里上恰好该有的有,不该有的没有,那这么做没问题,但通常情况下你并没有那么走运。

CUDA这个东西需要依赖的、牵着的东西特别多,如果没有做好检查,则在安装时候特别容易出现各种各样的冲突,且一旦冲突发生,即使卸载CUDA也不能解决问题,只能重装系统。
我最后就是参考CUDA的官方文档安装成功的。


总结一下,我的安装建议是

1)一定要下一份CUDA官方的安装文档,按照它的步骤一步步慢慢来,不可偷懒
CUDA 7.5 官方安装文档下载
2)在安装之前一定要详细检查自己的系统环境、软件是否符合CUDA的安装要求。不要存有侥幸心理,跳过检查步骤
3)每进行一项操作,都检查一下该项操作是否成功

下面分享一下我的安装步骤。基本跟CUDA的官方安装文档的操作是一致的,不同的地方都有特别注明。

安装CUDA主要分三大环节。
一、安装前的环境准备和检查
二、安装CUDA
三、安装完的校验。

1、安装Ubuntu系统14.04

新安装完的14.04系统会提示很多更新项。
网上有很多帖子说不建议更新,说更新过后会导致安装CUDA发生系统界面循环登录的问题。
但是我更新后,并没有遇到任何问题。

2、检查自己的电脑环境是否具备安装CUDA的条件

a) 检查自己的GPU是否是CUDA-capable

在终端中输入:$ lspci | grep -i nvidia,会显示自己的NVIDIA GPU版本信息
去CUDA的官网查看自己的GPU版本是否在CUDA的支持列表中

b) 检查自己的Linux版本是否支持 CUDA(Ubuntu 14.04没问题)

c) 检查自己的系统中是否装了gcc

$gcc –version可以查看自己的gcc版本信息

d) 检查是否安装了kernel header和 package development

$uname –r可以查看自己的kernel版本信息
在终端中输入:$ sudo apt-get install linux-headers-$(uname -r)
可以安装对应kernel版本的kernel header和package development

以上检查我的电脑系统都满足要求,如果没有满足要求的话,可以参考cuda的官方文档,里面有详细的针对每个问题的解决方案。

3、 选择安装方式

CUDA提供两种安装方式:package manager安装和runfile安装
我本来选的是 package manager 安装,这种方法相对简单,但尝试了几次都失败。后来是转换到runfile安装才成功的。因此此处只介绍runfile安装方式。

下载cuda安装包:cuda官网下载,根据系统信息选择对应的版本,runfile安装的话最后一项要选择 runfile文件

CUDA 7.5 下载链接

4、runfile安装cuda

a) 禁用 nouveau

终端中运行:$ lsmod | grep nouveau,如果有输出则代表nouveau正在加载。

Ubuntu的nouveau禁用方法:
/etc/modprobe.d中创建文件blacklist-nouveau.conf,在文件中输入一下内容

 
 
  • 1
  • 2
  • 1
  • 2
blacklist nouveau options nouveau modeset=0

打开终端,运行

  
  
  • 1
    • 1
    $ sudo update-initramfs –u

    设置完毕可以再次运行$ lsmod | grep nouveau检查是否禁用成功,如果运行后没有任何输出,则代表禁用成功。

    b) 重启电脑,到达登录界面时,alt+ctrl+f1,进入text mode,登录账户

    c) 输入$ sudo service lightdm stop关闭图形化界面

    d) 切换到cuda安装文件的路径,运行$ sudo sh cuda_7.5.18_linux.run

    按照提示一步步操作

    遇到提示是否安装openGL ,选择no(如果你的电脑跟我一样是双显,且主显是非NVIDIA的GPU需要选择no,否则可以yes)
    其他都选择yes或者默认
    安装成功后,会显示installed,否则会显示Failed

    e) 输入$ sudo service lightdm start重新启动图形化界面。

    Alt + ctrl +F7,返回到图形化登录界面,输入密码登录。
    如果能够成功登录,则表示不会遇到循环登录的问题,基本说明CUDA的安装成功了。

    f) 重启电脑。检查Device Node Verification

    检查路径/dev下 有无存在名为nvidia*(以nvidia开头)的多个文件(device files)
    如果没有的话,可以参考官方文档里的指导步骤,进行添加。

    g) 设置环境变量。

    终端中输入$ sudo gedit /etc/profile
    在打开的文件末尾,添加以下两行。

      
      
  • 1
  • 2
  • $ export PATH=/usr/local/cuda-7.5/bin:$PATH $ export LD_LIBRARY_PATH=/cuda7.5/lib64

    保存文件。

    这里有点与官方安装文档稍有不同,需要说明:

    官方文档里说只需在终端中运行上述两条export语句即可,但如果不将它们不写入/etc/profile文件的话,这样的环境变量在你退出终端后就消失了,不起作用了,所以写入才是永久的做法。

    h) 重启电脑,检查上述的环境变量是否设置成功。

    终端中输入 :$ env
    在输出的环境变量中检查有无上述 g) 中设置的变量,如果有则代表设置成功。


    到此为止,CUDA的安装算是告一段落了。为了保险起见,建议进行下述的检查工作,确保真正的安装成功。

    5、 安装完毕后的检查工作。

    a) 检查 NVIDIA Driver是否安装成功

    终端输入 :$ cat /proc/driver/nvidia/version会输出NVIDIA Driver的版本号

    b) 检查 CUDA Toolkit是否安装成功

    $ nvcc –V会输出CUDA的版本信息

    c) 尝试编译cuda提供的例子

    切换到例子存放的路径,默认路径是~/NVIDIA_CUDA-7.5_Samples
    (即/home/xxx/ NVIDIA_CUDA-7.5_Samples, xxx是你自己的用户名)

    然后终端输入:$ make

    如果出现错误的话,则会立即报错停止,否则会开始进入编译阶段。
    我的第一次运行时出现了报错,提示的错误信息是系统中没有gcc
    然后在终端运行$ sudo apt-get install gcc安装完gcc后 再make就正常了
    整个编译的时间持续比较长,耐心等待,大概十几分钟是需要的。

    d) 运行编译生成的二进制文件。

    编译后的二进制文件 默认存放在~/NVIDIA_CUDA-7.5_Samples/bin中。
    切换路径 :cd ~/NVIDIA_CUDA-7.5_Samples/bin/x86_64/linux/release
    终端输入 :$ ./deviceQuery

    看到类似如下图片中的显示,则代表CUDA安装且配置成功(congratulation!!)

    再检查一下系统和CUDA-Capable device的连接情况
    终端输入 :$ ./sandwidthTest
    看到类似如下图片中的显示,则代表成功


    最后祝大家都能顺利安装CUDA~~

    Ubuntu 14.04 上安装 CUDA 7.5/8.0 超详细教程的更多相关文章

    1. android – 符合Nvidia Tegra profiler 2.0的移动设备

      解决方法通常任何基于Tegra4和K1的设备都可以工作,但我会推荐Nvidia的Shield/Note用于你的工作,不仅是他们退出便宜,而且他们的机器人留下了很多香草使它更容易使用.还有(可用的)更新策略的优点.

    2. PyTorch中的CUDA的操作方法

      这篇文章主要介绍了PyTorch中的CUDA的操作方法,CUDA是NVIDIA推出的异构计算平台,PyTorch中有专门的模块torch.cuda来设置和运行CUDA相关操作,更多相关介绍,需要的朋友可以查看下面文章内容

    3. 是否可以在另一个GPU(2 GPU系统)中处理数据

      我的算法需要对每个相机的数据进行长期处理,因此每个相机都需要访问相同的GPU内存问题在一个GPU中处理4个摄像头可能会导致内存不足。所以,我认为一个GPU只能处理两个摄像头。但在第一时间,如果cam3在GPU0处被处理,则cam3数据不能在GPU1处处理。我想将cam3数据从GPU0复制到GPU1,但它并没有那么小,所以看起来效率很低。是否可以在GPU1上使用GPU0数据进行处理而无需内存?我在CUDA方面很短,所以如果有好的关键词来解决这个问题,请告诉我。

    4. 如何编写CUDA内核来加速python代码

      几周来,我一直在学习python作为我的第一种编程语言。我决定用Numba编写一个乐透模拟。该代码在我的CPU上每秒大约250k次迭代时运行得很好。我真的很想看看它是如何在我的英伟达GPU上运行的,但我有点力不从心。如果有人能帮我一把,我将非常感激。我想我应该能够运行float16,因为数字并不复杂。此外,@vectorize似乎很重要。但是,老实说,我在踩水。

    5. 为什么cuGraphAddMemCopyNode已经获得了两个上下文,却需要额外的上下文?

      考虑CUDA图形API函数在此描述。它采用的CUDA_MEMCPY3D结构是一组非常广泛的参数。实际上,它包含两个上下文句柄字段:srcContext和dstContext,用于定义源和目标内存区域或数组的上下文。然而,该函数需要额外的第三个上下文句柄。但是,这意味着什么?节点是一个图,它通过具有上下文的流启动。除此之外,为什么这很重要?两个端点上下文应该足以让CUDA驱动程序执行复制。虽然大多数节点插入API函数都没有?

    6. windows – 未检测到支持CUDA的设备

      我是CUDA编程的新手,我完全陷入困境.当我尝试运行提供的deviceQuery实用程序或其中一个示例应用程序时,我收到以下错误:我使用的是Windows7,64位.我安装了VisualStudio2012,然后安装了CUDA5.064位.我的显卡是NVIDIAGeForceGTS250.今天我去了NVIDIA网站并重新安装了该卡的最新驱动程序.除了“确保安装了正在运行的驱动程序”之外,我在Win

    7. windows – 安装Tensorflow的问题 – 不是CUDA / CuDNN问题

      我最近开始进入Tensorflow,但我遇到了安装问题.每次我尝试导入它时,我都会收到以下错误我查看了与我有同样问题的其他堆栈溢出帖子,他们建议从NVIDIA获取CUDA库.问题是,我既没有NVIDIA显卡也没有GPU版本的张量流,所以我不认为这是问题所在.还有一些建议可以确保安装VisualStudio的Microsoft可再发行组件.如果这是一个基于系统变量的问题,我很感激帮助改变系统变量,因为我是新手.谢谢!

    8. 如何在Windows上模拟CUDA

      有没有什么方法可以从没有NVIDIA显卡的电脑上测试CUDA样品和代码?

    9. Windows – 编译没有Visual Studio的CUDA – “在路径中找不到编译器cl.exe”

      我刚刚在CUDA开始了一个小项目.我需要知道如下:是否可以编译CUDA代码而不使用/购买MicrosoftVisualStudio?使用Nvcc.exe我得到错误“找不到编译器cl.exe在路径”.我试图为NetBeans安装一个CUDAplugin,但它不起作用.(使用当前版本的NetBeans)平台:Windows7提前致谢.更新如评论中所述,Windows7之后的SDK版本不包括构建工具.如

    10. 在Ubuntu 12.10中安装cuda 5样本

      我正在安装cuda5样本:但是我收到这个错误:但:nvidia安装程序正在寻找什么?Ubuntu12.10中没有/usr/lib64:我也在运行Ubuntu12.10,我发现这个库在文件夹/usr/lib/x86_64-linux-gnu/之后安装freeglut3包.我也做了一个softlink,我已经能够安装CUDA5.0的例子:我还没有检查样品是否可以编辑.

    随机推荐

    1. crontab发送一个月份的电子邮件

      ubuntu14.04邮件服务器:Postfixroot收到来自crontab的十几封电子邮件.这些邮件包含PHP警告.>我已经解决了这些警告的原因.>我已修复每个cronjobs不发送电子邮件(输出发送到>/dev/null2>&1)>我删除了之前的所有电子邮件/var/mail/root/var/spool/mail/root但我仍然每小时收到十几封电子邮件.这些电子邮件来自cronjobs,

    2. 模拟两个ubuntu服务器计算机之间的慢速连接

      我想模拟以下场景:假设我有4台ubuntu服务器机器A,B,C和D.我想在机器A和机器C之间减少20%的网络带宽,在A和B之间减少10%.使用网络模拟/限制工具来做到这一点?

    3. ubuntu-12.04 – 如何在ubuntu 12.04中卸载从源安装的redis?

      我从源代码在Ubuntu12.04上安装了redis-server.但在某些时候它无法完全安装,最后一次makeinstallcmd失败.然后我刚刚通过apt包安装.现在我很困惑哪个安装正在运行哪个conf文件?实际上我想卸载/删除通过源安装的所有内容,只是想安装一个包.转到源代码树并尝试以下命令:如果这不起作用,您可以列出软件自行安装所需的步骤:

    4. ubuntu – “apt-get source”无法找到包但“apt-get install”和“apt-get cache”可以找到它

      我正在尝试下载软件包的源代码,但是当我运行时它无法找到.但是当我运行apt-cache搜索squid3时,它会找到它.它也适用于apt-getinstallsquid3.我使用的是Ubuntu11.04服务器,这是我的/etc/apt/sources.list我已经多次更新了.我尝试了很多不同的debs,并没有发现任何其他地方的错误.这里的问题是你的二进制包(deb)与你的源包(deb-src)不

    5. ubuntu – 有没有办法检测nginx何时完成正常关闭?

      &&touchrestarted),因为即使Nginx没有完成其关闭,touch命令也会立即执行.有没有好办法呢?这样的事情怎么样?因此,pgrep将查找任何Nginx进程,而while循环将让它坐在那里直到它们全部消失.你可以改变一些有用的东西,比如睡1;/etc/init.d/Nginx停止,以便它会休眠一秒钟,然后尝试使用init.d脚本停止Nginx.你也可以在某处放置一个计数器,这样你就可以在需要太长时间时发出轰击信号.

    6. ubuntu – 如何将所有外发电子邮件从postfix重定向到单个地址进行测试

      我正在为基于Web的应用程序设置测试服务器,该应用程序发送一些电子邮件通知.有时候测试是使用真实的客户数据进行的,因此我需要保证服务器在我们测试时无法向真实客户发送电子邮件.我想要的是配置postfix,以便它接收任何外发电子邮件并将其重定向到一个电子邮件地址,而不是传递到真正的目的地.我正在运行ubuntu服务器9.10.先感谢您设置本地用户以接收所有被困邮件:你需要在main.cf中添加:然后

    7. ubuntu – vagrant无法连接到虚拟框

      当我使用基本的Vagrantfile,只配置了两条线:我看到我的虚拟框打开,但是我的流氓日志多次显示此行直到超时:然后,超时后的一段时间,虚拟框框终于要求我登录,但是太久了!所以我用流氓/流氓记录.然后在我的物理机器上,如果我“流氓ssh”.没有事情发生,直到:怎么了?

    8. ubuntu – Nginx – 转发HTTP AUTH – 用户?

      我和Nginx和Jenkins有些麻烦.我尝试使用Nginx作为Jenkins实例的反向代理,使用HTTP基本身份验证.它到目前为止工作,但我不知道如何传递带有AUTH用户名的标头?}尝试将此指令添加到您的位置块

    9. Debian / Ubuntu – 删除后如何恢复/ var / cache / apt结构?

      我在ubuntu服务器上的空间不足,所以我做了这个命令以节省空间但是现在在尝试使用apt时,我会收到以下错误:等等显然我删除了一些目录结构.有没有办法做apt-getrebuild-var-tree或类似的?

    10. 检查ubuntu上安装的rubygems版本?

      如何查看我的ubuntu盒子上安装的rubygems版本?只是一个想法,列出已安装的软件包和grep为ruby或宝石或其他:)dpkg–get-selections

    返回
    顶部