Proxmox环境下 Ubuntu16.04 + CUDA 8.0 GA2 安装

2020-07-04 原文

proxmox虚拟机的配置

工作站配置
系统	proxmox
硬件	NVIDIA K80 x1
	集成显卡 x1

1. 创建VM

根据一路下一步，留意自己主机的类型和网络的配置

2. 手工补充配置

找到 /usr/pve/qemu-server/xxx.conf xxx是你的VM编号（VM ID）. 添加如下三行
bios: ovmf hostpci0: 0x:00,pcie=1 machine:q35
x是你的NVIDIA显卡的编号。通过lspci | grep -i nvidia 查看。

3. 添加 efi 硬盘

非常重要，这样才能保证启动的时候不会出错. 步骤：
在浏览器打开创建好的VM，Hardware -> Add -> EFI disk

4. 启动虚拟机

5. 安装Ubuntu

在选择安装方式的时候，选择lvm！

6. 进入Ubuntu

在设置->附加源 中可以看到显卡，然后运行下面的指令更新系统

sudo apt update
sudo apt upgrade
sudo apt-get install linux-headers-$(uname -r)
reboot

PART ONE END

VM部分（Ubuntu16.04）安装 CUDA 8.0 GA2

这个部分将引导你安装 CUDA 8.0 GA2
所有操作都在虚拟机内执行

直接安装 CUDA 8.0 GA2 存在问题.
kernel-source-path 的错误
通过安装 header 不能解决
所以，首先安装 CUDA 9.0

安装 CUDA 9.0

1. 下载 run file

选择 CUDA 9.0
比较容易失败，建议将点击后得到的链接放到迅雷里下载

2. 安装

这里我们有多块显卡，其中集成显卡用于VNC链接时的显示，NVIDIA 用于计算，因此不需要屏蔽 nouveau

sudo sh cuda_9.0.176_384.81_linux.run --no-opengl-libs

进入交互式的安装流程。遇到xconfig选项时，选择不要安装（no）。其余都选择默认。

3. 重启

4. 输入 `nvidia-smi` 可以看到显卡信息

安装 CUDA 8.0 GA2

1. 下载 runfile

选择 CUDA 8.0 GA2

2. 安装

同理，不需要屏蔽 nouveau

sudo sh cuda_8.0.61_375.26_linux.run --no-opengl-libs

不要再次安装驱动！ driver的问题，选择（no），xonfig的问题选择（no），其余都选择默认。

3. 配置环境变量

编辑 ~/.bashrc
在末尾加入

# for CUDA 8
 export PATH=/usr/local/cuda-8.0/bin${PATH:+:${PATH}}
  export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64\
 ${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

这样 CUDA 8.0 就能使用了。

4. 检验

关闭终端再打开，输入 nvcc -V 能够看到 nvcc的版本

PART TWO END

结

安装 CUDA 8 碰到 kernel source 无法访问。补充了头文件，也是没用。就想起上次安装成功的时候，是先装了 CUDA 9 再装的 CUDA 8，没有遇到同样的问题。所以这次重装，由如法炮制果然有效。

这是一种很没有效率，也无道理可言的解决方案。

你在安装 CUDA 8 的时候，能够解决这个问题，欢迎在评论中留言。

END

Proxmox环境下 Ubuntu16.04 + CUDA 8.0 GA2 安装的更多相关文章

PyTorch中的CUDA的操作方法

这篇文章主要介绍了PyTorch中的CUDA的操作方法，CUDA是NVIDIA推出的异构计算平台，PyTorch中有专门的模块torch.cuda来设置和运行CUDA相关操作，更多相关介绍，需要的朋友可以查看下面文章内容
是否可以在另一个GPU（2 GPU系统）中处理数据

我的算法需要对每个相机的数据进行长期处理，因此每个相机都需要访问相同的GPU内存问题在一个GPU中处理4个摄像头可能会导致内存不足。所以，我认为一个GPU只能处理两个摄像头。但在第一时间，如果cam3在GPU0处被处理，则cam3数据不能在GPU1处处理。我想将cam3数据从GPU0复制到GPU1，但它并没有那么小，所以看起来效率很低。是否可以在GPU1上使用GPU0数据进行处理而无需内存？我在CUDA方面很短，所以如果有好的关键词来解决这个问题，请告诉我。
如何编写CUDA内核来加速python代码

几周来，我一直在学习python作为我的第一种编程语言。我决定用Numba编写一个乐透模拟。该代码在我的CPU上每秒大约250k次迭代时运行得很好。我真的很想看看它是如何在我的英伟达GPU上运行的，但我有点力不从心。如果有人能帮我一把，我将非常感激。我想我应该能够运行float16，因为数字并不复杂。此外，@vectorize似乎很重要。但是，老实说，我在踩水。
为什么cuGraphAddMemCopyNode已经获得了两个上下文，却需要额外的上下文？

考虑CUDA图形API函数在此描述。它采用的CUDA_MEMCPY3D结构是一组非常广泛的参数。实际上，它包含两个上下文句柄字段：srcContext和dstContext，用于定义源和目标内存区域或数组的上下文。然而，该函数需要额外的第三个上下文句柄。但是，这意味着什么？节点是一个图，它通过具有上下文的流启动。除此之外，为什么这很重要？两个端点上下文应该足以让CUDA驱动程序执行复制。虽然大多数节点插入API函数都没有？
windows – 未检测到支持CUDA的设备

我是CUDA编程的新手,我完全陷入困境.当我尝试运行提供的deviceQuery实用程序或其中一个示例应用程序时,我收到以下错误：我使用的是Windows7,64位.我安装了VisualStudio2012,然后安装了CUDA5.064位.我的显卡是NVIDIAGeForceGTS250.今天我去了NVIDIA网站并重新安装了该卡的最新驱动程序.除了“确保安装了正在运行的驱动程序”之外,我在Win
windows – 安装Tensorflow的问题 – 不是CUDA / CuDNN问题

我最近开始进入Tensorflow,但我遇到了安装问题.每次我尝试导入它时,我都会收到以下错误我查看了与我有同样问题的其他堆栈溢出帖子,他们建议从NVIDIA获取CUDA库.问题是,我既没有NVIDIA显卡也没有GPU版本的张量流,所以我不认为这是问题所在.还有一些建议可以确保安装VisualStudio的Microsoft可再发行组件.如果这是一个基于系统变量的问题,我很感激帮助改变系统变量,因为我是新手.谢谢！
如何在Windows上模拟CUDA

有没有什么方法可以从没有NVIDIA显卡的电脑上测试CUDA样品和代码？
Windows – 编译没有Visual Studio的CUDA – “在路径中找不到编译器cl.exe”

我刚刚在CUDA开始了一个小项目.我需要知道如下：是否可以编译CUDA代码而不使用/购买MicrosoftVisualStudio？使用Nvcc.exe我得到错误“找不到编译器cl.exe在路径”.我试图为NetBeans安装一个CUDAplugin,但它不起作用.(使用当前版本的NetBeans)平台：Windows7提前致谢.更新如评论中所述,Windows7之后的SDK版本不包括构建工具.如
在Ubuntu 12.10中安装cuda 5样本

我正在安装cuda5样本：但是我收到这个错误：但：nvidia安装程序正在寻找什么？Ubuntu12.10中没有/usr/lib64：我也在运行Ubuntu12.10,我发现这个库在文件夹/usr/lib/x86_64-linux-gnu/之后安装freeglut3包.我也做了一个softlink,我已经能够安装CUDA5.0的例子：我还没有检查样品是否可以编辑.
Ubuntu18+cuda9.0+cudnn+tensorflow+GPU1080Ti+protobuf-3.6.0

环境：ubuntu18.04LTS，python3.6.5目标环境：cuda9.0cuDNN7.0.5_for_cuda9.0tensorflow任意依照https://blog.csdn.net/ShellDawn/article/details/80274534我也安装了一些依赖项：sudoapt-getinstallfreeglut3-devbuild-essentiallibx11libxmulibxilibgl1-mesa-glxlibglu1-mesalibfreeimage3libfreei

随机推荐

crontab发送一个月份的电子邮件

ubuntu14.04邮件服务器：Postfixroot收到来自crontab的十几封电子邮件.这些邮件包含PHP警告.>我已经解决了这些警告的原因.>我已修复每个cronjobs不发送电子邮件(输出发送到>/dev/null2>&1)>我删除了之前的所有电子邮件/var/mail/root/var/spool/mail/root但我仍然每小时收到十几封电子邮件.这些电子邮件来自cronjobs,
模拟两个ubuntu服务器计算机之间的慢速连接

我想模拟以下场景：假设我有4台ubuntu服务器机器A,B,C和D.我想在机器A和机器C之间减少20％的网络带宽,在A和B之间减少10％.使用网络模拟/限制工具来做到这一点？
ubuntu-12.04 – 如何在ubuntu 12.04中卸载从源安装的redis？

我从源代码在Ubuntu12.04上安装了redis-server.但在某些时候它无法完全安装,最后一次makeinstallcmd失败.然后我刚刚通过apt包安装.现在我很困惑哪个安装正在运行哪个conf文件？实际上我想卸载/删除通过源安装的所有内容,只是想安装一个包.转到源代码树并尝试以下命令：如果这不起作用,您可以列出软件自行安装所需的步骤：
ubuntu – “apt-get source”无法找到包但“apt-get install”和“apt-get cache”可以找到它

我正在尝试下载软件包的源代码,但是当我运行时它无法找到.但是当我运行apt-cache搜索squid3时,它会找到它.它也适用于apt-getinstallsquid3.我使用的是Ubuntu11.04服务器,这是我的/etc/apt/sources.list我已经多次更新了.我尝试了很多不同的debs,并没有发现任何其他地方的错误.这里的问题是你的二进制包(deb)与你的源包(deb-src)不
ubuntu – 有没有办法检测nginx何时完成正常关闭？

&&touchrestarted),因为即使Nginx没有完成其关闭,touch命令也会立即执行.有没有好办法呢？这样的事情怎么样？因此,pgrep将查找任何Nginx进程,而while循环将让它坐在那里直到它们全部消失.你可以改变一些有用的东西,比如睡1;/etc/init.d/Nginx停止,以便它会休眠一秒钟,然后尝试使用init.d脚本停止Nginx.你也可以在某处放置一个计数器,这样你就可以在需要太长时间时发出轰击信号.
ubuntu – 如何将所有外发电子邮件从postfix重定向到单个地址进行测试

我正在为基于Web的应用程序设置测试服务器,该应用程序发送一些电子邮件通知.有时候测试是使用真实的客户数据进行的,因此我需要保证服务器在我们测试时无法向真实客户发送电子邮件.我想要的是配置postfix,以便它接收任何外发电子邮件并将其重定向到一个电子邮件地址,而不是传递到真正的目的地.我正在运行ubuntu服务器9.10.先感谢您设置本地用户以接收所有被困邮件：你需要在main.cf中添加：然后
ubuntu – vagrant无法连接到虚拟框

当我使用基本的Vagrantfile,只配置了两条线：我看到我的虚拟框打开,但是我的流氓日志多次显示此行直到超时：然后,超时后的一段时间,虚拟框框终于要求我登录,但是太久了！所以我用流氓/流氓记录.然后在我的物理机器上,如果我“流氓ssh”.没有事情发生,直到：怎么了？
ubuntu – Nginx – 转发HTTP AUTH – 用户？

我和Nginx和Jenkins有些麻烦.我尝试使用Nginx作为Jenkins实例的反向代理,使用HTTP基本身份验证.它到目前为止工作,但我不知道如何传递带有AUTH用户名的标头？}尝试将此指令添加到您的位置块
Debian / Ubuntu – 删除后如何恢复/ var / cache / apt结构？

我在ubuntu服务器上的空间不足,所以我做了这个命令以节省空间但是现在在尝试使用apt时,我会收到以下错误：等等显然我删除了一些目录结构.有没有办法做apt-getrebuild-var-tree或类似的？
检查ubuntu上安装的rubygems版本？

如何查看我的ubuntu盒子上安装的rubygems版本？只是一个想法,列出已安装的软件包和grep为ruby或宝石或其他:)dpkg–get-selections

返回
顶部