cuda

首页

cuda

使用CUDA内核获得堆栈溢出

经过一些更改后更新,但还没有工作另一个问题是关于平行部分.编译器说我一次搞了太多pow()和exp().我该如何解决这个问题？原始代码在这里.我评论它是因为我想知道至少我的代码是否在GPU中占据了一些价值.但它甚至没有启动内核……基于更新版本：我看到的错误是>您正在使用osub_matrix作为主机和设备指针.我建议你创建另一个浮点指针并将其用于设备float*d_osub_matrix;cudamalloc;并打电话.然后做>顺便说一下,事实并非如此twiddle_factor;它应该是twiddle_

c – 如何使用CUDA执行struct的深度复制？

>有没有什么好方法可以从主机到设备执行“structofstruct”的深层复制？

forceinline对CUDA C device函数的影响

关于何时使用内联函数以及何时在常规C编码中避免它,有很多建议.__forceinline__对CUDAC__device__函数有什么影响？应该在哪里使用以及在哪里避免？

c – 在CUDA中编写内核函数的正确方法？

例如,我可以让GPU直接执行下一个并行操作而无需返回cpu来初始化下一个内核吗？显然,我会将所有运行时变量保留在GPU内存上以限制正在进行的数据传输量,所以我是否应该担心内核调用之间的时间？

c – 在CUDA内核中放置一个for循环

在内核中放置for循环是个坏主意吗？或者这是常见的事情？启动参数,全局与常量与共享内存,保持寄存器数量冷却,确保合并并避免内存库冲突等.如果您对性能感兴趣,你应该在CUDA4.0文档页面上查看NVIDIA提供的“CUDAC最佳实践”和“CUDA占用计算器”.

CUDA代码中的常量内存使用情况

r-pleasant-way也有类似的问题.我正在使用GTX580并仅编译2.0功能.我的内核看起来像我在主机上执行以下代码：另一种方法是添加到.cu文件,从内核中删除src指针并执行这两种方式是等效的还是第一种不保证使用常量内存而不是全局内存？

python distutils可以编译CUDA代码吗？

我有CUDA代码,我想使用distutils为Python构建一个动态库.但即使安装了“nvcc”编译器,似乎distutils也无法识别“.cu”文件.不知道如何完成它.解决方法distutils默认情况下无法编译CUDA,因为它不支持同时使用多个编译器.默认情况下,它仅根据您的平台设置为编译器,而不是基于您拥有的源代码类型.我在github上有一个示例项目,其中包含一些针对distutils的

python – nvcc致命：没有为theano选项’gpu-architecture’错误定义值’sm_61′

我正在设置python和theano用于gpuon;ubuntu14.04,GeForceGTX1080已成功为系统安装了NVIDIA驱动程序(367.27)和CUDA工具包(7.5),但在使用theanogpu实现进行测试时,我得到了上述错误(例如;在启用gpu的情况下导入theano时)我试图寻找可能的解决方案,但没有成功.我对ubuntu和gpu编程有点新意,所以我很感激能够解决这个问题.谢

CUDA 7.0编译样本时出错

我正在尝试在Ubuntu14.04上安装CUDA7.0.我按照here所述的安装说明进行操作.具体来说,我按照第3.6节和第6章中的步骤进行操作.在使用make编译示例(第6.2.2.2节)时,我收到以下错误：如果你注意到,有-L/usr/lib/“nvidia-346”.就我而言,我已经安装了nvidia-349.对我有用的是编辑NVIDIA_CUDA-7.0_Samples/3_Imaging

显卡 – Ubuntu 14.04如何在不安装nvidia驱动程序的情况下安装cuda 6.5

我在工作站上工作cpu核心I74790和两个GPUGTX7604GBram/1152核心系统的内存是16GBRAM我有Ubuntu14.04.1LTS经过多次尝试并重新安装Ubuntu多次终于我已经正确安装了nvidia驱动程序340.46使用3shell命令ppaxorg-edgers现在我想安装Cuda6.5工具包但在手册中他们说cuda工具包安装程序也将安装nvidiaGraphics驱动程

返回
顶部