使用CUDA内核获得堆栈溢出
经过一些更改后更新,但还没有工作另一个问题是关于平行部分.编译器说我一次搞了太多pow()和exp().我该如何解决这个问题?原始代码在这里.我评论它是因为我想知道至少我的代码是否在GPU中占据了一些价值.但它甚至没有启动内核……基于更新版本:我看到的错误是>您正在使用osub_matrix作为主机和设备指针.我建议你创建另一个浮点指针并将其用于设备float*d_osub_matrix;cudamalloc;并打电话.然后做>顺便说一下,事实并非如此twiddle_factor;它应该是twiddle_