如何传递和访问C向量到OpenCL内核？

2019-06-05 原文

我是C,C和OpenCL的新手,并尽力在现在学习.这是一个预先存在的C函数,我试图找出如何使用C或C绑定到OpenCL.

#include <vector>

using namespace std;

class Test {

private:

    double a;
    vector<double> b;
    vector<long> c;
    vector<vector<double> > d;

public:

    double foo(long x,double y) {
        // mathematical operations
        // using x,y,a,b,c,d
        // and also b.size()
        // to calculate return value
        return 0.0;
    }

};

大体上我的问题是如何传递这个函数访问绑定和内核的所有类成员.我知道如何传递标量值,但我不知道的向量值.有可能有一种方式来传递给上述每个成员或内存的指针,以便OpenCL的视图与主机内存同步吗？打破我的问题如下.

>如果将成员b和c传递给可变大小的绑定和内核,我该如何传递？
>如果它是二维的,我如何通过会员d？
>如何从内核中访问这些成员以及在内核的参数中声明哪些类型？将简单地使用数组索引符号,即b [0]可以访问？
>如何在内核函数中调用与b.size()相当的操作,否则我不会将其作为额外的参数传递到绑定到内核中的大小？如果改变会发生什么？

我非常感谢C或C绑定和内核代码示例源代码在答案.

非常感谢.

解决方法

>您必须分配一个OpenCL缓冲区并将您的cpu数据复制到其中. OpenCL缓冲区具有固定的大小,因此如果数据大小发生变化或者使其“足够大”,则必须重新创建它,如果需要更少的内存,则只能使用它的一部分.例如,为b创建缓冲区,同时将其所有数据复制到设备：

cl_mem buffer_b = clCreateBuffer(
    context,// OpenCL context
    CL_MEM_READ_ONLY | CL_MEM_copY_HOST_PTR,// Only read access from kernel,// copy data from host
    sizeof(cl_double) * b.size(),// Buffer size in bytes
    &b[0],// Pointer to data to copy
    &errorcode); // Return code

也可以直接映射主机内存(CL_MEM_USE_HOST_PTR),但是在创建缓冲区之后,这对对齐方式和对主机内存的访问会产生一些限制.基本上,当您当前没有映射它时,主机内存可能包含垃圾.
>这取决于第二维中向量的大小是否相等？然后在将它们上传到OpenCL设备时将其平坦化.否则会变得更加复杂.
>在内核中声明缓冲区参数为__global指针.例如,__global double * b将适合于在1中创建的缓冲区.您可以使用内核中的数组符号来访问缓冲区中的各个元素.
>您不能从内核中查询缓冲区大小,因此必须手动传递.这也可以隐含地发生,例如.如果工作项数与b的大小相匹配.

可以访问计算所有数据的内核可能如下所示：

__kernel void foo(long x,double y,double a,__global double* b,int b_size,__global long* c,__global double* d,__global double* result) {
  // Here be dragons
  *result = 0.0;
}

请注意,您还必须为结果分配内存.如果需要,可能需要传递额外的大小参数.你会调用内核如下：

// Create/fill buffers
// ...

// Set arguments
clSetKernelArg(kernel,sizeof(cl_long),&x);
clSetKernelArg(kernel,1,sizeof(cl_double),&y);
clSetKernelArg(kernel,2,&a);
clSetKernelArg(kernel,3,sizeof(cl_mem),&b_buffer);
cl_int b_size = b.size();
clSetKernelArg(kernel,4,sizeof(cl_int),&b_size);
clSetKernelArg(kernel,5,&c_buffer);
clSetKernelArg(kernel,6,&d_buffer);
clSetKernelArg(kernel,7,&result_buffer);
// Enqueue kernel
clEnqueueNDRangeKernel(queue,kernel,/* ... depends on your domain */);

// Read back result
cl_double result;
clEnqueueReadBuffer(queue,result_buffer,CL_TRUE,&result,NULL,NULL);

如何传递和访问C向量到OpenCL内核？的更多相关文章

如何在Xcode 4.1中调试OpenCL内核？

我有一些OpenCL内核没有做他们应该做的事情,我很想在Xcode中调试它们.这可能吗？当我在我的内核中使用printf()时,OpenCL编译器总是给我一大堆错误.解决方法将格式字符串转换为constchar*似乎可以解决此问题.这适用于Lion：这有上述错误：
Android支持OpenCL吗？

最近我想开发并行计算应用程序在Android上使用OpenCL.据我所知,Android系统不包括“libopencl.so”,但是仍然有一些网站或博客在Android上显示OpenCL开发.Android支持OpenCL吗？如果是这样,在Android上开发OpenCL应该怎么办？
女士们，先生们，大家好，有人试过用Adreno Gpu和pyhton代码吗？

我需要使用AdrenoGPU进行深度学习而不是nvidia。有人知道怎么做吗？
如何在Windows上模拟CUDA

有没有什么方法可以从没有NVIDIA显卡的电脑上测试CUDA样品和代码？
Windows 7入门OpenCL

还是一个很好的深入资源,让它全部成立？为了使这个问题更具体,我想我想知道一下,我需要下载和安装在NVIDIA驱动程序上的SDK和其他文件,以及b)如何在Windows上编译和运行OpenCL代码.没有魔法.a)您必须安装CUDASDKb)要正确地#包含OpenCL标题,您只需要设置IDE的包含路径即可包含刚刚安装的SDK的CUDA/CL,并链接到OpenCL.lib.而已！如果我不知道您是使用Eclipse还是VisualStudio,或者如果您还不知道如何设置包含路径,那么我无法详细描述它,应该有很多说
ubuntu16.04如何升级/安装beignet1.3

下载beignet-opencl-icd的debian包下载beignet的debian包先卸载已有的老版本，再安装上述的debian包
在Ubuntu上编译opencl需要什么？ (和延期,opencl期)

问题：需要什么头文件和驱动程序,我在哪里可以使用gcc/g在ubuntu上编译打开的CL？
在ubuntu 14.04上安装Intel OpenCL SDK

我正在尝试在ubuntu-14.04上安装OpenCLSDK.问题是我找不到这个SDK的Linux版本.我发现的所有内容都是Windows版本https://software.intel.com/en-us/vcsource/tools/opencl-sdk.您可以从以下位置获取Ubuntu的最新OpenCL运行时：https://software.intel.com/en-us/articles
Windows – 在Mingw Nvidia SDK上编译OpenCL

是否可以使用Mingw和NvidiaSDK编译OpenCL？我的意思是一旦编译了任何编译器可能是,并成功链接,应该是什么问题？我设法编译并成功将我的代码链接到NvidiaSDK提供的OpenCL库,但是可执行文件会在clGetPlatformIDs中抛出SegmentationFault,这是我的代码中的第一个OpenCL调用.这是我的编译命令请注意,这些库是从示例OpenCL代码的.sln文件中获取的.我尝试了这些图书馆的各种组合,似乎没有任何工作.还有一种使用Mingw编译的方法,并使用别的链接进行链
ubuntu16 CUDA 编译opencl caffe版本并通过mnist训练测试

一般来说，大家谈到caffe,都是基于CUDA在的NVIDIA显卡上运行的版本，其实有一个支持opencl的分支版本OpenCLCaffe。理论上这个版本的caffe可以运行在支持OpenCL并行计算框架的任何设备上，因为这个分支版本目前还是试验性版本，所以之前一直没有尝试使用，今天想起来就试着在NVIDIA显卡编译OpenCLCaffe。下载并编译Caffe经编译成功后运行ldd显示，caffe已经是基于cuda下的OpenCL动态库版本MNIST训练测试OpenCLCaffe编译成功后可以运行mnis

随机推荐

从C到C#的zlib(如何将byte []转换为流并将流转换为byte [])

我的任务是使用zlib解压缩数据包(已接收),然后使用算法从数据中生成图片好消息是我在C中有代码,但任务是在C#中完成C我正在尝试使用zlib.NET,但所有演示都有该代码进行解压缩(C#)我的问题：我不想在解压缩后保存文件,因为我必须使用C代码中显示的算法.如何将byte[]数组转换为类似于C#zlib代码中的流来解压缩数据然后如何将流转换回字节数组？
为什么C标准使用不确定的变量未定义？

垃圾价值存储在哪里,为什么目的？解决方法由于效率原因,C选择不将变量初始化为某些自动值.为了初始化这些数据,必须添加指令.以下是一个例子：产生：虽然这段代码：产生：你可以看到,一个完整的额外的指令用来移动1到x.这对于嵌入式系统来说至关重要.
如何使用命名管道从c调用WCF方法？

更新：通过协议here,我无法弄清楚未知的信封记录.我在网上找不到任何例子.原版的：我有以下WCF服务我输出添加5行,所以我知道服务器是否处理了请求与否.我有一个.NET客户端,我曾经测试这一切,一切正常工作预期.现在我想为这个做一个非托管的C客户端.我想出了如何得到管道的名称,并写信给它.我从here下载了协议我可以写信给管道,但我看不懂.每当我尝试读取它,我得到一个ERROR_broKEN_P
“这”是否保证指向C中的对象的开始？

我想使用fwrite将一个对象写入顺序文件.班级就像当我将一个对象写入文件时.我正在游荡,我可以使用fwrite(this,sizeof(int),2,fo)写入前两个整数.问题是：这是否保证指向对象数据的开始,即使对象的最开始可能存在虚拟表.所以上面的操作是安全的.解决方法这提供了对象的地址,这不一定是第一个成员的地址.唯一的例外是所谓的标准布局类型.从C11标准：(9.2/20)Apointe
c – 编译单元之间共享的全局const对象

当我声明并初始化一个const对象时.两个cpp文件包含此标头.和当我构建解决方案时,没有链接错误,你会得到什么如果g_Const是一个非const基本类型！PrintInUnit1()和PrintInUnit2()表明在两个编译单元中有两个独立的“g_Const”具有不同的地址,为什么？
什么是C名称查找在这里？ (&GCC对吗？)

为什么在第三个变体找到func,但是在实例化的时候,原始变体中不合格查找找不到func？解决方法一般规则是,任何不在模板定义上下文中的内容只能通过ADL来获取.换句话说,正常的不合格查找仅在模板定义上下文中执行.因为在定义中间语句时没有声明func,并且func不在与ns::type相关联的命名空间中,所以代码形式不正确.
c – 在输出参数中使用auto

有没有办法在这种情况下使用auto关键字：当然,不可能知道什么类型的.因此,解决方案应该是以某种方式将它们合并为一个句子.这可用吗？解决方法看起来您希望默认初始化给定函数期望作为参数的类型的对象.您无法使用auto执行此操作,但您可以编写一个特征来提取函数所需的类型,然后使用它来声明您的变量：然后你就像这样使用它：当然,只要你重载函数,这一切都会失败.
在C中说“推动一切浮动”的确定性方式

鉴于我更喜欢将程序中的数字保留为int或任何内容,那么使用这些数字的浮点数等效的任意算术最方便的方法是什么？说,我有我想写通过将转换放在解析的运算符树叶中,无需将表达式转化为混乱是否可以使用C风格的宏？应该用新的类和重载操作符完成吗？解决方法这是一个非常复杂的表达.更好地给它一个名字：现在当您使用整数参数调用它时,由于参数的类型为double,因此使用常规的算术转换将参数转换为double用C11lambda……
objective-c – 如何获取未知大小的NSArray的第一个X元素？

在objectiveC中,我有一个NSArray,我们称之为NSArray*largeArray,我想要获得一个新的NSArray*smallArray,只有第一个x对象…
c – Setprecision是混乱

我只是想问一下setprecision,因为我有点困惑.这里是代码：其中x=以下：方程的左边是x的值.1.105=1.10应为1.111.115=1.11应为1.121.125=1.12应为1.131.135=1.14是正确的1.145=1.15也正确但如果x是：2.115=2.12是正确的2.125=2.12应为2.13所以为什么在一定的价值是正确的,但有时是错误的？请启发我谢谢解决方法没有理由期望使用浮点系统可以正确地表示您的帖子中的任何常量.因此,一旦将它们存储在一个双变量中,那么你所拥有的确切的一