你如何有效地转置矩阵?有没有这个库,或者你会使用什么算法?

例如.:

short src[W*H] = {
  {1,2,3},{4,5,6}
};
short dest[W*H];


rotate_90_clockwise(dest,src,W,H); //<-- magic in here,no need for in-place

//dest is Now:

{
  {4,1},{5,2},{6,3}
};

(在我的具体情况下,它的src数组是原始图像数据,目标是帧缓冲,我在ARM上嵌入了不支持汇编的工具链)

解决方法

在某些情况下,有这样的库.而且,值得注意的是,您可以使用矢量化数据(例如,128位向量中的四个32位元素,但这也适用于32位寄存器中的四个8位字节),以便比单个数据更快 – 元素访问.

对于转置,标准的想法是使用“shuffle”指令,它允许您以任何顺序从两个现有向量中创建新的数据向量.您使用输入数组的4×4块.所以,从开始,你有:

v0 = 1 2 3 4
v1 = 5 6 7 8
v2 = 9 A B C
v3 = D E F 0

然后,您将shuffle指令应用于前两个向量(交错其奇数元素,A0B0 C0D0 – > ABCD,并交叉它们的偶数元素,0A0B 0C0D – > ABCD),并将其应用于最后两个,以创建一个新的转换每个2×2块的向量:

1 5 3 7
2 6 4 8
9 D B F
A E C 0

最后,您将shuffle指令应用于奇数对和偶数对(组合它们的第一对元素,AB00 CD00 – > ABCD,以及它们的最后一对,00AB 00CD – > ABCD),以获得:

1 5 9 D
2 6 A E
3 7 B F
4 8 C 0

在那里,16个元素转换为8个指令!

现在,对于32位寄存器中的8位字节,ARM没有完全随机指令,但您可以使用移位和SEL(选择)指令来合成所需的内容,并且可以在一个指令中进行第二组混洗.使用PKHBT(打包半字底部顶部)和PKHTB(打包半字顶部底部)指令进行指导.

最后,如果您正在使用具有NEON矢量化的大型ARM处理器,则可以使用16×16块上的16个元素向量执行此类操作.

c – 转置2D阵列的更多相关文章

  1. JavaScript常见数组方法之如何转置矩阵

    这篇文章主要给大家介绍了关于JavaScript常见数组方法之如何转置矩阵的相关资料,文中通过实例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

  2. PHP二维数组矩形转置实例

    下面小编就为大家带来一篇PHP二维数组矩形转置实例。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧

  3. Python中xlsx文件转置操作详解(行转列和列转行)

    很多时候我们处理的Excel表格并不是我们想要的样子,需要将表格的形式进行相应转换后进行数据分析操作,下面这篇文章主要给大家介绍了关于Python中xlsx文件转置操作(行转列和列转行)的相关资料,需要的朋友可以参考下

  4. python实现excel转置问题详解

    这篇文章主要介绍了python实现excel转置问题详解,excel转置分为两种情况,一个是较为简单的只需要行转列,列转行,具体详解,感兴趣的小伙伴可以参考一下

  5. 汇编 – “LES”8086指令未按预期工作

    当我调试编译的exe时,我注意到ES和DI寄存器没有加载正确的值.在加载段和从RAM偏移之前,需要将DS寄存器设置为实际指向数据段.默认情况下,DS指向您的PSP,而PSP不是您希望它指向的位置.

  6. delphi – 某些CPU在紧循环中的ADC / SBB和INC / DEC存在问题

    我在Delphi中编写一个简单的BigInteger类型.它主要由TLimb的动态数组组成,TLimb是一个32位无符号整数,32位大小的字段也保存BigInteger的符号位.要添加两个BigInteger,我创建一个适当大小的新BigInteger,然后在一些记账后,调用以下过程,将三个指针传递给左右操作数和结果的数组的各个开始,以及分别为左右肢数.普通代码:这个代码运行良好,我非常满意,直到

  7. Delphi中的COM方法偏移

    在Delphi中,如何找到COM方法的地址?解决方法您可以使用vmtoffset汇编程序指令获取接口方法相对于接口方法表开头的字节偏移量.看一下System.pas中_IntfCast的实现,例如:第一个表达式加0;第二,8.但是,您无法对这些表达式进行参数化.它们是编译时常量,因此您无法在运行时选择所需的方法.您需要提前表示所有可能的方法名称.你真正需要挂钩的是QueryInterface.完成后,您可以返回所需的任何代理对象,可以拦截对所有其他方法的调用.

  8. java – CPU的div指令和HotSpot的JIT代码之间的性能差距很大

    想到的一个解释是假设存在一个除法算法,该算法首次涉及红利的进程.然后,JIT编译器将有一个头开始,因为它将评估在编译时仅涉及除数的第一部分,并仅将算法的第二部分作为运行时代码发出.那个假设是否正确?

  9. 将目标地址保持在寄存器中,直到指令退出

    我想使用精确的基于事件的采样(PEBS)在XeonE5SandyBridge上记录特定事件的所有地址(例如高速缓存未命中).但是,CoreTMi7处理器和英特尔至强5500处理器的性能分析指南(第24页)包含以下警告:AsthePEBSmechanismcapturesthevaluesoftheregisteratcompletionoftheinstruction,thedereference

  10. c# – T4在网站项目中具有相对路径的汇编指令?

    我在VisualStudio中有一个网站项目,我正在尝试从站点的bin目录中引用一些程序集.到目前为止,根路径是唯一有效的路径:其他人提到使用msbuild变量,但这对我不起作用:我很确定相对路径只是平坦无法工作:如果不使用root路径,有没有办法让这个工作在网站项目的上下文中?解决方法T4模板中的装配参考需要GAC或绝对路径.但是,您可以使用已知路径中的相对路径:例如:

随机推荐

  1. 从C到C#的zlib(如何将byte []转换为流并将流转换为byte [])

    我的任务是使用zlib解压缩数据包(已接收),然后使用算法从数据中生成图片好消息是我在C中有代码,但任务是在C#中完成C我正在尝试使用zlib.NET,但所有演示都有该代码进行解压缩(C#)我的问题:我不想在解压缩后保存文件,因为我必须使用C代码中显示的算法.如何将byte[]数组转换为类似于C#zlib代码中的流来解压缩数据然后如何将流转换回字节数组?

  2. 为什么C标准使用不确定的变量未定义?

    垃圾价值存储在哪里,为什么目的?解决方法由于效率原因,C选择不将变量初始化为某些自动值.为了初始化这些数据,必须添加指令.以下是一个例子:产生:虽然这段代码:产生:你可以看到,一个完整的额外的指令用来移动1到x.这对于嵌入式系统来说至关重要.

  3. 如何使用命名管道从c调用WCF方法?

    更新:通过协议here,我无法弄清楚未知的信封记录.我在网上找不到任何例子.原版的:我有以下WCF服务我输出添加5行,所以我知道服务器是否处理了请求与否.我有一个.NET客户端,我曾经测试这一切,一切正常工作预期.现在我想为这个做一个非托管的C客户端.我想出了如何得到管道的名称,并写信给它.我从here下载了协议我可以写信给管道,但我看不懂.每当我尝试读取它,我得到一个ERROR_broKEN_P

  4. “这”是否保证指向C中的对象的开始?

    我想使用fwrite将一个对象写入顺序文件.班级就像当我将一个对象写入文件时.我正在游荡,我可以使用fwrite(this,sizeof(int),2,fo)写入前两个整数.问题是:这是否保证指向对象数据的开始,即使对象的最开始可能存在虚拟表.所以上面的操作是安全的.解决方法这提供了对象的地址,这不一定是第一个成员的地址.唯一的例外是所谓的标准布局类型.从C11标准:(9.2/20)Apointe

  5. c – 编译单元之间共享的全局const对象

    当我声明并初始化一个const对象时.两个cpp文件包含此标头.和当我构建解决方案时,没有链接错误,你会得到什么如果g_Const是一个非const基本类型!PrintInUnit1()和PrintInUnit2()表明在两个编译单元中有两个独立的“g_Const”具有不同的地址,为什么?

  6. 什么是C名称查找在这里? (&amp;GCC对吗?)

    为什么在第三个变体找到func,但是在实例化的时候,原始变体中不合格查找找不到func?解决方法一般规则是,任何不在模板定义上下文中的内容只能通过ADL来获取.换句话说,正常的不合格查找仅在模板定义上下文中执行.因为在定义中间语句时没有声明func,并且func不在与ns::type相关联的命名空间中,所以代码形式不正确.

  7. c – 在输出参数中使用auto

    有没有办法在这种情况下使用auto关键字:当然,不可能知道什么类型的.因此,解决方案应该是以某种方式将它们合并为一个句子.这可用吗?解决方法看起来您希望默认初始化给定函数期望作为参数的类型的对象.您无法使用auto执行此操作,但您可以编写一个特征来提取函数所需的类型,然后使用它来声明您的变量:然后你就像这样使用它:当然,只要你重载函数,这一切都会失败.

  8. 在C中说“推动一切浮动”的确定性方式

    鉴于我更喜欢将程序中的数字保留为int或任何内容,那么使用这些数字的浮点数等效的任意算术最方便的方法是什么?说,我有我想写通过将转换放在解析的运算符树叶中,无需将表达式转化为混乱是否可以使用C风格的宏?应该用新的类和重载操作符完成吗?解决方法这是一个非常复杂的表达.更好地给它一个名字:现在当您使用整数参数调用它时,由于参数的类型为double,因此使用常规的算术转换将参数转换为double用C11lambda……

  9. objective-c – 如何获取未知大小的NSArray的第一个X元素?

    在objectiveC中,我有一个NSArray,我们称之为NSArray*largeArray,我想要获得一个新的NSArray*smallArray,只有第一个x对象…

  10. c – Setprecision是混乱

    我只是想问一下setprecision,因为我有点困惑.这里是代码:其中x=以下:方程的左边是x的值.1.105=1.10应为1.111.115=1.11应为1.121.125=1.12应为1.131.135=1.14是正确的1.145=1.15也正确但如果x是:2.115=2.12是正确的2.125=2.12应为2.13所以为什么在一定的价值是正确的,但有时是错误的?请启发我谢谢解决方法没有理由期望使用浮点系统可以正确地表示您的帖子中的任何常量.因此,一旦将它们存储在一个双变量中,那么你所拥有的确切的一

返回
顶部