c – 在设计内存池时如何考虑对齐？

2019-04-25 原文

我正在为一个小型游戏引擎开发内存池.

主要用途是作为隔离存储;池包含特定类型和大小的对象.目前,池可用于存储任何内容,但分配将在特定大小的块中完成.大多数内存需求将立即分配,但如果需要协助调整(几乎固定大小),可以启用“过度增长”.

问题是,在考虑内存对齐时,我开始有些偏执.我只习惯8位处理器上的原始内存管理,其中所有内容都是字节对齐的.

我让用户(我)指定所需的块大小,在隔离存储的情况下,它将是我将要存储在其中的对象的大小.

当前的方法是分配一大块内存块*(desired_size header_size)大并将对象放入其中,每个块都有一个头;对象显然会直接位于此标题后面.

在我的场景中,关于内存对齐,我需要考虑什么？

到目前为止我得出的答案是,只要desired_size代表n字节对齐的数据;标题由编译器正确对齐和打包以及实际数据,存储在块中的所有内容都将是n字节对齐的.

n是平台所需的任何边界.我目前的目标是x86,但我不想在我的代码中对平台做任何假设.

我使用过的一些资源：

> http://www.ibm.com/developerworks/library/pa-dalign/
> http://en.wikipedia.org/wiki/Data_structure_alignment
> Memory alignment on a 32-bit Intel processor
> Boost Pool docs以获得一般设计的灵感.我想避免将推动拖入这个项目;而且我也将此视为学习机会.

编辑

上传的小样本代码可能会对将来here中与我混淆的任何人有所帮助.

解决方法

保证malloc的分配对于编译器提供的任何类型都是对齐的,因此任何对象[*]都是如此.

当您的标题的对齐要求小于实现的最大对齐要求时,存在危险.那么它的大小可能不是最大值的倍数.对齐,所以当你尝试转换/使用buf header_size作为指向具有最大值的东西的指针.对齐,它是错位的.就C而言,这是未定义的行为.在英特尔它的工作,但速度较慢.在某些ARM上,它会导致硬件异常.在某些ARM上,它默默地给出了错误的答案.因此,如果您不想在代码中对平台做出假设,则必须处理它.

基本上我有三个技巧可以确保你的标题不会导致错位：

>使用特定于实现的对齐编译指示来强制解决问题.
>使用特定于平台的结构布局和对齐知识,以确保其大小恰好是系统上最大对齐要求的倍数.通常这意味着,“如果需要将一个额外的int作为填充,以使其成为8倍,而不仅仅是4倍”.
>使标题成为每种标准类型的并集,以及您实际要使用的结构.在C中运行良好,但如果您的标题对于工会会员资格无效,则您在C中遇到问题.

或者,您可以将header_size定义为不是sizeof(标题),但是将该大小四舍五入为2的“2足够好”的倍数.如果你浪费了一点内存,那就这样吧,你可以随时拥有一个“可移植性标题”来定义这种事物,这种方式不是纯粹与平台无关的,而是可以很容易地适应新平台.

[*]有一个常见的例外是超大的SIMD类型.由于它们是非标准的,并且仅仅因为它们而对每个分配进行16对齐将是浪费的,所以它们被手动放在一边,并且你需要特殊的分配功能.

c – 在设计内存池时如何考虑对齐？的更多相关文章

在Swift中对齐vs步幅

在Swift4中,MemoryLayout结构告诉您类型的大小,跨度和对齐方式.我理解大小和步幅,但不是真正的对齐.是否有一个示例显示了什么是对齐,它与步幅有什么不同,何时它与步幅有不同的值,以及使用步幅但使用对齐是否正确？我可以一直计算另一个吗？
windows – 用于监视App池内存使用情况的免费应用程序或脚本

我想要一个显示以下内容的应用程序或脚本：工作进程,应用程序池名称,内存使用情况以及可选的cpu使用情况.我熟悉使用%windir%\system32\inetsrv\appcmd.exelistwp但这只是获取了workerprocesid和apppool名称.然后我接受并交叉引用任务管理器.这是有效的,但我想要一个更快–几乎仪表板显示信息.我想必须有某种解决方案来显示信息,而不需要像过程浏览器那样点击.有人特别喜欢他们使用的东西吗？在PowerShell中这是可能的吗？
C语言字节序对齐以及空间利用率

环境：ubuntu64bitgccvim运行结果：代码分析：sizeof()函数是求变量的字节数，这里stu1是一个Stu变量，Stu包含三个成员分别是：int,char*,char,理论上sizeof=4+8+1=13为什么实际结果确实24呢？网上查资料只是说效率会变慢．以上是我在做项目时发现的问题，经过查资料得出结果拿出来和大家分享下，以上纯属个人理解，如果发现有错请在下方评论，方便我及时更正．
分配内存按需要对齐

在VS里面，使用_aligned_realloc和_aligned_malloc进行内存对齐。
ios – 将未对齐的缓冲区提供给MTLBuffer是否安全？

任何明显的原因,为什么这不起作用？再说一次,如果它是安全的,为什么首先强加要求？为什么API不是这样做的呢？
java – 是否可以按池检查堆内存使用情况？

我一直在努力优化一个有很多内存泄漏问题的程序.泄漏现在已经消失,但主要GC的偶尔运行仍然对PS老一代产生了良好的影响.我知道我可以通过运行时检查基本的整体内存信息,但是可以在程序中检查PSeden,PS幸存者和PSold的使用情况吗？解决方法这个article可以帮到你您可以编写自定义代码来分析内存和数据.输出将在表单中好read
使用高速缓存行对齐,在C中修改全局共享状态的无锁检查

>假设一个实例是structcache_line_aligned的每个实例都在64字节边界上对齐,并且恰好使用一条高速缓存行>使用typedef作为类型声明不会改变__attribute__>在实例化结构体时,我不需要使用aligned_malloc,如果struct用__attribute__声明…最后一个使用缓存线对齐方法的函数的草图能够有效地检查全局状态是否被其他线程修改：对不起,长篇文章谢谢！
c – 编译器(G)似乎为它所需要的类的实例分配更多的内存

它应该是应该没有当我编译的代码与类定义也包括一个双,即它仍然分配16个字节,这在这种情况下是有道理的.那么为什么编译器只需要8个分配16个字节呢？解决方法这与栈框对齐有关,而不是结构对齐.如果你在对象上做了一个sizeof(),你会看到你期望的结构对齐和填充.但是,堆栈框架略有不同.在今天的大多数系统中,堆栈对齐是16字节(或更多),以适应SSE内存访问.
realloc是否保持posix_memalign的内存对齐方式？

对齐的malloc是posix_memalign,没关系,但是对齐的realloc呢？realloc是否保留对齐方式或如何确保重新分配的内存具有相同的对齐方式？
C std :: string的单个实例是否使用相同的分配器？

我一直想知道的一件事是,我在我的C代码中使用的std::string实例是否使用相同的分配器,或者它们是否有自己独立的内存池？解决方法默认情况下,它们都使用std::allocator,它使用标准内存例程来获取空闲堆块.此图层不涉及池.(但是,大多数堆实现使用专用的低碎片堆来提供小分配,并且字符串最有可能属于此类别.但这是依赖于实现的,而不是对std::strings独占或优化…

随机推荐

从C到C#的zlib(如何将byte []转换为流并将流转换为byte [])

我的任务是使用zlib解压缩数据包(已接收),然后使用算法从数据中生成图片好消息是我在C中有代码,但任务是在C#中完成C我正在尝试使用zlib.NET,但所有演示都有该代码进行解压缩(C#)我的问题：我不想在解压缩后保存文件,因为我必须使用C代码中显示的算法.如何将byte[]数组转换为类似于C#zlib代码中的流来解压缩数据然后如何将流转换回字节数组？
为什么C标准使用不确定的变量未定义？

垃圾价值存储在哪里,为什么目的？解决方法由于效率原因,C选择不将变量初始化为某些自动值.为了初始化这些数据,必须添加指令.以下是一个例子：产生：虽然这段代码：产生：你可以看到,一个完整的额外的指令用来移动1到x.这对于嵌入式系统来说至关重要.
如何使用命名管道从c调用WCF方法？

更新：通过协议here,我无法弄清楚未知的信封记录.我在网上找不到任何例子.原版的：我有以下WCF服务我输出添加5行,所以我知道服务器是否处理了请求与否.我有一个.NET客户端,我曾经测试这一切,一切正常工作预期.现在我想为这个做一个非托管的C客户端.我想出了如何得到管道的名称,并写信给它.我从here下载了协议我可以写信给管道,但我看不懂.每当我尝试读取它,我得到一个ERROR_broKEN_P
“这”是否保证指向C中的对象的开始？

我想使用fwrite将一个对象写入顺序文件.班级就像当我将一个对象写入文件时.我正在游荡,我可以使用fwrite(this,sizeof(int),2,fo)写入前两个整数.问题是：这是否保证指向对象数据的开始,即使对象的最开始可能存在虚拟表.所以上面的操作是安全的.解决方法这提供了对象的地址,这不一定是第一个成员的地址.唯一的例外是所谓的标准布局类型.从C11标准：(9.2/20)Apointe
c – 编译单元之间共享的全局const对象

当我声明并初始化一个const对象时.两个cpp文件包含此标头.和当我构建解决方案时,没有链接错误,你会得到什么如果g_Const是一个非const基本类型！PrintInUnit1()和PrintInUnit2()表明在两个编译单元中有两个独立的“g_Const”具有不同的地址,为什么？
什么是C名称查找在这里？ (&GCC对吗？)

为什么在第三个变体找到func,但是在实例化的时候,原始变体中不合格查找找不到func？解决方法一般规则是,任何不在模板定义上下文中的内容只能通过ADL来获取.换句话说,正常的不合格查找仅在模板定义上下文中执行.因为在定义中间语句时没有声明func,并且func不在与ns::type相关联的命名空间中,所以代码形式不正确.
c – 在输出参数中使用auto

有没有办法在这种情况下使用auto关键字：当然,不可能知道什么类型的.因此,解决方案应该是以某种方式将它们合并为一个句子.这可用吗？解决方法看起来您希望默认初始化给定函数期望作为参数的类型的对象.您无法使用auto执行此操作,但您可以编写一个特征来提取函数所需的类型,然后使用它来声明您的变量：然后你就像这样使用它：当然,只要你重载函数,这一切都会失败.
在C中说“推动一切浮动”的确定性方式

鉴于我更喜欢将程序中的数字保留为int或任何内容,那么使用这些数字的浮点数等效的任意算术最方便的方法是什么？说,我有我想写通过将转换放在解析的运算符树叶中,无需将表达式转化为混乱是否可以使用C风格的宏？应该用新的类和重载操作符完成吗？解决方法这是一个非常复杂的表达.更好地给它一个名字：现在当您使用整数参数调用它时,由于参数的类型为double,因此使用常规的算术转换将参数转换为double用C11lambda……
objective-c – 如何获取未知大小的NSArray的第一个X元素？

在objectiveC中,我有一个NSArray,我们称之为NSArray*largeArray,我想要获得一个新的NSArray*smallArray,只有第一个x对象…
c – Setprecision是混乱

我只是想问一下setprecision,因为我有点困惑.这里是代码：其中x=以下：方程的左边是x的值.1.105=1.10应为1.111.115=1.11应为1.121.125=1.12应为1.131.135=1.14是正确的1.145=1.15也正确但如果x是：2.115=2.12是正确的2.125=2.12应为2.13所以为什么在一定的价值是正确的,但有时是错误的？请启发我谢谢解决方法没有理由期望使用浮点系统可以正确地表示您的帖子中的任何常量.因此,一旦将它们存储在一个双变量中,那么你所拥有的确切的一