如何从目标文件读取Mach-O头？

2020-01-10 原文

我已经花了几天的时间试验装配,现在了解装配和机器代码之间的关系(在OSX上通过NASM使用x86,阅读 Intel docs).

现在我想了解链接器的工作原理,特别是要了解Mach-O对象文件的结构,从Mach-O头开始.

我的问题是,你可以绘制下面的Mach-O头如何映射到otool命令输出(显示头,但它们是不同的格式)？

这个问题的一些原因包括：

>这将帮助我了解“Mach-O头的结构”上的文档如何查看真实世界的对象文件.
>这将简化理解的路径,所以我和其他新手不必花费很多时间或几天想知道“他们是这个意思,还是这个”类型的东西.在没有经验的情况下,将通用Mach-O文档转化为现实世界中的实际目标文件是很困难的.

下面我将展示一个例子和过程,我试图从一个真实的对象文件中解码Mach-O头.在下面的描述中,我尝试显示出所有出现的所有小问题或微妙问题的提示.希望这将提供一个感觉,这可以是一个新来的人很混乱.

例

从一个名为example.c的基本C文件开始：

#include <stdio.h>

int
main() {
  printf("hello world");
  return 0;
}

使用gcc example.c -o example.out编译它,它给出：

cffa edfe 0700 0001 0300 0080 0200 0000
1000 0000 1005 0000 8500 2000 0000 0000
1900 0000 4800 0000 5f5f 5041 4745 5a45
524f 0000 0000 0000 0000 0000 0000 0000
0000 0000 0100 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 1900 0000 2802 0000
5f5f 5445 5854 0000 0000 0000 0000 0000
0000 0000 0100 0000 0010 0000 0000 0000
0000 0000 0000 0000 0010 0000 0000 0000
0700 0000 0500 0000 0600 0000 0000 0000
5f5f 7465 7874 0000 0000 0000 0000 0000
5f5f 5445 5854 0000 0000 0000 0000 0000
400f 0000 0100 0000 2d00 0000 0000 0000
400f 0000 0400 0000 0000 0000 0000 0000
0004 0080 0000 0000 0000 0000 0000 0000
5f5f 7374 7562 7300 0000 0000 0000 0000
5f5f 5445 5854 0000 0000 0000 0000 0000
6e0f 0000 0100 0000 0600 0000 0000 0000
6e0f 0000 0100 0000 0000 0000 0000 0000
0804 0080 0000 0000 0600 0000 0000 0000
5f5f 7374 7562 5f68 656c 7065 7200 0000
... 531 total lines of this

运行otool -h example.out,打印：

example.out:
Mach header
      magic cputype cpusubtype  caps    filetype ncmds sizeofcmds      flags
 0xFeedfacf 16777223          3  0x80          2    16       1296 0x00200085

研究

要了解Mach-O文件格式,我发现这些资源有帮助：

> https://developer.apple.com/library/mac/documentation/DeveloperTools/Conceptual/MachORuntime/index.html#//apple_ref/doc/uid/TP40000895
> https://developer.apple.com/library/mac/documentation/DeveloperTools/Conceptual/MachORuntime/index.html
> https://www.mikeash.com/pyblog/friday-qa-2012-11-30-lets-build-a-mach-o-executable.html
> http://www.opensource.apple.com/source/xnu/xnu-1456.1.26/EXTERNAL_HEADERS/mach-o/loader.h
> http://www.opensource.apple.com/source/dtrace/dtrace-78/head/arch.h
> http://www.opensource.apple.com/source/xnu/xnu-792.13.8/osfmk/mach/machine.h

来自opensource.apple.com的最后3位包含所有常量,例如：

#define MH_MAGIC_64 0xFeedfacf /* the 64-bit mach magic number */
#define MH_CIGAM_64 0xcffaedfe /* NXSwapInt(MH_MAGIC_64) */
...
#define cpu_TYPE_MC680x0  ((cpu_type_t) 6)
#define cpu_TYPE_X86    ((cpu_type_t) 7)
#define cpu_TYPE_I386   cpu_TYPE_X86    /* compatibility */
#define cpu_TYPE_X86_64   (cpu_TYPE_X86 | cpu_ARCH_ABI64)

Mach-O标题的结构如下所示：

struct mach_header_64 {
  uint32_t  magic;    /* mach magic number identifier */
  cpu_type_t  cputype;  /* cpu specifier */
  cpu_subtype_t cpusubtype; /* machine specifier */
  uint32_t  filetype; /* type of file */
  uint32_t  ncmds;    /* number of load commands */
  uint32_t  sizeofcmds; /* the size of all the load commands */
  uint32_t  flags;    /* flags */
  uint32_t  reserved; /* reserved */
};

给出这些信息,目标是在example.out对象文件中找到Mach-O头的每一个.

第一：找到“魔法”号码

考虑到这个例子和研究,我能够确定Mach-O头部的第一部分,即“魔术数字”.那很酷

但这不是一个简单的过程.以下是必须收集的信息数据.

> otool输出的第一列显示“魔术”为0xFeedfacf.
> Apple Mach-O docs说标题应该是MH_MAGIC或MH_CIGAM(“魔术”相反).所以通过谷歌在mach-o/loader.h发现.由于我使用64位架构而不是32位,去与MH_MAGIC_64(0xFeedfacf)和MH_CIGAM_64(0xcffaedfe).
>通过example.out文件查看,前8个十六进制代码是cffa edfe,与MH_CIGAM_64匹配！它是一种不同的格式,它会让你失望一点,但它们是两个不同的十六进制格式,足够接近观看连接.他们也被扭转.

这里有3个数字,足以让人弄清楚魔术数字是多少？

0xcffaedfe // value from MH_CIGAM_64
0xFeedfacf // value from otool
cffa edfe  // value in example.out

所以这是令人兴奋的！仍然不完全确定我是否得出关于这些数字的正确结论,但希望如此.

下一页：查找cputype

现在开始变得混乱了这是需要整理在一起的几件事情,但这是我到目前为止的地方：

> otool显示16777223. This apple stackexchange question给了一些提示如何理解这一点.
>在mach/machine.h发现cpu_TYPE_X86_64,并且不得不做几个计算来弄清楚它的价值.

这里是相关的常量来计算cpu_TYPE_X86_64的值：

#define cpu_ARCH_ABI64  0x01000000      /* 64 bit ABI */
#define cpu_TYPE_X86        ((cpu_type_t) 7)
#define cpu_TYPE_I386       cpu_TYPE_X86        /* compatibility */
#define cpu_TYPE_X86_64     (cpu_TYPE_X86 | cpu_ARCH_ABI64)

所以基本上

cpu_TYPE_X86_64 = 7 BITWISEOR 0x01000000 // 16777223

那个数字16777223匹配otool显示的,很好！

接下来,尝试在example.out中找到该数字,但它不存在,因为它是一个十进制数.我只是把它转换成十六进制的JavaScript,在哪里

> (16777223).toString(16)
'1000007'

所以不知道这是否是生成十六进制数字的正确方式,特别是匹配Mach-O对象文件中的十六进制数字的方法. 1000007也只有7个数字,所以不知道你应该“垫”它还是什么.

无论如何,你看到这个数字example.out,就在魔术数字之后：

0700 0001

嗯,他们似乎有些相关：

0700 0001
1000007

看起来,在1000007的末尾添加了一个0,并且它被颠倒了.

题

在这一点上,我想问这个问题,已经花了几个小时才能到达这一点. Mach-O标题的结构如何映射到实际的Mach-O对象文件？你可以在上面的example.out文件中显示标题的每个部分,并简要解释一下为什么？

解决方法

令人困惑的部分原因是 endianness.在这种情况下,标题以平台的本机格式存储.英特尔兼容平台是小端系统,意味着多字节值的最低有效字节首先在字节序列中.

所以,字节序列07 00 00 01当被解释为小端32位值时,对应于0x01000007.

您需要知道的其他解释结构是每个字段的大小.所有的uint32_t字段都很简单.它们是32位无符号整数.

在您连接的machine.h中定义了cpu_type_t和cpu_subtype_t等于integer_t. integer_t被定义为与/usr/include/mach/i386/vm_types.h中的int相当. OS X是一个LP64平台,这意味着longs和指针对架构(32-对64位)敏感,但int不是.它总是32位.

所以,所有的字段大小是32位或4字节.由于有8个字段,共32个字节.

从你的原始hexdump,这是与标题对应的部分：

cffa edfe 0700 0001 0300 0080 0200 0000
1000 0000 1005 0000 8500 2000 0000 0000

按字段划分：

struct mach_header_64 {
  uint32_t  magic;           cf fa ed fe -> 0xFeedfacf
  cpu_type_t  cputype;       07 00 00 01 -> 0x01000007
  cpu_subtype_t cpusubtype;  03 00 00 80 -> 0x80000003
  uint32_t  filetype;        02 00 00 00 -> 0x00000002
  uint32_t  ncmds;           10 00 00 00 -> 0x00000010
  uint32_t  sizeofcmds;      10 05 00 00 -> 0x00000510
  uint32_t  flags;           85 00 20 00 -> 0x00200085
  uint32_t  reserved;        00 00 00 00 -> 0x00000000
};

如何从目标文件读取Mach-O头？的更多相关文章

ios – UIColor到十六进制(网页颜色)

有没有简单的方法将UIColor转换为十六进制值？
ios – 如何使用Unicode十六进制值(UTF-16)在Swift中表达字符串

我想在Swift中使用十六进制值编写一个Unicode字符串.我已经阅读了字符串和字符的documentation,所以我知道我可以使用特殊的Unicode字符直接在字符串如下：版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至dio@foxmail.com举报，一经查实，本站将立刻删除。
为什么Xcode 7 iOS模拟器冻结？

在Xcode7模拟器中,特别是在滚动或执行其他GPU密集型任务时,我会得到60秒以上的冻结.问题似乎是模拟器作为一个整体,而不是我的应用程序.如果我跟踪仪器中的cpu时间,50秒的实时显示为我的应用程序cpu时间的0.5s以下.这是怎么回事？解决方法我运行BetterSnapTool进行窗口管理.退出此应用程序会立即修复问题,即使SIM卡处于冻结状态.不知道为什么,但更好的SnapTool似乎正在干扰iOSSimulator对GPU的使用.
语法参考系列——二词汇结构

语法参考系列——（二）词汇结构标签：Swift学习笔记什么是词汇结构词汇就是语言的最小单元，是一系列字符的组成的标记，词汇包括标识符、关键字、标点、字面值和操作符。词汇结构就是定义什么样的字符序列才是合法的词汇。下面是具体的语法规则。子面值会被推测为Swift标准库中的每种类型。整型字面值整型字面值表示没有指定精度的整型。二进制的字面值包含数字0和1。负整数的字面值用整数字面值前面加负号表示。
Swift 的UIColor 类的详解使用和十六进制转RGB

今天我就带你走进Swift的UIColor。)/*********************************************************//*十六进制转换成RGB*/ZSJ_View.backgroundColor=ZSJ_Color_Conversion/*********************************************************//*可用的颜色有：blackColor()->UIColor//0.0whitedarkGrayColor()
Swift 字符串+集合(三)

StringsandCharacters字符串和字符StringLiterals字符串字面量用于为常量或变量提供初始值，可包含以下特殊字符转义字符\0(空)、\\(反斜线)、\t(水平制表)、\n(换行)、\r(回车)、\"(双引号)、\'(单引号)单字节Unicode，写成\xnn，nn为两位十六进制数双字节Unicode，写成\unnnn，nnnn为四位十六进制数四字节Unicode，写成\U
swift POS8583报文组装工具

最近两天在学习Swift,想着把OC里边的8583POS工具转成Swift版本。[i]))}returnresult}//MARK:ASC码转为Hex字符串3030-->00/**ASC码转为Hex字符串3030-->00-parameterascStr:ASC字符串-returns:转码后的Hex字符串*/staticfunchexStringFromAscString->String{letdda=String.dataFromHexStringletresult=String.initreturnr
Swift将emoji表情扫描

已知一个emoji的十六进制值，转换为表情显示到控件
Swift二进制,十进制,十六进制转换

学自:http://www.jianshu.com/p/34d5e958910a
swift3新路程14数字表达进制

十进制、二进制、八进制、十六进制Adecimalnumber,withnoprefixAbinarynumber,witha0bprefixAnoctalnumber,witha0oprefixAhexadecimalnumber,witha0xprefixDecimalfloatscanalsohaveanoptionalexponent,indicatedbyanuppercaseorlowe

随机推荐

从C到C#的zlib(如何将byte []转换为流并将流转换为byte [])

我的任务是使用zlib解压缩数据包(已接收),然后使用算法从数据中生成图片好消息是我在C中有代码,但任务是在C#中完成C我正在尝试使用zlib.NET,但所有演示都有该代码进行解压缩(C#)我的问题：我不想在解压缩后保存文件,因为我必须使用C代码中显示的算法.如何将byte[]数组转换为类似于C#zlib代码中的流来解压缩数据然后如何将流转换回字节数组？
为什么C标准使用不确定的变量未定义？

垃圾价值存储在哪里,为什么目的？解决方法由于效率原因,C选择不将变量初始化为某些自动值.为了初始化这些数据,必须添加指令.以下是一个例子：产生：虽然这段代码：产生：你可以看到,一个完整的额外的指令用来移动1到x.这对于嵌入式系统来说至关重要.
如何使用命名管道从c调用WCF方法？

更新：通过协议here,我无法弄清楚未知的信封记录.我在网上找不到任何例子.原版的：我有以下WCF服务我输出添加5行,所以我知道服务器是否处理了请求与否.我有一个.NET客户端,我曾经测试这一切,一切正常工作预期.现在我想为这个做一个非托管的C客户端.我想出了如何得到管道的名称,并写信给它.我从here下载了协议我可以写信给管道,但我看不懂.每当我尝试读取它,我得到一个ERROR_broKEN_P
“这”是否保证指向C中的对象的开始？

我想使用fwrite将一个对象写入顺序文件.班级就像当我将一个对象写入文件时.我正在游荡,我可以使用fwrite(this,sizeof(int),2,fo)写入前两个整数.问题是：这是否保证指向对象数据的开始,即使对象的最开始可能存在虚拟表.所以上面的操作是安全的.解决方法这提供了对象的地址,这不一定是第一个成员的地址.唯一的例外是所谓的标准布局类型.从C11标准：(9.2/20)Apointe
c – 编译单元之间共享的全局const对象

当我声明并初始化一个const对象时.两个cpp文件包含此标头.和当我构建解决方案时,没有链接错误,你会得到什么如果g_Const是一个非const基本类型！PrintInUnit1()和PrintInUnit2()表明在两个编译单元中有两个独立的“g_Const”具有不同的地址,为什么？
什么是C名称查找在这里？ (&GCC对吗？)

为什么在第三个变体找到func,但是在实例化的时候,原始变体中不合格查找找不到func？解决方法一般规则是,任何不在模板定义上下文中的内容只能通过ADL来获取.换句话说,正常的不合格查找仅在模板定义上下文中执行.因为在定义中间语句时没有声明func,并且func不在与ns::type相关联的命名空间中,所以代码形式不正确.
c – 在输出参数中使用auto

有没有办法在这种情况下使用auto关键字：当然,不可能知道什么类型的.因此,解决方案应该是以某种方式将它们合并为一个句子.这可用吗？解决方法看起来您希望默认初始化给定函数期望作为参数的类型的对象.您无法使用auto执行此操作,但您可以编写一个特征来提取函数所需的类型,然后使用它来声明您的变量：然后你就像这样使用它：当然,只要你重载函数,这一切都会失败.
在C中说“推动一切浮动”的确定性方式

鉴于我更喜欢将程序中的数字保留为int或任何内容,那么使用这些数字的浮点数等效的任意算术最方便的方法是什么？说,我有我想写通过将转换放在解析的运算符树叶中,无需将表达式转化为混乱是否可以使用C风格的宏？应该用新的类和重载操作符完成吗？解决方法这是一个非常复杂的表达.更好地给它一个名字：现在当您使用整数参数调用它时,由于参数的类型为double,因此使用常规的算术转换将参数转换为double用C11lambda……
objective-c – 如何获取未知大小的NSArray的第一个X元素？

在objectiveC中,我有一个NSArray,我们称之为NSArray*largeArray,我想要获得一个新的NSArray*smallArray,只有第一个x对象…
c – Setprecision是混乱

我只是想问一下setprecision,因为我有点困惑.这里是代码：其中x=以下：方程的左边是x的值.1.105=1.10应为1.111.115=1.11应为1.121.125=1.12应为1.131.135=1.14是正确的1.145=1.15也正确但如果x是：2.115=2.12是正确的2.125=2.12应为2.13所以为什么在一定的价值是正确的,但有时是错误的？请启发我谢谢解决方法没有理由期望使用浮点系统可以正确地表示您的帖子中的任何常量.因此,一旦将它们存储在一个双变量中,那么你所拥有的确切的一