从0到tfp0第二部分:voucher_swap EXP详解
2020-12-14 10:58:00 Author: xz.aliyun.com(查看原文) 阅读量:253 收藏

本文原文来自From zero to tfp0 - Part 2: A Walkthrough of the voucher_swap exploit
在本文中将深入研究voucher_swap漏洞以及获取内核任务端口的所有步骤。
该漏洞和POC都归功于@_bazad

引用计数

本文中的漏洞是由于MIG生成的代码的引用计数问题造成的。什么是引用计数?引用计数是一种简单而有效的内存管理方式。创建或复制对象会将其引用计数加1,而销毁或覆盖对象会将其引用计数减1。如果对象的引用计数达到零,则将释放该对象。在内存有限的系统中,引用计数比垃圾回收(它是循环发生的,可能会耗费时间)更有效,因为可以在对象的引用计数为零时立即释放对象,从而提高了系统的整体响应能力。
对象结构体中的成员可以表示该对象的引用计数。例如,Mach端口(ipc_port_t)中io_references成员表示其引用计数,ip_references和ip_release用于增加和减少端口上的引用计数。简单搜索ip_reference将找到此函数用于操纵端口的引用计数的许多示例。

voucher也是一样的,其中iv_refs成员表示引用计数。

iv_refs的类型为os_refcnt_t,它是32位整数,因此其范围为0-0xffffffff(8个f)吗?其实并不是。在libkern/os/refcnt.c中,最大值定义为0x0fffffff(7个f)。这是一种新的防止整数溢出的缓解措施。

如下所示,访问超出此范围的任何值都会触发内核panic。

voucher的ipc_voucher_reference和ipc_voucher_release函数仅检查voucher是否不为NULL,然后调用iv_reference和iv_release,他们分别调用os_ref_retain和os_ref_release。

BUILD/obj/EXPORT_HDRS/libkern/os/refcnt.h中可以找到更多细节。

因此,可能会出现两种漏洞:一种是以某种方式增加引用计数,从而导致溢出。如前所述,由于存在上限,这实际上是无法利用的。但是仍然可以将引用计数增加到0x0fffffff(7个f),稍后我们将使用此技术。另一种是将对象的引用计数设置为0,但是仍然有一个指向它的指针。由于引用计数变为0,对象将被释放,因此指向该对象的指针变成了悬空指针。

漏洞

让我们看一下该漏洞。查看xnu-4903.221.2/osfmk/kern/task.c中的task_swap_mach_voucher函数。这是一个简单的函数,它应该将新的voucher和旧的voucher交换。但是它只是用new_voucher替换了old_voucher。

根据注释,task_swap_mach_voucher函数是一个占位符。可在xnu-4903.221.2/osfmk/mach/task.defs中找到它。

这证明它实际上是Mach API,因为MIG def文件正在为Mach接口生成代码。/BUILD/obj/RELEASE_X86_64/osfmk/mach/task.h中可以找到此函数的Mach消息格式。

/BUILD/obj/RELEASE_X86_64/osfmk/RELEASE/mach/task_server.c中可以看到对请求执行的检查。

下面是实际的实现。

简化一下。

convert_port_to_voucher函数通过调用ipc_voucher_reference函数将引用计数增加1。

convert_voucher_to_port函数通过调用ipc_voucher_release函数将引用计数减少1。

在task_swap_mach_voucher例程中,通过调用ipc_voucher_release函数(第4844行)将新voucher的引用计数减1。

此例程中引用计数的变化如下。
第4839行: new_voucher的引用计数+1
第4841行: old_voucher的引用计数+1
第4843行: task_swap_mach_voucher调用,old_voucher = new_voucher
第4844行: new_voucher的引用计数-1
第4857行: new_voucher的引用计数-1(因为old_voucher现在是new_voucher)
你可能已经看出问题了。可以将new_voucher的引用计数减少为0,从而释放该对象。并且old_voucher的引用计数可以增加很多。如果存储指向new_voucher的指针,然后使用漏洞将new_voucher的引用计数减少为0,这样就有可能获得指向new_voucher的悬空指针。

关于voucher

在继续之前,最好先查看ipc_voucher结构体并了解其中的成员。

第一件事是确定要在哪个对象中存储被释放的voucher的指针。最好的方法是在内核源代码中搜索ipc_voucher_t,并寻找易于获取和设置该指针的API。明显的地方之一是osfmk/kern/thread.h中的thread对象,该对象存储名为ith_voucher的voucher的引用。

可以使用thread_get_mach_voucher和thread_set_mach_voucher函数从用户态读取和写入voucher引用。同样,正如我们在第1部分中回顾的那样,我们需要查看MIG为该函数生成的代码。

一旦获得了指向已释放voucher对象的悬空指针,便可以使用其他对象占用已释放的voucher对象。但是这并不简单。voucher通常位于自己的ipc voucher zone中,如osfmk/ipc/ipc_voucher.c所示,其中zinit为voucher分配了一个新zone。

因此,被释放的voucher的内存将被放置在zone的freelist中,并在创建新voucher时分配给新voucher。为了用其他对象占用,唯一可行的方法是触发zone垃圾收集,它会将被释放的voucher的内存(最小大小为1页)移到zone映射中,然后这些内存就可以重新分配给其他对象。可以通过分配大量voucher并释放它们来做到这一点。
让我们再次仔细查看MIG为thread_get_mach_voucher生成的代码。假设我们确实用其他对象占用了已释放的voucher对象,则调用thread_get_mach_voucher应该成功而内核不会panic。在第2688行的thread_get_mach_voucher函数调用ipc_voucher_reference(voucher),这意味着该voucher应该具有有效的iv_refs成员。



在第2695行的convert_voucher_to_port函数如下所示。

在第503行首先检查voucher是否具有正确的引用计数。然后在第507行检查voucher端口的有效性。如果无效,则会分配一个新的voucher端口。这很棒,因为在分配伪造的voucher占用已释放的voucher时,如果以某种方式将iv_port指针设置为NULL,那么实际上还可以将新分配的voucher端口(IKOT_VOUCHER)返回到用户态(ith_voucher->iv_port)。这将使我们能够进一步操纵voucher。

通过OOL端口描述符进行堆风水

正如在第1部分中简要讨论的那样,复杂的Mach消息具有一个描述符成员,该成员有四种类型。

  • MACH_MSG_PORT_DESCRIPTOR:在消息中发送一个端口
  • MACH_MSG_OOL_DESCRIPTOR:在消息中发送OOL数据
  • MACH_MSG_OOL_PORTS_DESCRIPTOR:在消息中发送OOL端口数组
  • MACH_MSG_OOL_VOLATILE_DESCRIPTOR:在消息中发送易失性数据

对于MACH_MSG_OOL_PORTS_DESCRIPTOR的情况会调用ipc_kmsg_copyin_ool_ports_descriptor。

第2879行调用kalloc在kalloc zone中的堆中分配内存。第2902行中被替换为objects对象,该对象是端口指针的数组。第2909行在descriptor中迭代每个端口并检查其有效性,对端口调用CAST_MACH_NAME_TO_PORT函数。对于MACH_PORT_DEAD填充0xFFFFFFFFFFFFFFFF,对于MACH_PORT_NULL填充0x0000000000000000。因此通过使用OOL端口描述符发送大量Mach消息,可以使用有效指针,0xFFFFFFFFFFFFFFFFFF或0x0000000000000000填充kalloc zone。

管道缓冲区

管道是xnu中另一个用于IPC的系统调用。它创建一个分配一对文件描述符并允许单向数据流的管道。数据流经的缓冲区称为管道缓冲区。可以从缓冲区的读取端读取写入缓冲区的写入端的数据,但是并不能反过来。基本上你可以在同一地址空间中进行读写。另一个重要的事情是它占用内核虚拟地址空间,因此是在堆中分配内存的有用原语。默认情况管道缓冲区的大小设置为最大16384字节,所有管道缓冲区的大小设置为最大16MB。

如果数据已被写入管道缓冲区并且管道缓冲区已满,则认为该管道缓冲区已阻塞。要释放该管道缓冲区必须从中读取数据。可以通过分配许多管道缓冲区并将数据写入其中来利用管道缓冲区进行喷射。可以创建的管道总数是16MB除以16384字节,即1024。
管道缓冲区的优势在于,如果能够获得指向其中一个管道缓冲区的指针并读取其值,则基本上可以识别出是这1024个管道缓冲区中的哪个,然后就可以在这个特定的管道缓冲区中重新分配数据。
有了足够的背景知识,让我们详细介绍一下EXP吧。

EXP

如果还没有下载voucher_swap EXP代码的话可以在这里下载以便阅读接下来的内容。

Step 1:为voucher创建一个单独的线程

创建一个单独的线程,我们将在其中存储指向voucher的指针。该线程有一个ith_voucher成员,可以在其中保留对voucher的引用。

Step 2:创建喷射管道缓冲区用的管道

创建喷射管道缓冲区用的管道。前面提过,可创建的管道总数为1024。之后我们会看到其中一个管道对应的管道缓冲区将与fake port重叠。

Step 3:喷射端口

我们需要喷射许多端口。它们将占用现有的空洞,并迫使内核从zone map中分配新块。在此之后喷射管道缓冲区时,我们将假定它们位于端口的后面。根据反复试验,将filler_port_count设为8000。base port是使用create_ports创建的最后一个端口。记住这一点,因为将在第8步中用到。由于管道大小为16MB,将在管道缓冲区内创建的fake port应该在16MB之内。对于前2000个端口还增加了队列限制,该限制是可以立即发送到端口的最大消息数。这样做的原因是我们将使用OOL端口描述符向这些端口发送消息占用已释放的voucher,因此能够向这些端口发送更多的消息将有助于喷射。

Step 4:喷射管道缓冲区

接下来喷射管道缓冲区,希望它们刚好在端口后面。

将ipc_port写入管道缓冲区,将其12位的IKOT_TYPE设置为管道索引。具体步骤如下。
回调函数update调用iterate_ipc_ports。

iterate_ipc_ports给回调函数callback传递端口的偏移量。

在回调函数callback中使用端口的偏移量找到端口设置相应的成员(可以在Step 4第一张图中看到)。

Step 5:使用voucher喷射堆

接下来用voucher喷射堆并选择一个最终将被释放的voucher端口(uaf_voucher_port)。如前一篇文章所述,内存是从zone map中以块为单位获取的。对于特定的版本,一个块的大小是固定的(iPhone11,8 16C50的ipc_voucher是0x4000)。由于voucher的大小也是固定的(0x50),因此块中的voucher的数量也是固定的(0x4000/0x50=80)。我们将分配额外的块,在这些块中存储最终将释放的voucher(uaf_voucher_port)。前300个voucher基本上可以填补内存中的空洞。然后将voucher喷射入约16个块,将计划释放的voucher放入目标块(7-10块)。之后我们会看到这些块被OOL端口指针覆盖。

Step 6:继续喷射

接下来使用之前创建的端口喷射更多的内存。以后可以释放它以触发垃圾回收。我们已经创建了填充端口,并在前2000个端口上增加了队列限制。这时将前500个端口再次用于喷射。

Step 7:存储指向voucher的指针但释放引用


由voucher_release函数释放引用。实际上EXP创建了两个类似的函数,用于释放引用(voucher_release)和增加引用(voucher_reference),它们都是对voucher_tweak_references的包装,后者是对task_swap_mach_voucher的包装。漏洞在于task_swap_mach_voucher,该函数的参数是当前任务,新voucher(引用将被释放)和旧voucher(引用将被泄漏)。因此如果要释放一个voucher的引用,只需将其作为参数传递给新voucher,并且可以将旧voucher设置为MACH_PORT_NULL。

步骤8:创建将覆盖释放的voucher的OOL端口指针

现在需要创建将覆盖释放的voucher的OOL端口指针。EXP选择kalloc.32768 zone,因为BLOCK_SIZE(ipc_voucher)=0x4000,因此将更容易预测voucher的偏移量。端口指针的数量是根据zone大小除以uint64_t的大小(即端口指针的大小)得到的。然后,调用calloc分配具有端口指针的数组,每个端口指针的大小为mach_port_t,初始为0。iterate_ipc_vouchers_via_mach_ports函数用于遍历端口指针(该函数把它们当成voucher),并使用回调函数给出voucher的偏移,然后将voucher的iv_refs指向base port。之所以使用ool_ports[voucher_start+1],是因为iv_refs位于voucher的起始位置+0x8。还通过calloc将iv_port设置为MACH_PORT_NULL,以便以后调用thread_get_mach_voucher时获得一个新的voucher端口。

步骤9:释放第一次GC喷射

步骤10:释放先前创建的voucher,从而留下一个悬空的指针

步骤11:用OOL端口占用释放的voucher

第6步在前2000个端口上增加了队列限制并且将前500个端口再次用于喷射。现在对其它端口进行喷射,直到总喷射量达到内存容量的17%。ool_holding_ports指针从索引500(gc_port_count)开始,因为已经使用了500个。同时也使分配的内存大小为32768以便分配在kalloc.32768 zone中,这是通过保留每个消息的端口指针的数量来完成的(ool_port_count=ool_port_spray_kalloc_zone/sizeof(uint64_t),其中ool_port_spray_kalloc_zone=32768),顺利的话就能够占用释放的voucher。

ool_ports_spray_size_with_gc在每2MB(gc_step)喷射之间添加usleep(),以留出时间进行zone垃圾收集。
这些端口中的每一个都使用带有OOL端口描述符的Mach消息进行喷射。这将分配内核内存,并用端口指针填充它们。ool_ports_spray_port中的以下代码用于分配参数和发送消息。

步骤12:调用thread_get_mach_voucher以获取已释放voucher的voucher端口

如果base port的地址足够小,内核会认为引用计数仍然有效,调用thread_get_mach_voucher不会导致内核panic。

现在内存布局如下图所示。

步骤13:更改iv_refs以指向管道缓冲区

可以使用相同的漏洞(这次是增加引用)修改iv_refs值。iv_refs现在是指向base port的。因为喷射了大约16MB的管道缓冲区,将其增加4MB(base_port_to_fake_port_offset)之后应该指向管道缓冲区中的某个地方。

步骤14:识别voucher端口和重叠的fake port

现在需要知道iv_refs指向1024个管道缓冲区中的哪个。为此接收先前使用OOL端口描述符发送的消息。我们遍历消息中的所有描述符,然后将它们传递到将起始端口地址和端口总数作为参数的处理程序。然后使用iterate_ipc_vouchers_via_mach_ports遍历所有这些端口指针,通过将所有端口指针的大小除以voucher大小来给出所有可能的voucher地址。遍历端口指针时检查ool_ports[voucher_start+7] (即iv_port,iv_port在voucher结构体中的偏移为56)是否是一个有效的端口。因为只在uaf_voucher_port上调用了thread_get_mach_voucher,所以它的iv_port指向新分配的voucher端口。这样就可以找到uaf_voucher_port。将ool_ports[voucher_start+1] (即iv_refs,iv_refs在voucher结构体中的偏移为8)指向fake port。

步骤15:查找与fake port重叠的管道缓冲区

接下来需要查找与fake port重叠的管道缓冲区。使用mach_port_kobject得到fake port的IKOT_TYPE,这个值应该是管道的索引。

步骤16:清理未使用的内存

步骤17:设置原语以查找base port的地址

现在的任务是创建这个fake port,以便可以使用pid_for_task()技术读取4个字节的内核内存。本文的第1部分中讨论了这种技术。

将mach api调用mach_port_request_notification()发送到fake port,以添加一个请求:如果该fake port变为MACH_PORT_DEAD则将通知base port。这将导致fake port的ip_requests指向包含指向base port地址的指针的数组。

步骤18:查找base port的地址

遍历整个缓冲区,查看每个可能的端口的ip_requests,如果不为0,就说明找到了fake port。保存fake port在管道缓冲区中的偏移。然后将数据写入管道以便稍后可以读取。

步骤19:查找base port的地址

可以找到base port指针的地址,因为它位于ip_requests固定偏移处。接下来需要从base port指针中读取base port的地址。

stage0_read是一个非常方便的函数,能够一次读取32位的内核内存。基本上步骤如下。
1.在管道中创建一个fake port,设置所有必需的属性,将IKOT设置为IKOT_NONE
2.根据要读取的地址设置伪造的proc的地址(即bsd_info),在stage0_send_fake_task_message创建fake task并通过Mach消息将其发送到fake port
3.读取管道,从fake port的ip_messages.imq_message得到fake task的地址
4.重写fake port,将IKOT设置为IKOT_TASK,kobject设置为fake task的地址
5.调用pid_for_task读取内核内存

(这里参考TyphoonCon上的PPT:)

步骤20:计算fake port的地址

知道了base port地址和从base port到fake port的偏移量(在步骤3中已定义为base_port_to_fake_port_offset),因此可以计算出fake port地址。

步骤21:计算自己的任务端口的地址

现在知道了fake port的地址,可以创建端口了,我们可以创建一个更好的读取原语并将其称为阶段1。下一步是计算自己的任务端口的地址。stage1_find_port_address函数将输入作为任务,并使用阶段1的读取原语获取任务端口的地址。

步骤22:获取主机端口的地址

需要首先获取主机端口地址,在以后的步骤中可以使用该地址找到ipc_space_kernel。为了实现完整的内核读写,需要找到内核vm_map和内核ipc_space。

步骤23:从主机端口的ip_receiver获取ipc_space_kernel

第1部分中讲过ipc_port结构体具有一个指向ipc_space的receiver成员。可以通过读取主机端口ip_receiver(ip_receiver即receiver)成员来读取ipc_space_kernel。

步骤24:获取内核任务端口的地址

下一步是找到内核vm_map。首先找到内核任务端口,然后从该端口获取vm_map的偏移量。在堆中,内核任务端口靠近主机端口,因此,可以迭代该块找到内核任务端口,然后获取内核vm_map。

以下函数检查端口是否为内核任务端口。首先查看是否为IKOT_TASK类型。然后读取kobject指向的任务,在该任务中查找bsd_info以查找其指向的proc结构体,然后读取pid值。如果为0,则表示它是内核任务端口。

步骤25:获取vm_map的地址

现在已经找到了内核任务端口,可以读取vm_map,因为它处于固定偏移处。

步骤26:创建伪造的内核任务端口

现在可以创建一个位于管道缓冲区内的伪造的内核任务端口。

伪造的内核任务端口的原则是伪造的任务的map应指向内核vm_map,而receiver应指向ipc_space_kernel。可以通过以下两行代码实现。

步骤27:创建伪造的内核任务端口

现在有了一个功能齐全的内核任务端口,并且可以调用Mach API来读写内存,是时候构建一个更稳定的内核任务端口了。这次通过mach_vm_allocate分配内存,甚至在管道缓冲区之外也可以创建内核任务端口。

步骤28:清理不需要的资源

步骤29:清理更多不必要的资源,得到稳定的tfp0


完成!现在能够进行完整的内核读写。

总结

在这篇文章中,我们讨论了@_bazad发现的voucher_swap漏洞,并解释了iOS12上获得tfp0的步骤。在接下来的文章中,我们将着眼于Undecimus越狱和所有需要成功越狱iOS设备的步骤。

参考文献

1.Project Zero Issue tracker - https://bugs.chromium.org/p/project-zero/issues/detail?id=1731
2.iOS 10 - Kernel Heap Revisited - https://gsec.hitb.org/materials/sg2016/D2%20-%20Stefan%20Esser%20-%20iOS%2010%20Kernel%20Heap%20Revisited.pdf
3.Mac OS X Internals: A Systems Approach - https://www.amazon.com/Mac-OS-Internals-Approach-paperback/dp/0134426541
4.MacOS and iOS Internals, Volume III: Security & Insecurity: https://www.amazon.com/MacOS-iOS-Internals-III-Insecurity/dp/0991055535
5.CanSecWest 2017 - Port(al) to the iOS Core - https://www.slideshare.net/i0n1c/cansecwest-2017-portal-to-the-ios-core


文章来源: http://xz.aliyun.com/t/8633
如有侵权请联系:admin#unsafe.sh