RCTF 2020逆向Cipher

查看原文

其他

RCTF 2020逆向Cipher

iyzyi 看雪学院 2021-03-06

本文为看雪论坛精华文章

看雪论坛作者ID：iyzyi

Ghidra反编译mips64程序

题目给出 cipher 程序和 ciphertext 密文。

ciphertext：

最后的 0a 是换行符。

用 reafelf -h file 看一下 cipher 程序信息：

mips64的程序，大端。

ida 无法反编译 mips64 的代码，网上查到说 ida 的 retdec 插件可以反编译mips，但是我去 github 看了看官方介绍，似乎不支持 mips64：

然后无意间搜索到一款由美国安全局开发的开源逆向软件——Ghidra，可以反编译 mips64。

安装很简单。先安装好 jdk11，可以不添加环境变量。然后运行ghidraRun.bat，如果没添加环境变量的话，会询问你 jdk11 的安装目录（填写根目录）。然后就可以运行了。

较为详细ghidra操作的学习可以移步全面详解 Ghidra。

建立一个新 project，把 ciphter 拖进来：

最后分析好的界面如下：

左侧中间窗口可以查看函数。

main 函数

从 flag 文件中读入 flag，然后调用 cipher。

cipher 函数

根据变量的实际含义改一下变量名（单击变量后按 L 键）：

16 个字节为一组（两个 ulonglong）进行分组，第 17 行代码的作用就是求一共几组。

右移 4 其实就是除以 16。先减一再移位最后再加一的作用是让不足一组的算作一组，代入个实际的数算一算就容易理解了。

CONCAT44()是 ghidra 自己定义的一个函数，因为一些汇编操作无法通过已有的c语言中的函数进行简单描述：

CONCATxy（x,y的值可以变）系列的函数其实就是拼接函数，比如说CONCAT31(0xaabbcc, 0xdd) = 0xaabbccdd。

具体的解释可以查看官方手册：

依次点击Ghidra Functionality > Decompiler > Internal Decompiler Functions：

顺便吐槽下，ghidra 很新，所以很多知识很难查到，google 都很难查到相关内容。不像 ida，遇到的问题基本网上都很容易找到前辈们的中文总结。

第 18 到 20 行得到了两个随机数，并分别取 char，并保存至 param_2[0] 和param_2[1]。

注意这里的 param_2 这个数组的变量类型不确定，伪代码中用undefined来注明了。

我对此处的误解导致了我一直没有成功解出 flag，直到动态调试才发现错误所在。等下我会细说此处。

然后进入循环，调用 cipher，每次循环处理一组数据（16 个字节，2 个无符号长整型）。

最后第 28 行开始，输出处理后的数据。

encrypt函数

乍一看就是一些异或和循环移位，应该没有特别难的地方。所以，等下会有个但是。

阅读一边后，很容易发现一个问题，第 8 行声明的 in_a2 这个指针，在第17、18 行被调用。

但是，代码中没有任何对这个指针的赋值地址的行为，我们（和程序）根本不知道这个指针指向何处（如果按照伪代码的逻辑来的话）。

所以很容易想到，是不是 ghidra 反编译出了一点小差错。

我们来看看汇编代码：

小白的我第一次接触 mips 指令集，以下内容如有谬误，希望大佬们可以斧正~

首先介绍几个用到的 mips 的指令：

为了不引起混淆，先说一点：

因为伪代码中的变量大多都是 ulonglong(64bit)，我看到下文中的双字，还在纳闷这不是 32 位的吗？

查资料才明白，不同的架构，规定的数据类型是不一致的。mips64 的数据类型没搜到，应该和 mips32 类似吧。这和 x86 差异挺大的，像我这种小白很容易误解。

指令的主要任务就是对操作数进行运算，操作数有不同的类型和长度，MIPS32 提供的基本数据类型如下：

（1）位（b）：长度是 1bit。

（2）字节（Byte）：长度是 8bit。

（3）半字（Half Word）：长度是 16bit。

（4）字（Word）：长度是 32bit。

（5）双字（Double Word）：长度是 64bit。

（6）此外，还有 32 位单精度浮点数、64 位双精度浮点数等。

LD rt, offset(base)

从存储器中读取双字的数据到寄存器中。

rt 是寄存器，offset 是偏移量，base 是基址。

SD rt, offset(base)

把双字的数据从寄存器存储到存储器中。

rt 是寄存器，offset 是偏移量，base 是基址。

单击伪代码中第 17 行中的 in_a2，中间的汇编自动跳转到相关的指令位置，如图所示：

s8 表示的是栈。v0 是最常使用的寄存器。

我们得知：in_a2 在栈中 0x08 的位置，即 stack[-0x8]，结合划线处，我们可以判断，encrypt 是有三个参数的，第三个参数就是 in_a2，是一个指针。

根据指令 ld(load double word) 判断，应该是个 longlong* 或者 ulonglong*类型的指针。

Ghidra 有个很有用的功能，如果你对伪代码的不满意，可以进行一定程度的修改。

在如图所示处右键，选择第一项，进行函数签名的修改。

手动添加第三个参数：

修改后：

到此时，目前代码中唯一有点问题的就是第 14、15 行的 concat44() 这个函数，其他的部分都是正常的 c 语言代码。

看不懂伪代码，直接读汇编吧。

伪代码中的 uVar1 是[s8 + 0x30]。这其实是 x86 汇编中的表示方式，因为大多数人更熟悉 x86，所以本文中我用了这样表示方式。它意思是取栈中偏移为0x30 处的值。

伪代码中 uVar1 是[s8 + 0x30]，uVa2r 是[s8 + 0x38]。

所以 uVar1 = [__edflag], uVar2 = [__edflag + 0x8]。

cipher 函数中调用本函数时，__edflag 传进来的实参是(int)input_flag + i * 0x10，即每个分组的首地址。

所以uVar1是第一个 ulonglong 的地址，uVar2 是第二个 ulonglong 的地址。

其实不用分析，靠猜也能猜出这两个变量就是分组的数据，我做题的时候也是直接猜测的，写本文的时候才开始读的这部分汇编。

其实有时候汇编代码反而比伪代码更容易读懂。

比如本函数的第 22 行，(uStack24 >> 8) + (uStack24 << 0x38)，有点意思，其实就是一个 64 位的循环右移，汇编中一行就搞定了：

第23行的 (uStack32 >> 0x3d) + uStack32 * 8 就更有意思了：

没想到吧，参数是0x1d，但是却移了0x3d位。为什么？请从下图找答案。

关于移位指令：

加密逻辑

分析到这一步，本函数的逻辑应该很明显了。

我们用 ror64 表示 64 位的循环右移，可以将加密逻辑整理为：

def enc(a, b, c, d): v32, v24 = c, d v40 = (ror64(b, 8) + a) ^ v32 v48 = ror64(a, 0x3d) ^ v40 for i in range(0x1f): v24 = (ror64(v24, 8) + v32) ^ i v32 = ror64(v32, 0x3d) ^ v24 v40 = (ror64(v40, 8) + v48) ^ v32 v48 = ror64(v48, 0x3d) ^ v40 print(hex(v48), hex(v40))

a、b 分别是送入的两个 ulonglong 数据。

c、d 是和我们之前分析的 encrypt 函数添加的第三个参数 array 有关，分别是array[0]和array[1]。先下结论 c 和 d 与 cipher 函数中获取的两个随机数有关，什么关系，下文会细说。

一共进行 0x1f 轮的加密处理。

v32 和 v24 是一组 key（密钥），在每轮的加密中都会进行变换，其值与c,d,i有关。

怎么看出它是key的？因为其值与密文无关，而反过来密文与它有关。

v48 和 v40 是密文。其值与 plaintext(a,b), key(c,d) 有关。

下面重点说一下 c 和 d 这俩值。

在 cipher 函数的伪代码中可以看到：

如果你的伪代码中看不到 encrypt 函数的第三个参数，请退回上文，按照步骤修改 encrypt 函数的 signature。

可以看到 c、d 和随机数有关。

如果靠猜的话，我估计绝大多数人，都会猜测c = param_2[0], d = param_2[1]。是的，我也是这么猜的，这一错误的猜测使得我整整一天都在查找错误何在。

此处伪代码很难分析啊，最大的问题在于我们不知道 param_2 的变量类型，伪代码给出的是 undefined * 代表未知。再加上这么明显的暗示！

让谁来看，都会觉得是两个随机数分别强制格式转化为一个字节的数据，然后送入param_2[0]和param_2[1]，这两个都是 ulonglong，然后传入 encrypt函数中当作 key。

当然可以通过汇编来做出判断：

当然这对我来说是马后炮，当我动调之后才理解了这段汇编的含义。

最后我是通过动态调试了解的具体细节。这段赋值过程特别有意思，这也是我写篇文章的主要目的。文章到这里才刚刚进入主题。

动态调试（qemu+ida）

qemu运行mips64程序

要想动态调试，首先要能运行这个程序。

QEMU（quick emulator）是一款由 Fabrice Bellard 等人编写的免费的可执行硬件虚拟化的（hardware virtualization）开源托管虚拟机（VMM）。

其与 Bochs，PearPC 类似，但拥有高速（配合KVM），跨平台的特性。

QEMU 是一个托管的虚拟机镜像，它通过动态的二进制转换，模拟 CPU，并且提供一组设备模型，使它能够运行多种未修改的客户机 OS，可以通过与KVM（kernel-based virtual machine开源加速器）一起使用进而接近本地速度运行虚拟机（接近真实电脑的速度）。

QEMU 还可以为 user-level 的进程执行 CPU 仿真，进而允许了为一种架构编译的程序在另外一种架构上面运行（借由 VMM 的形式）。

说人话：通过 qemu 能运行 mips64 架构的程序。

安装qemu

以下过程可能存在谬误，我试图复现环境，但是暂时没能成功，稍后会琢磨琢磨，请大家先移步https://www.cnblogs.com/WangAoBo/p/debug-arm-mips-on-linux.html

以 ubuntu 为例：

apt install qemu-user-static

我做题时应该是使用 apt install qemu-user 进行安装的，但是滚档重新安装时发现虽然能够安装成功，但是运行文件时报错：

qemu: uncaught target signal 11 (Segmentation fault) - core dumped
Segmentation fault (core dumped)

尝试了几次都不行，改用了apt install qemu-user-static

运行

静态链接的程序可以像正常程序一样运行。

如果是动态链接的程序直接运行会报错：

需要安装相对应的链接库，然后通过 qemu 运行程序，同时指明共享库（-L参数）。

以本文 mips64 程序为例：

查找相关库：

apt-cache search "libc6" | grep mips64

mips64el 是小端，注意区分。

我们在列表中选择形如 libc6-mips64-cross 的包进行安装：

sudo apt install libc6-mips64-cross

然后运行程序，同时指定共享库的路径：

qemu-mips64-static -L /usr/mips64-linux-gnuabi64/ cipher

注意不同架构对应的 qemu 的命令不同，可以先输入 qemu，然后按下 tab 键查看所有命令。

输入 /usr/mips64 的时候也是按下 tab 键，有惊喜。

可以看到程序运行，并输出密文。（main 函数中通过 putchar 输出密文而不是保存到文件中）

ida远程动态调试

服务端：

qemu-mips64 -L /usr/mips64-linux-gnuabi64/ -g 23946 ./cipher > out

-g 在 23946 端口开一个 gdb 调试

客户端：

Debugger->attach->remote GDB debugger

填写服务端 ip 和端口，然后点击 Debug options：

箭头处的两项要勾选，不然一进入调试状态，程序就执行完成并退出了。然后点击图中划线处 Set specific options。

选择相应的架构：

此后点击多次ok：

最后进入调试：

很不幸，前面说过，ida 无法反编译 mips64。所以只能看汇编了。

程序一开始停在系统领空。

按上一会 f8（大概三四十步）即可跳转至程序领空。

先跳出系统领空再进行地址的跳转。否则容易导致代码没加载成功：

在程序领空内，g 直接跳转到某处都容易导致代码没加载成功。

此时按 c 转换成汇编语言时容易出现下图所示的错误，ida 崩溃退出。

所以我们虽然通过静态能知道各个函数的地址，但也不要直接跳转，先跳出系统领空后，再按 g 并输入地址进行跳转。跳转时也不要直接跳，先跳到函数的起始地址，再跳这个函数内部的地址。

然后正式开始动调。之后的过程和正常题目的调试没啥区别，就是指令集不一样罢了，照着指令手册慢慢分析就行。

我们动调的目标是搞清楚前面归纳的 c,d 两个参数和 cipher 函数中生成的两个随机数之间的关系。

所以跳出系统领空后，我们先跳转到 cipher 函数的起始地址 120000F5C，并按 c 分析汇编代码：

动调中看不到函数信息，所以可以先静态看一下 rand 的调用位置：

然后跳转到与随机数相关的位置，f8 走几步，观察寄存器中值的变化：

下图寄存器 v0 中放的是第一个随机数：

取低位字节放入 v1，得到单字节的 0x85：

前面是 ff 开头应该是因为 0x85>0x7f，char 中算作负数，seb 指令是 Sign-Extend Byte，有符号扩展字节。

第二个操作数同理：

拿到单字节 0xf1：

然后我们跳转到 encrypt 函数，看看 c,d 两个变量的值。

从 cipher 函数直接跳转到 encrypt 函数同样容易出现代码未加载的问题，我们可以先跳转到 cipher 中调用 encrypt 函数的位置，然后 f7 步入。

静态查看地址：

动调在此处 f7 步入：

ghidra 可以轻松确定 encrypt 中我们归纳的那个 c,d 的传值的位置：

动调运行到此处：

可以看到此时 c = 0x85f1 0000 0000 0000

继续运行：

所以 c = char(rand1)<<56 + char(rand2)<<48，d = 0

这样我们就知道了 c,d 的值与随机数的关系。

这个的动调太容易让程序以及 ida 崩溃了，不知道大佬们有没有什么方法能使得跳转地址时代码可以正常加载出来，减少错误率。

逆向逻辑分析

为了方便大家，所以把上面归纳的加密逻辑复制到此处：

c 和 d 每次运行程序都不一样，但是好在有效取值在两个字节的范围内，可以爆破。

爆破时的每次尝试可以得到一组假定的 key(c,d)即key(v32, v24)，经过 0x1f轮的迭代，可以得到最后一轮的 v32, v24（上文说过，因为 v32, v24 只与c,d,i 有关，i 是迭代的轮数）。

我们已知密文，即最后一轮迭代得到的的 v48, v40；并可以以爆破的方式假定 c,d 从而求出最后一轮的 v32, v24。

可以通过v48 = ror64(v48, 0x3d) ^ v40得到上一轮的v48

再通过v40 = (ror64(v40, 8) + v48) ^ v32得到上一轮的v40

再通过v32 = ror64(v32, 0x3d) ^ v24得到上一轮的v32

再通过v24 = (ror64(v24, 8) + v32) ^ i得到上一轮的v24

如此逆向迭代，可求出明文。

解密脚本

import struct def solve(): #with open('ciphertext', 'rb')as f: # enc = f.read()

    enc = b'*\x00\xf8+\xe1\x1dw\xc1\xc3\xb1q\xfc#\xd5\x91\xf40\xf1\x1e\x8b\xc2\x88YW\xd5\x94\xabwB/\xebu\xe1]v\xf0Fn\x98\xb9\xb6Q\xfd\xb5]w6\xf2\n'

for i in range(0x10000): v32, v24 = get_final_r1_r2(i*0x1000000000000, 0) flag = b'' for k in range(len(enc)//16): f1, f2 = decrypt(enc[k*16:k*16+16], v32, v24) flag += struct.pack('>Q', f1) + struct.pack('>Q', f2) if b'RCTF' in flag: print(hex(i), flag) def decrypt(byte16, fc, fd): v48 = struct.unpack('>Q', byte16[:8])[0] v40 = struct.unpack('>Q', byte16[8:])[0] v32, v24 = fc, fd for i in range(0x1e, -1, -1): v48 = rol64(v48 ^ v40, 0x3d) v40 = rol64(ull((v40 ^ v32) - v48), 8) v32 = rol64(v32 ^ v24, 0x3d) v24 = rol64(ull((v24 ^ i) - v32), 8) v48 = rol64(v48 ^ v40, 0x3d) v40 = rol64(ull((v40 ^ v32) - v48), 8) return v48, v40 def get_final_r1_r2(c, d): v32, v24 = c, d for i in range(0x1f): v24 = ull(ror64(v24, 8) + v32) ^ i v32 = ror64(v32, 0x3d) ^ v24 return v32, v24 def rol64(value, k): return ull(value << k) | ull(value >> (64-k)) def ror64(value, k): return ull(value << (64-k)) | ull(value >> k) def ull(n): return n & 0xffffffffffffffff solve() #RCTF{9876235e3a9bd69cfb6b4a3dfcdbca70f3054f91}

跑两分钟出结果。

没啥要注意的，记得进行加减等操作时注意保持 ulonglong 的位数就好。

参考

全面详解 Ghidra
（https://zhuanlan.zhihu.com/p/59637690）
如何在 linux 主机上运行/调试 arm/mips架构的 binary（https://bbs.pediy.com/thread-259892.htm）
QEMU+IDA 远程调试 mips 可执行文件（https://bbs.pediy.com/thread-246192.htm）
mips64 指令手册

- End -

看雪ID：iyzyi

https://bbs.pediy.com/user-866156.htm

*本文由看雪论坛 iyzyi 原创，转载请注明来自看雪社区。

这样的洞庭湖决堤，实在让人同情不起来

李尚福、魏凤和双双被拿下，与美国一份报告是否有关？

抗洪靠嘴，堵漏靠沙？印度官员真是绝了！

有的人走了，却永远活着

圈内疯传某谣言