Liuw's Thinkpad

想要赢就先学会输,想要成功就先学会失败

Archive for the ‘unicode’ tag

又画蛇添足了一回

with 2 comments

想写个Python小程序,放到appengine上,把一个字符串反转。

原来是Python shell下面试的时候,中文的编码很奇怪,使用的是两字节的编码,不知道叫嘛。

于是写了一个小函数去判断双字节的非ASCII字符。

然后传到appengine上,发现不好用了。

后来小查一下,原来appengine传进来的编码已经把每个中文作为一个编码了。

又囧了一回。

总的来说,Python 2.5对于Unicode的支持还不是特别彻底。

没办法,谁让我以前从来没有担心过编码的问题呢。Orz

http://imliuw.appspot.com

Written by liuw

October 31st, 2009 at 10:59 pm

Posted in Programming

Tagged with , , ,

Windows Mobile栈溢出漏洞利用

with 6 comments

这是暑期实习的成果。原来查了Phrack和PacketStorm等网站,都没有发现这方面的文档。

这篇文章主要解决了如何编写Unicode-proof ARM Shellcode的问题,个人觉得还是比较有意义的。其实也不一定是局限于Windows Mobile系统,只要是ARM架构,遇到要写Unicode-proof Shellcode这样的问题,这篇文章里面的方法都可以作为参考,因而放上来与大家一起分享。

本文采用Attribution-Noncommercial-Share Alike 2.5 China Mainland授权。

文章有点长,所以只放目录了,有兴趣看的再下PDF吧由于和导师有协议,所以不能把文章放出来,实在需要的联系我。

目 录
第一章 绪论 4
1.1 研究背景和意义 4
1.2 章节安排 4
第二章 相关概念和工具 5
2.1 Windows Mobile 6.1系统 5
2.2 ARM架构 5
2.3 Unicode编码 6
2.4 缓冲区溢出漏洞 6
2.5 相关工具软件 6
第三章 ARM架构 7
第四章 Windows CE 5.2 7
4.1 Windows CE 5.2的内存架构 7
4.2 当前运行进程的内存映射情况 9
4.3 Windows CE 5.2下的ARM栈祯结构 10
4.4 Windows CE 5.2下的ARM汇编 10
4.5 Windows CE 5.2系统安全性分析 11
第五章 漏洞分析与攻击 12
5.1 漏洞描述 12
5.2 漏洞成因 12
5.3 分析与攻击 12
第六章 已知的Shellcode编写技术 14
6.1 IA-32上Unicode-proof Shellcode的编写 14
6.2 纯数字字母的ARM Shellcode的编写 15
6.3 对两个方法的总结 16
第七章 Unicode-proof ARM Shellcode 16
7.1 ARM与x86在Shellcode编写上的差异 17
7.2 指令分析 17
7.2.1 Condition field 17
7.2.2 Data-processing instructions 18
7.2.3 Branch instructions 21
7.2.4 Load and store instructions 23
7.3 Shellcode编写方法:DirectConstructor 24
7.4 Shellcode实例:DirectConstructor方法 26
7.5 Shellcode编写方法:MagicLoopDecoder 31
7.6 Shellcode实例:MagicLoopDecoder方法 32
7.7 对编写Shellcode的一些建议 36
第八章 总结和展望 36
8.1 项目已完成部分 37
8.1.1 对千千静听1.29版的攻击 37
8.1.2 Unicode-proof ARM Shellcode的编写方法 37
8.1.3 辅助工具的编写 37
8.2 未来工作 37
8.2.1 Thumb状态指令Shellcode的编写 37
8.2.2 全自动化Shellcode生成工具的编写 38
参考文献 38
致谢 39
附录 40
A.1 trans工具的使用 40
A.2 findmagic工具的使用 41

Written by liuw

September 1st, 2009 at 2:50 pm

找出Unicode可以与ANSI互相转化的子集

without comments

还是Unicode的问题,在 Easier said than done 已经说过了。思来想去,还是觉得假如可以找到互相转化的集合比较好,只要这个集合有一定的规模,那么后面的工作还是有得做的,于是写个小程序去找出这个集合。

/*
* FindUnicode.cpp
* by liuw
* @ LOIS @ CAS
*/

#include<stdio.h>
#include<windows.h>

int main(int argc, char **argv)
{
	TCHAR tc1 = 0x0;
	TCHAR tc2 = 0x0;
	UCHAR uu[2] = {0};

	FILE *fp;

	fp = fopen("G:\\Out.txt", "w");

	for (; tc1 < 0xffff; tc1++)
	{
		WideCharToMultiByte(CP_ACP, NULL, &tc1, 1, (LPSTR)uu, 2, NULL, FALSE);
		MultiByteToWideChar(CP_ACP, NULL, (LPCSTR)uu, 2, (TCHAR*)&tc2, 1);
		INT res = memcmp((void*)&tc1, (void*)&tc2, sizeof(TCHAR));
		if (res == 0)
			fprintf(fp, "Unicode: %04x ANSI: %02x%02x\n", tc1, uu[0], uu[1]);
	}

	fclose(fp);
	return 0;
}

最后生成的文件大小有612KB,看来还是不少的。

Written by liuw

July 24th, 2009 at 7:15 pm

Posted in Programming

Tagged with , ,

Easier said than done

with one comment

在看PicoWebServer的一个security flaw分析,嗯,典型的栈溢出。虽然多了一个Unicode,但是还是可以做到DoS攻击的。作者的分析也挺不错,把出现问题的地方说得清楚了。

不过末尾有一句话有点大雷了:

An attacker has full control over the device if he is able to let the overwritten return address point to a “0D F0 A0 E1″ (“MOV PC, SP”) equivalent byte sequence. Since SP is the only register pointing into the potential shellcode supplied by an attacker, the aim of an attacker is to let PC equal SP.

还好作者用的是if he is able to,还有点不确定的意思。我是老老实实地用IDA Pro搜索了整个地址空间(是的,“整个”),也没有发现有这样的序列。首先,编译器不会产生这样的代码,那么在代码段内找是徒劳的了。其次,数据段有的话,那真是纯粹巧合了,看人品,而且数据段能不能执行,还是未知之数。

所以啊,总是easier said than done,虽然现在有这样的possibility,但是实际上做不做得到,那还真是认真考证一下才清楚。

师兄也和我说了,搞个什么MessageBox出来,那是不难,但是我们的目标还是要再远一点,要有点实际的东西出来。我也挺认同的,理念上的东西,大家都清楚,但是到底能不能用,可不可以,那还真是要做过才知道。不产生实际危害的漏洞,不是好漏洞(DoS不在考虑之列,这是比较次的危害)。

提一下我们现在的问题是什么:某个软件,接收ANSI字符(0×00-0xFF),然后把接收到的字符转换成Unicode再存储到缓冲区,然后造成了缓冲区溢出。问题是,我们虽然可以改写栈上PC的值,但是这是有限制的(Unicode转换的存在)。如何把控制流改到我们注入到栈上的shellcode中,这需要很多工夫了。目前这是第一步,先不考虑shellcode是否有效,就是要把PC的值搞到栈上就OK了。

这一周基本都在考虑这个问题,也有不少的想法,但是最后都被自己否掉了。罗列如下吧:

  1. 把要发过去的ANSI串A看作是Unicode,先进行Unicode到ANSI的变换得到B,把B发过去,这样在Server端变换之后,就变成了A。这个想法的致命点是,ANSI只能映射Unicode的一个很小的子集,也就是说,变换过程不是满射的。而且从比例来看,只有1%左右有情况可以逆变换成功。于是有第二个想法。
  2. 寻找Unicode编码中的闭包子集S,发过去S中的A变换后得到的B仍然在S之内,这样可以很容易通过控制A的生成来得到理想的B。但是现在我还没有找到这样的闭包。即使找到,也只有万里长征第一步,因为这样的S估计不会很大,变换出来的编码有限的话,对于地址的选择就很有讲究了。
  3. 在其他段寻找如MOV PC, SP这样的序列(也就是上面文章的想法)。不用说,目前失败。
  4. 构造某个系统调用/API的输入,然后跳转到那个系统调用/API。要求是这个系统调用/API足够强大,可以完成很多功能。但是矛盾的地方是,功能强大的API通常参数是十分复杂的,很难构造。而且,Windows CE的calling convention中,首先使用R0-R4去传送参数,不够才使用栈。怎么让R0-R4符合API的要求?看运气?否掉。
  5. 从转换函数入手,当然,这个想法很烂。但是也不是说完全没有可能,先留着呗。

现在基本是能想到的都想了,但是总是有这样那样的限制,使得这些想法成为不可能。明天和师兄讨论一下,看他有没有什么其他想法吧。

Written by liuw

July 23rd, 2009 at 7:23 pm