固件分析之GoAhead框架ASP文件提取

阅读： 1

GoAhead是开源的web框架，由于其高性能，高可用性，在嵌入式系统中广泛使用。传统基于GoAhead框架开发的服务端会大量使用ASP脚本语言编写动态页面，并使用C/C++语言编写功能函数注册到脚本层中供ASP脚本调用。为了更全面的进行安全审计，我们不仅要关注功能函数的实现，同时也要分析ASP脚本的处理过程。本篇文章以某个交换机固件来作为例子，讲解如何提取ASP文件。

GoAhead版本

在分析带有GoAhead的固件之前，需要先知道该框架的版本，这样除了能知道历史漏洞（CVE编号）外，还能对着该版本的源码进行分析，快速定位到关键点。

获取版本

简单搜索字符串“GoAhead”可以非常快地定位到版本号，可以看到下面的版本号为2.1.5。

下载源码

由于GoAhead源码已经不在GitHub上维护了，官网的历史版本又只对企业用户开放，所以没法从官方渠道获取源码。

不过可以从之前网友共享的资源入手，来获取到这部分源码，最后在CSDN上下载了一个相近的版本2.1.8。

ASP文件

GoAhead Webserver支持类ASP的服务器端脚本语言，该脚本的语法和微软的ASP Active Server Page）语法基本相同，通过使用ASP脚本可以非常高效得开发动态页面。如下就是一个非常典型的ASP代码，可以看到ASP代码是嵌入” “<%…%>”之间的部分，其中的testasp函数的实现是在C/C++层中。

GoAhead为了更加方便的移植到不同嵌入系统上，其对文件的存储提供了非常灵活的方式，对于Linux这类系统，可以选择将文件存放在文件系统中，或者对于eCOS这类系统可以将文件直接以数组的形式直接固化到固件中，从而不必增加文件系统这部分模块。源码中的“WEBS_PAGE_ROM”宏就是控制不同的ASP文件存放方式。当定义了WEBS_PAGE_ROM意味着将文件以数组的形式存放在固件中。

对于存放到文件系统的ASP脚本文件，可以直接用binwalk提取，然后分析其代码逻辑。
对于固化到固件中的ASP脚本文件，binwalk往往提取不了，或者说提取不完全，这就需要自己手动提取这类文件。

存放格式

为了了解ASP文件的存放格式，首先得知道如何将文件传成数组：

建立清单文件files.txt，在里面编写需要转换文件路径：

D:/web/css/style.css

D:/web/home.asp

D:/web/images/button.jpg

//略

运行如下命令，将文件转换为数组：

webcomp D:/web files.txt >romfiles.c

打开romfiles.c可以看到全局变量文件索引表websRomPageIndex：

Page就是转换后的数组：

同时可以查看websRomPageIndexType结构，定义如下，为了提取所有表中的文件，需要定位到固件中websRomPageIndex的地址，然后编写脚本根据格式进行提取。

定位索引表

特征定位

回到GoAhead源码，为了定位websRomPageIndex全局表，需要找到调用它的地方，websRomPageReadData函数使用了这个表，该函数负责将文件数据拷贝到指定的缓冲区。

继续查看调用websRomPageReadData函数的地方，直到找到特征字符串（用于定位函数），最后找到了一个函数websAspRequest，非常适合定位。通过”Can’t read %s”字符串可以快速在固件中找到这个函数。

定位流程

最后简单总结了下定位流程：

动手实践

固件中定位表

通过字符串定位到websPageReadData函数，如下框起来的就是该函数：

继续进入函数分析，找到websRomPageIndex全局表：

编写脚本

已经在固件中定位到websRomPageIndex全局表的位置，编写如下脚本提取文件数据：

#extract files from GoAhead ROM

from struct import *

import os

def get_str(data,index):

ret=''

i=index

while data[i]!='\x00':

ret+=data[i]

i+=1

return ret

websRomPageIndex_addr=0x547084

load_base=0x40000

with open('test.bin','rb') as fd:

data=fd.read()

s_pos=websRomPageIndex_addr

while True:

path_addr=unpack('I',data[s_pos:s_pos+4])[0]

if path_addr==0x0:

break

path=get_str(data,path_addr-load_base)

print path

page_addr=unpack('I',data[s_pos+4:s_pos+4+4])[0]

page_size=unpack('I',data[s_pos+8:s_pos+8+4])[0]

page_data=data[page_addr-load_base:page_addr-load_base+page_size]

path='./aspfile/'+path

outpath,outfilename = os.path.split(path)

if not os.path.exists(outpath):

os.makedirs(outpath)

with open(path,'wb+') as fd:

fd.write(page_data)

s_pos+=16

提取的文件如下所示：

总结

本篇主要介绍了提取ASP文件的一些思路，可以看到，提取方法虽然不难，但是分析过程还是需要一定的耐心。在提取ASP文件后，通过查看其源码，就能定位到一些存在于ASP脚本中的安全问题，审计方法和传统web审计方法类似，这里就不再赘述了。

作者：工业物联网安全实验室陈杰