大内高手—栈堆

it2022-05-09  20

转载时请注明出处和作者联系方式:http://blog.csdn.net/absurd

作者联系方式:李先静 <xianjimli at hotmail dot com>

更新时间:2007-7-9

 

l         

栈作为一种基本数据结构,我并不感到惊讶,用来实现函数调用,这也司空见惯的作法。直到我试图找到另外一种方式实现递归操作时,我才感叹于它的巧妙。要实现递归操作,不用栈不是不可能,而是找不出比它更优雅的方式。

 

尽管大多数编译器在优化时,会把常用的参数或者局部变量放入寄存器中。但用栈来管理函数调用时的临时变量(局部变量和参数)是通用做法,前者只是辅助手段,且只在当前函数中使用,一旦调用下一层函数,这些值仍然要存入栈中才行。

 

通常情况下,栈向下(低地址)增长,每向栈中PUSH一个元素,栈顶就向低地址扩展,每从栈中POP一个元素,栈顶就向高地址回退。一个有兴趣的问题:在x86平台上,栈顶寄存器为ESP,那么ESP的值在是PUSH操作之前修改呢,还是在PUSH操作之后修改呢?PUSH ESP这条指令会向栈中存入什么数据呢?据说x86系列CPU中,除了286外,都是先修改ESP,再压栈的。由于286没有CPUID指令,有的OS用这种方法检查286的型号。

 

一个函数内的局部变量以及其调用下一级函数的参数,所占用的内存空间作为一个基本的单元,称为一个帧(frame)。在gdb里,命令就是用来查看指定帧的信息的。在两个frame之间通过还存有其它信息,比如上一层frame的分界地址(EBP)等。

 

关于栈的基本知识,就先介绍这么多,我们下面来看看一些关于栈的技巧及应用:

1.         backtrace的实现

callstack调试器的基本功能之一,利用此功能,你可以看到各级函数的调用关系。在gdb中,这一功能被称为backtrace,输入bt命令就可以看到当前函数的callstack。它的实现多少有些有趣,我们在这里研究一下。

 

我们先看看栈的基本模型

参数N

↓高地址

参数

函数参数入栈的顺序与具体的调用方式有关

参数 3

参数 2

参数 1

EIP

返回本次调用后,下一条指令的地址

EBP

保存调用者的EBP,然后EBP指向此时的栈顶。

临时变量1

 

临时变量2

 

临时变量3

 

临时变量

 

临时变量5

↓低地址

 

要实现callstack我们需要知道以下信息:

l         调用函数时的指令地址(即当时的EIP)。

l         指令地址对应的源代码代码位置。

关于第一点,从上表中,我们可以看出,栈中存有各级EIP的值,我们取出来就行了。用下面的代码可以轻易实现:

#include <stdio.h>

 

int backtrace(void** BUFFER, int SIZE)

{

    int  n = 0;

    int* p = &n;

    int  i = 0;

 

    int ebp = p[1];

    int eip = p[2];

 

    for(i = 0; i < SIZE; i++)

    {

        BUFFER[i] = (void*)eip;

        p = (int*)ebp;

        ebp = p[0];

        eip = p[1];

    }

 

    return SIZE;

}

 

#define N 4

static void test2()

{

    int i = 0;

    void* BUFFER[N] = {0};

 

    backtrace(BUFFER, N);

 

    for(i = 0; i < N; i++)

    {

        printf("%p\n",  BUFFER[i]);

    }

 

         return;

}

 

static void test1()

{

    test2();

}

 

static void test()

{

    test1();

}

 

int main(int argc, char* argv[])

{

    test();

 

    return 0;

}

程序输出:

0x8048460

0x804849c

0x80484a9

0x80484cc

 

关于第二点,如何把指令地址与行号对应起来,这也很简单。可以从MAP文件或者ELF中查询。Binutil带有一个addr2line的小工具,可以帮助实现这一点。

[root@linux bt]# addr2line  0x804849c -e bt.exe

/root/test/bt/bt.c:42

 

2.         alloca的实现

大家都知道动态分配的内存,一定要释放掉,否则就会有内存泄露。可能鲜有人知,动态分配的内存,可以不用释放。Alloca就是这样一个函数,最后一个a代表auto,即自动释放的意思。

 

Alloca是在栈中分配内存的。即然是在栈中分配,就像其它在栈中分配的临时变量一样,在当前函数调用完成时,这块内存自动释放。

 

正如我们前面讲过,栈的大小是有限制的,普通线程的栈只有10M大小,所以在分配时,要量力而行,且不要分配过大内存。

 

Alloca可能会渐渐的退出历史舞台,原因是新的C/C++标准都支持变长数组。比如int array[n],老版本的编译器要求n是常量,而新编译器允许n是变量。编译器支持的这一功能完全可以取代alloca

 

这不是一个标准函数,但像linuxwin32等大多数平台都支持。即使少数平台不支持,要自己实现也不难。这里我们简单介绍一下alloca的实现方法。

 

我们先看看一个小程序,再看看它对应的汇编代码,一切都清楚了。

#include <stdio.h>

 

int main(int argc, char* argv[])

{

    int  n = 0;

    int* p = alloca(1024);

 

    printf("&n=%p p=%p\n", &n, p);

    return 0;

}

汇编代码为:

int main(int argc, char* argv[])

{

 8048394:       55                      push   

转载请注明原文地址: https://win8.8miu.com/read-1479902.html

最新回复(0)