字符串常量到底存放在哪个存储区


字符串常量到底存放在哪个存储区
2013年02月23日 16:57:57 若水三千你是一千 阅读数 40499更多
分类专栏: c语言

字符串常量,放在哪个存储区呢?是“自动存储区”还是“静态存储区”中?

比如:

char *pstr=“hello world!”;
这里,”hello world!”是一个字符串常量,
pstr是在栈中的变量。
我想问,字符串常量,在哪个内存区域分配空间呢?

好像应该不是在“栈区“分配空间吧!!!

一、预备知识—程序的内存分配
一个由C/C++编译的程序占用的内存分为以下几个部分
1、栈区(stack)— 由编译器自动分配释放 ,存放函数的参数值,局部变量的值等。其
操作方式类似于数据结构中的栈。
2、堆区(heap) — 一般由程序员分配释放, 若程序员不释放,程序结束时可能由OS回
收 。注意它与数据结构中的堆是两回事,分配方式倒是类似于链表,呵呵。
3、全局区(静态区)(static)—,全局变量和静态变量的存储是放在一块的,初始化的
全局变量和静态变量在一块区域, 未初始化的全局变量和未初始化的静态变量在相邻的另
一块区域。 – 程序结束后由系统释放。
4、文字常量区 —常量字符串就是放在这里的。 程序结束后由系统释放
5、程序代码区—存放函数体的二进制代码。

二、例子程序
这是一个前辈写的,非常详细
//main.cpp
int a = 0; 全局初始化区
char *p1; 全局未初始化区
main()
{
int b; 栈
char s[] = “abc”; 栈
char *p2; 栈
char *p3 = “123456”; 123456\0在常量区,p3在栈上。
static int c =0; 全局(静态)初始化区
p1 = (char *)malloc(10);
p2 = (char *)malloc(20);
分配得来得10和20字节的区域就在堆区。
strcpy(p1, “123456”); 123456\0放在常量区,编译器可能会将它与p3所指向的”123456″
优化成一个地方。
}

二、堆和栈的理论知识
2.1申请方式
stack:
由系统自动分配。 例如,声明在函数中一个局部变量 int b; 系统自动在栈中为b开辟空

heap:
需要程序员自己申请,并指明大小,在c中malloc函数
如p1 = (char *)malloc(10);
在C++中用new运算符
如p2 = new char[10];
但是注意p1、p2本身是在栈中的。

2.2
申请后系统的响应
栈:只要栈的剩余空间大于所申请空间,系统将为程序提供内存,否则将报异常提示栈溢
出。
堆:首先应该知道操作系统有一个记录空闲内存地址的链表,当系统收到程序的申请时,
会遍历该链表,寻找第一个空间大于所申请空间的堆结点,然后将该结点从空闲结点链表
中删除,并将该结点的空间分配给程序,另外,对于大多数系统,会在这块内存空间中的
首地址处记录本次分配的大小,这样,代码中的delete语句才能正确的释放本内存空间。
另外,由于找到的堆结点的大小不一定正好等于申请的大小,系统会自动的将多余的那部
分重新放入空闲链表中。

2.3申请大小的限制
栈:在Windows下,栈是向低地址扩展的数据结构,是一块连续的内存的区域。这句话的意
思是栈顶的地址和栈的最大容量是系统预先规定好的,在WINDOWS下,栈的大小是2M(也有
的说是1M,总之是一个编译时就确定的常数),如果申请的空间超过栈的剩余空间时,将
提示overflow。因此,能从栈获得的空间较小。
堆:堆是向高地址扩展的数据结构,是不连续的内存区域。这是由于系统是用链表来存储
的空闲内存地址的,自然是不连续的,而链表的遍历方向是由低地址向高地址。堆的大小
受限于计算机系统中有效的虚拟内存。由此可见,堆获得的空间比较灵活,也比较大。

2.4申请效率的比较:
栈由系统自动分配,速度较快。但程序员是无法控制的。
堆是由new分配的内存,一般速度比较慢,而且容易产生内存碎片,不过用起来最方便.
另外,在WINDOWS下,最好的方式是用VirtualAlloc分配内存,他不是在堆,也不是在栈是
直接在进程的地址空间中保留一块内存,虽然用起来最不方便。但是速度快,也最灵活。

2.5堆和栈中的存储内容
栈: 在函数调用时,第一个进栈的是主函数中后的下一条指令(函数调用语句的下一条可
执行语句)的地址,然后是函数的各个参数,在大多数的C编译器中,参数是由右往左入栈
的,然后是函数中的局部变量。注意静态变量是不入栈的。
当本次函数调用结束后,局部变量先出栈,然后是参数,最后栈顶指针指向最开始存的地
址,也就是主函数中的下一条指令,程序由该点继续运行。
堆:一般是在堆的头部用一个字节存放堆的大小。堆中的具体内容由程序员安排。

2.6存取效率的比较

char s1[] = “aaaaaaaaaaaaaaa”;
char *s2 = “bbbbbbbbbbbbbbbbb”;
aaaaaaaaaaa是在运行时刻赋值的;
而bbbbbbbbbbb是在编译时就确定的;
但是,在以后的存取中,在栈上的数组比指针所指向的字符串(例如堆)快。
比如:
#include
void main()
{
char a = 1;
char c[] = “1234567890”;
char *p =“1234567890”;
a = c[1];
a = p[1];
return;
}
对应的汇编代码
10: a = c[1];
00401067 8A 4D F1 mov cl,byte ptr [ebp-0Fh]
0040106A 88 4D FC mov byte ptr [ebp-4],cl
11: a = p[1];
0040106D 8B 55 EC mov edx,dword ptr [ebp-14h]
00401070 8A 42 01 mov al,byte ptr [edx+1]
00401073 88 45 FC mov byte ptr [ebp-4],al
第一种在读取时直接就把字符串中的元素读到寄存器cl中,而第二种则要先把指针值读到
edx中,再根据edx读取字符,显然慢了。

2.7小结:
堆和栈的区别可以用如下的比喻来看出:
使用栈就象我们去饭馆里吃饭,只管点菜(发出申请)、付钱、和吃(使用),吃饱了就
走,不必理会切菜、洗菜等准备工作和洗碗、刷锅等扫尾工作,他的好处是快捷,但是自
由度小。
使用堆就象是自己动手做喜欢吃的菜肴,比较麻烦,但是比较符合自己的口味,而且自由
度大
zhuanz转载连接https://blog.csdn.net/daiyutage/article/details/8605580

https://blog.csdn.net/daiyutage/article/details/8605580

首页
博客
学院
下载
论坛
APP
问答
商城
活动
VIP会员
专题
招聘
ITeye
GitChat
图文课

写博客
消息


什么是代码区、常量区、静态区(全局区)、堆区、栈区?
2018年02月09日 16:57:09 夜风~ 阅读数 9861更多
分类专栏: C语言
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/u014470361/article/details/79297601
什么是代码区、常量区、静态区(全局区)、堆区、栈区?

一直对这些区搞不清楚,每次听到这些区头都大了,感觉很混乱。下面就结合STM32内核来具体讨论分析这些区到底是什么回事,每种关键字定义的变量又到底是存在什么区。
如下图,是自己总结的内存分区的示意图。一般内存主要分为:代码区、常量区、静态区(全局区)、堆区、栈区这几个区域。
这里写图片描述
代码区:存放程序的代码,即CPU执行的机器指令,并且是只读的。
常量区:存放常量(程序在运行的期间不能够被改变的量,例如: 10,字符串常量”abcde”, 数组的名字等)
静态区(全局区):静态变量和全局变量的存储区域是一起的,一旦静态区的内存被分配, 静态区的内存直到程序全部结束之后才会被释放
堆区:由程序员调用malloc()函数来主动申请的,需使用free()函数来释放内存,若申请了堆区内存,之后忘记释放内存,很容易造成内存泄漏
栈区:存放函数内的局部变量,形参和函数返回值。栈区之中的数据的作用范围过了之后,系统就会回收自动管理栈区的内存(分配内存 , 回收内存),不需要开发人员来手动管理。栈区就像是一家客栈,里面有很多房间,客人来了之后自动分配房间,房间里的客人可以变动,是一种动态的数据变动。
下面结合STM32内核和代码实际测试各关键字存储的区域和特点。
本文使用是STM32L152芯片,keil V5环境下默认的内存配置见下图:
这里写图片描述
默认分配的ROM区域是0x8000000开始,大小是0x20000的一片区域,那么这篇区域是只读区域,不可修改,也就是存放的代码区和常量区。
默认分配的RAM区域是0x20000000开始,大小是0x4000的一片区域,这篇区域是可读写区域,存放的是静态区、栈区和堆区。该芯片的内部分区如下图所示:
这里写图片描述
基于STM32内核的代码测试

下面进行详细的测试,查看各关键字所在的各分区。
代码区

代码区的内存是由系统控制的
代码区的存放 :程序中的函数编译后cpu指令
代码区的地址:函数的地址,程序的入口地址,程序的名字
函数的名称也是一个指针,可以通过查询函数名称所处的内存地址,查询函数存放的区域。

void test(void)
{
printf(“main:0x%p\n”,main);//打印main函数的存放地址
}

1
2
3
4

这里写图片描述可以看到main函数确实存放在0x08002e81这片地址区域,在代码区中。
常量区

下面来分析一句代码:
char *p = “abcdef”;
这句代码和char *p; p= “abcdef”;是等价的。
上面的两种定义方式的具体意思是:定义一个char * 型的指针p,p存放的是字符串常量”abcdef”的首地址,字符串常量”abcdef”是存放在常量区的,也就是p是指向常量区的。那么p指向的区域里面的内容是不可以得修改,只可以 *p来读取p指向的内容,当然也可以把指针p移走,指向其他区域。
测试如下:

void test(void)
{
char *p=“abcdef”;
printf(“0x%p: %s\n”, p , p);//打印指针p的地址和p指向的字符串内容
p=“qwedma”;
printf(“0x%p: %s\n”, p , p);//打印指针p的地址和p指向的字符串内容
p[0]=‘1’; //尝试把p指向的第一个字符q修改为1
printf(“0x%p: %s\n”, p , p);//打印指针p的地址和p指向的字符串内容
}

1
2
3
4
5
6
7
8
9

这里写图片描述可以看到,abcdef字符串常量存放在0x08002ecc区域,p指针指向该区域,并把p指针移走指向qwedma字符串常量的首地址0x08002ee0。当尝试修改p指向的第一个字符,即把qwedma修改为1wedma,发现打印出来的内容并未改变,常量区的内容不可以改变。

继续看这句 char str[] = “abcd”;这句话是定义了一个字符数组,但是这个str数组是存放在栈区的,然后再把字符串常量”abcd”拷贝到栈区的str数组内,那么此时的str是可以修改的。

void test(void)
{
char str[] = “abcd”;
printf(“0x%p: %s\n”, str , str);
str[0]=‘e’;
printf(“0x%p: %s\n”, str , str);
}

1
2
3
4
5
6
7

这里写图片描述 可以看到str是指向栈区的地址:0x200007c0,且指向的内容可以被修改,第一个字符a被修改为e。
静态区(全局区)

static int a;
int c;
void test(void)
{
static int b=1;
b++;
printf(“b:0x%p: %d\n”, &b , b);
}
int main()
{
printf(“a: 0x%p: %d\n”, &a , a);
printf(“c: 0x%p: %d\n”, &c , c);
for(uint8_t i=0;i<5;i++)
{
test();
}
return 0;
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18

这里写图片描述a是静态全局变量,b静态局部变量,c是全局变量,它们都存放在静态区;a和c并未初始化,打印出来都是0,说明编译器自动把他们初始化为0;b在for循环中初始化5次,但实际效果是b仅初始化一次,后面每次调用b都是上次的值,且b的地址一直是不变的,编译器只会为第一次初始化的b分配内存,后面4次初始化是无效的。
堆区

堆区是调用malloc函数来申请内存空间,这部分空间使用完后需要调用free()函数来释放。
void * mallc(size_t);函数的输入是分配的字节大小,返回是一个void*型的指针,该指针指向分配空间的首地址,void *型指针可以任意转换为其他类型的指针。

void test(void)
{
int *p1=malloc(4);//申请4字节的空间
*p1=123;// 该空间赋值123
printf(“0x%p:%d\n”,p1,*p1);
printf(“0x%p\n”,&p1);
free(p1);
printf(“0x%p:%d\n”,p1,*p1);
p1 = NULL;
printf(“0x%p\n”,p1);
}

1
2
3
4
5
6
7
8
9
10
11

这里写图片描述
int *p1=malloc(4);语句是申请了4个字节的空间,空间的首地址赋给指针p1,可以看到这个首地址是0x200003e8,存在是堆区;
printf(“0x%p\n”,&p1);指针p1本身也是需要存放的,p1本身是存放在栈区的0x200009d0;
free(p1);内存释放函数 free(开辟的内存的首地址) ,将内存标记为可用且将里面的内容清空为0,但指针p1还是指向这片空间。比较安全的做法是p1 = NULL;把p1指针释放,避免造成野指针。

void test(void)
{
int *p1=malloc(4);
int *p2=malloc(4);
printf(“p1:0x%p\n”,p1);
printf(“p2:0x%p\n”,p2);
}

1
2
3
4
5
6
7

这里写图片描述p2的地址是大于p1的地址,验证堆区是向上生长的,后申请的空间地址会依次增加。
栈区

栈区由编译器自动分配释放,存放函数的参数值、返回值和局部变量,在程序运行过程中实时分配和释放,栈区由操作系统自动管理,无须手动管理。栈区是先进后出原则,即先进去的被堵在屋里的最里面,后进去的在门口,释放的时候门口的先出去。

void test(void)
{
int a;
int b=0;
printf(“a:0x%p:%d\n”,&a,a);
printf(“b:0x%p:%d\n”,&b,b);
}

1
2
3
4
5
6
7

这里写图片描述
可以看到后定义的局部变量b地址是比a小的,即栈区是向下生长的;
a变量没有进行初始化,打印出的a是垃圾值,编译器不会把局部变量初始化为0。但是,需要注意:如果你运行于debug调试模式,运行时机制会把你的栈空间全部初始化为0,这就是解释了为什么平时在debug时看到的未初始化的局部变量初始值是0.
使用局部变量时,尽量要先进行初始化,避免垃圾值造成错乱。
大小端测试

数据在内存中存放,有大段模式和小端模式。
小端模式(little-endian):低位字节存在低地址上,高位字节存在高地址上;
大端模式( big-endian):低位字节存在高地址上,高位字节存在低地址上,刚好与小端模式相反。
另:网络字节序:TCP/IP各层协议将字节序定义为Big-Endian,因此TCP/IP协议中使用的字节序通常称之为网络字节序

static uint32_t m=0x87654321;
char p=(char)&m;
void test(void)
{
printf(“P :0x%p: %x\n”,p,p);
printf(“P+1:0x%p: %x\n”,p+1,
(p+1));
printf(“P+2:0x%p: %x\n”,p+2,(p+2));
printf(“P+3:0x%p: %x\n”,p+3,
(p+3));
}

1
2
3
4
5
6
7
8
9

这里写图片描述低字节21放在低地址,高字节87放在高地址,与小端模式相符。
keil中代码和数据量所占字节的查询

keil软件勾选上生成批处理文件,在keil编译完成后,可以查看到代码和定义的数据所占的字节大小。

这里写图片描述这里写图片描述
如上图,Code是程序代码所占的字节,即代码区;
RO-data 代表只读数据,程序中所定义的常量数据和字符串等都位于此处,即常量区;
RW-data 代表已初始化的读写数据,程序中定义并且初始化的全局变量和静态变量位于此处,一部分静态区(全局区);
ZI-data 代表未初始化的读写数据,程序中定义了但没有初始化的全局变量和静态变量位于此处,另一部分的静态区(全局区)。ZI英语是zero initial,就是程序中用到的变量并且被系统初始化为0的变量的字节数,keil编译器默认是把你没有初始化的变量都赋值一个0,这些变量在程序运行时是保存在RAM中的。
Total ROM Size (Code + RO Data + RW Data)这样所写的程序占用的ROM的字节总数,也就是说程序所下载到ROM flash 中的大小。

为什么Rom中还要存RW,因为掉电后RAM中所有数据都丢失了,每次上电RAM中的数据是被重新赋值的,每次这些固定的值就是存储在Rom中的,为什么不包含ZI段呢,是因为ZI数据都是0,没必要包含,只要程序运行之前将ZI数据所在的区域一律清零即可,包含进去反而浪费存储空间。

实际上,ROM中的指令至少应该有这样的功能:

  1. 将RW从ROM中搬到RAM中,因为RW是变量,变量不能存在ROM中。
  2. 将ZI所在的RAM区域全部清零,因为ZI区域并不在Image中,所以需要程序根据编译器给出的ZI地址及大小来将相应得RAM区域清零。ZI中也是变量,同理:变量不能存在ROM中。
    在程序运行的最初阶段,RO中的指令完成了这两项工作后C程序才能正常访问变量。否则只能运行不含变量的代码

mmap映射区和shm共享内存的区别总结—https://blog.csdn.net/hj605635529/article/details/73163513
一张图深度解析Linux共享内存的内核实现—-杨帆_8318—–https://blog.csdn.net/asilor_8318/article/details/39484747

嵌入式stm32f429上成功跑通主流Linux—–farsight1—–https://blog.csdn.net/farsight1/article/details/79377337
还有嵌入式linux和stm32进行—–ppaiml
https://blog.csdn.net/yuantuo3887/article/details/82228929
=嵌入式开发环境搭建==
=交叉编译工具链=
cygwin===

    原文作者:深入浅出,厚积薄发
    原文地址: https://blog.csdn.net/oooooooooooooookjk/article/details/100528893
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞