IEEE浮点数表示--规格化/非规格化/无穷大/NaN

转自:http://blog.csdn.net/hqin6/article/details/6701109

1.规格化的值

以sizeof(float)=4为例:

1.5的浮点数表示:

1)1.5转换为2进制:1.1

2)转换:0.1*2^(整数部分的1省略)

3)得到阶码:127+0=127,即0111 1111 (指数部分可能是负数,为了兼容负数,需要+127)

4)得到尾数:1,后面补齐0

5)确定符号位:0

所以,1.5的浮点数表示如下:

符号位:1bit阶码:8bits尾数:23bits
00111 11111000 0000 0000 0000 0000 000

程序验证如下:

[cpp] 
view plain
copy

  1. #include <stdio.h>  
  2. #include <stdlib.h>  
  3.   
  4. int main()  
  5. {  
  6.     float f = 1.5;  
  7.     printf(“%x”, *(int*)&f);//打印3fc00000  
  8.     return 0;  
  9. }  

3fc00000即:

0  01111111  1000  0000 0000 0000 0000 000

一致!

2.非规格化的值

即,所有的阶码都是0

符号位:1bits阶码:8bits尾数:23bits
x0000 0000xxxx xxxx xxxx xxxx xxxx xxx

用途有2: 1)提供了一种表示值0的方法 2)表示那些非常接近于0.0的数,对“逐渐溢出”属性的支持

代码示例:
[cpp] 
view plain
copy

  1. ////小端模式机器实验  
  2. #include <stdio.h>  
  3. #include <stdlib.h>  
  4. typedef struct _float  
  5. {  
  6.     int w:23;  
  7.     int j:8;  
  8.     int s:1;  
  9. }Float;  
  10. int main()  
  11. {  
  12.     float f = 0;  
  13.     Float obj;  
  14.     obj.s = 0;  
  15.     obj.j = 0;  
  16.     obj.w = 0x400000;  
  17.     f = *(float*)(&obj);  
  18.     printf(“%f”, f);//输出0.000000  
  19.     return 0;  
  20. }  

3.无穷大

符号位:1bits阶码:8bits尾数:23bits
x1111 11110000 0000 0000 0000 0000 000

代码示例:
[cpp] 
view plain
copy

  1. #include <stdio.h>  
  2. #include <stdlib.h>  
  3. typedef struct _float  
  4. {  
  5.     int w:23;  
  6.     int j:8;  
  7.     int s:1;  
  8. }Float;  
  9. int main()  
  10. {  
  11.     float f = 0;  
  12.     Float obj;  
  13.     obj.s = 0;  
  14.     obj.j = 0xff;  
  15.     obj.w = 0x0;  
  16.     f = *(float*)(&obj);  
  17.     printf(“%f”, f);//输出inf  
  18.     return 0;  
  19. }  

4.NaN

符号位:1bit阶码:8bits尾数:23bits
x1111 1111非全0

代码示例:
[cpp] 
view plain
copy

  1. #include <stdio.h>  
  2. #include <stdlib.h>  
  3. typedef struct _float  
  4. {  
  5.     int w:23;  
  6.     int j:8;  
  7.     int s:1;  
  8. }Float;  
  9. int main()  
  10. {  
  11.     float f = 0;  
  12.     Float obj;  
  13.     obj.s = 0;  
  14.     obj.j = 0xff;  
  15.     obj.w = 0x1;  
  16.     f = *(float*)(&obj);  
  17.     printf(“%f”, f);//输出nan  
  18.     return 0;  
  19. }  
点赞